NVIDIA از ابزارها و شبیه سازی‌های جدید هوش مصنوعی برای توسعه رباتیک رونمایی کرد

NVIDIA ابزارها و گردش کارهای جدیدی در زمینه هوش مصنوعی و شبیه‌سازی را معرفی کرده است تا به توسعه‌دهندگان رباتیک کمک کند تا کار خود را در زمینه ربات‌های هوش مصنوعی به شدت تسریع کنند. به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، این مجموعه که این هفته در کنفرانس یادگیری رباتیک (CoRL) در مونیخ […]


NVIDIA ابزارها و گردش کارهای جدیدی در زمینه هوش مصنوعی و شبیه‌سازی را معرفی کرده است تا به توسعه‌دهندگان رباتیک کمک کند تا کار خود را در زمینه ربات‌های هوش مصنوعی به شدت تسریع کنند.

به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، این مجموعه که این هفته در کنفرانس یادگیری رباتیک (CoRL) در مونیخ آلمان رونمایی شد، شامل دسترسی عمومی به چارچوب یادگیری رباتیک NVIDIA Isaac Lab و شش گردش کار جدید یادگیری ربات انسان‌نما برای پروژه GR00T است که ابتکاری برای تسریع توسعه ربات‌های انسان‌نما است.

این شرکت همچنین ابزارهای جدید توسعه مدل‌های جهانی برای پردازش و مدیریت داده‌های ویدیویی را رونمایی کرد، از جمله توکن‌ساز NVIDIA Cosmos و NVIDIA NeMo Curator برای پردازش ویدیو. جیم فان، مدیر ارشد تحقیقات هوش مصنوعی در NVIDIA، گفت: «ربات‌های انسان‌نما موج بعدی هوش مصنوعی تجسم‌یافته هستند. تیم‌های تحقیق و مهندسی NVIDIA در سراسر شرکت و اکوسیستم توسعه‌دهندگان ما با هم همکاری می‌کنند تا پروژه GR00T را بسازند و به پیشرفت و توسعه توسعه‌دهندگان جهانی ربات‌های انسان‌نما کمک کنند.»

این شرکت ادعا کرد که شش گردش کار جدید پروژه GR00T، به توسعه‌دهندگان انسان‌نما طرح‌هایی برای تحقق چالش‌برانگیزترین قابلیت‌های ربات‌های انسان‌نما ارائه می‌دهند. اینها شامل GR00T-Gen، GR00T-Mimic، GR00T-Dexterity، GR00T-Control، GR00T-Mobility و GR00T-Perception هستند. اریک جانگ، معاون هوش مصنوعی در 1X Technologies، اظهار داشت که توکن‌ساز NVIDIA Cosmos به فشرده‌سازی زمانی و مکانی بسیار بالایی از «داده‌های ما در حالی که هنوز وضوح بصری را حفظ می‌کند» دست می‌یابد. جانگ افزود: «این به ما امکان می‌دهد تا مدل‌های جهانی را با تولید ویدیوی افق بلند با روشی حتی کارآمدتر از نظر محاسباتی آموزش دهیم.

به گفته NVIDIA توکن‌ساز Cosmos با ارائه فشرده‌سازی با کیفیت بالا و بازسازی بصری تا ۱۲ برابر سریع‌تر، راه را برای توسعه مقیاس‌پذیر، قوی و کارآمد برنامه‌های کاربردی مولد در طیف گسترده‌ای از حوزه‌های بصری هموار می‌کند. این شرکت ادعا کرد که توکن‌ساز منبع باز Cosmos با تجزیه تصاویر و ویدیوها به توکن‌های با کیفیت بالا با نرخ‌های فشرده‌سازی بسیار بالا، توکن‌سازی بصری برتر را برای توسعه‌دهندگان رباتیک فراهم می‌کند. این توکن‌ساز تا ۱۲ برابر سریع‌تر از توکن‌سازهای فعلی اجرا می‌شود، در حالی که NeMo Curator پردازش و مدیریت داده‌های ویدیویی را تا ۷ برابر سریع‌تر از خطوط لوله غیر بهینه انجام می‌دهد.

سایر توسعه‌دهندگان ربات‌های انسان‌نما و عمومی مانند XPENG Robotics و Hillbot، با توکن‌ساز NVIDIA Cosmos برای مدیریت تصاویر و ویدیوهای با وضوح بالا در حال توسعه هستند.  به گفته انویدیا NeMo Curator اکنون شامل یک خط  پردازش ویدیو است. این به توسعه‌دهندگان ربات اجازه می‌دهد تا با پردازش داده‌های متنی، تصویری و ویدیویی در مقیاس بزرگ، دقت مدل‌های جهانی خود را بهبود بخشند. این شرکت ادعا کرد که مدیریت داده‌های ویدیویی به دلیل حجم عظیم آن، نیازمند خطوط  مقیاس‌پذیر و هماهنگی کارآمد برای توزیع بار در میان GPUها، چالش‌هایی ایجاد می‌کند. علاوه بر این، مدل‌های فیلتر کردن، زیرنویس‌گذاری و تعبیه نیاز به بهینه‌سازی دارند تا حداکثر توان عملیاتی را داشته باشند.



Source link