خلاصه
گوگل دپمایند نسخهی تازهی Gemini Robotics را معرفی کرد که به رباتها اجازه میدهد کارهای پیچیدهتر را با درک محیط و جستوجوی آنلاین انجام دهند و مهارتهای خود را با رباتهای دیگر به اشتراک بگذارند.
مقدمه
تا حالا رباتها فقط یک دستور ساده را انجام میدادند؛ حالا گوگل دپمایند سیستمی ساخته که قبل از هر حرکت چند گام بعدی را پیشبینی میکند و برای حل مسئله از اینترنت هم کمک میگیرد.
چه چیزی تغییر کرده؟
۱. فکر کردن چندمرحلهای
مدل Gemini Robotics-ER 1.5 محیط را درک میکند، بعد Gemini Robotics 1.5 مرحلهبهمرحله اجرا میکند؛ مثلن جداسازی لباسهای رنگی یا چمدانبستن با توجه به آبوهوای لندن.
۲. جستوجوی آنلاین
ربات میتواند دربارهی قوانین بازیافت هر شهر در گوگل سرچ کند و همانجا زبالهها را دستهبندی کند؛ دیگر نیازی به برنامهنویسی جداگانه برای هر منطقه نیست.
۳. انتقال مهارت بین رباتها
مهارتی که ربات دوآرِم ALOHA2 یاد میگیرد، بدون تغییر کد روی ربات انساننمای Apollo یا فرانکا هم کار میکند؛ توسعهدهندهها دیگر برای هر مدل ربات باید از صفر شروع نمیکنند.
ویژگیهای کلیدی جدید
- درک طبیعی زبان + دید کامپیوتری همزمان
- استفاده از Google Search برای اطلاعات لحظهای
- یادگیری متقابل بین رباتهای متفاوت
- کاهش زمان برنامهنویسی برای هر کار جدید
دسترسی توسعهدهندگان
Gemini Robotics-ER 1.5 همین حالا از طریق Gemini API در Google AI Studio در دسترس است؛ ولی نسخهی کامل Gemini Robotics 1.5 فعلاً فقط برای شرکای خاص فعال میشود.
