
گوگل دیپمایند (Google DeepMind) با معرفی مدلهای پیشرفته هوش مصنوعی رباتیک «جمینای روباتیکس ۱.۵» (Gemini Robotics 1.5)، فصل جدیدی را در علم رباتیک آغاز کرده که در آن، رباتها قبل از اقدام به عمل، قادر به «تفکر»، استدلال و برنامهریزی هستند.
گوگل دیپمایند دو مدل هوش مصنوعی جدید را معرفی کرد: Gemini Robotics 1.5 و Gemini Robotics-ER 1.5. این مدلها با همکاری یکدیگر، سیستمی را ایجاد میکنند که برای اولین بار، ربات را قادر میسازد تا پیش از انجام وظیفه، استدلال کند و برنامه بریزد. این مدلها فراتر از توانایی اجرای یک دستور ساده عمل میکنند؛ بلکه میتوانند اهداف مبهم و چندمرحلهای را درک کرده و برای اجرای موفقیتآمیز آنها، از ابزارهای خارجی مانند جستجوی گوگل برای کسب اطلاعات تکمیلی کمک بگیرند.
عملکرد تفکیک شده: مغز و بدن رباتیک
این سیستم جدید از دو جزء اصلی تشکیل شده است:
- مدل متفکر (Gemini Robotics-ER 1.5): این مدل بینایی-زبانی، وظیفه استدلال تجسم یافته، تجزیه و تحلیل محیط فیزیکی و تولید دستورالعملهای دقیق و مرحله به مرحله را برعهده دارد. این مدل مغز متفکر سیستم است که حتی میتواند از جستجوی وب برای درک بهتر محیط یا وظیفه استفاده کند (مثلاً برای تفکیک زباله، قوانین محلی را جستجو کند).
- مدل عملگرا (Gemini Robotics 1.5): این مدل بینایی-زبان-عمل، دستورالعملهای تولید شده توسط مدل ER را دریافت کرده و آنها را به حرکات فیزیکی واقعی تبدیل میکند. این مدل همچنین در حین اجرا، قابلیت تفکر در حین عمل (Thinking in action) را دارد تا بر اجرای مراحل نظارت کرده و در صورت بروز خطا، آن را تصحیح کند.
انتقال دانش و آینده رباتهای انساننما
یکی از پیشرفتهای چشمگیر در این فناوری، قابلیت تعمیم و انتقال یادگیری (Generalization and Knowledge Transfer) است. به این معنی که مهارتهایی که ربات در یک محیط یاد میگیرد، به سادگی و بدون نیاز به برنامهریزی مجدد، به پلتفرمهای رباتیک دیگر (مانند رباتهای دو دست یا حتی رباتهای انساننما) منتقل میشود.
این توانایی، رباتها را از دستگاههای تخصصی برای یک وظیفه، به عوامل همه کارهای تبدیل میکند که میتوانند در محیطهای پیچیده و غیرقابل پیشبینی انسانی (مانند مرتب کردن لباسها بر اساس رنگ یا آماده کردن چمدان سفر براساس وضعیت آبوهوا) عمل کنند.
دسترسی برای توسعهدهندگان
در حال حاضر، مدل متفکر (Gemini Robotics-ER 1.5) از طریق Google AI Studio در دسترس توسعهدهندگان قرار گرفته است تا بتوانند برای آزمایشهای خود دستورالعملهای رباتیک تولید کنند. با این حال، دسترسی به مدل عملگرا (Gemini Robotics 1.5) فعلاً تنها برای شرکای منتخب گوگل امکانپذیر است.



