هوش مصنوعی

گوگل نخستین ربات متفکر را با مغز جمینای رونمایی کرد

گوگل دیپ‌مایند (Google DeepMind) با معرفی مدل‌های پیشرفته هوش مصنوعی رباتیک «جمینای روباتیکس ۱.۵» (Gemini Robotics 1.5)، فصل جدیدی را در علم رباتیک آغاز کرده که در آن، ربات‌ها قبل از اقدام به عمل، قادر به «تفکر»، استدلال و برنامه‌ریزی هستند.

گوگل دیپ‌مایند دو مدل هوش مصنوعی جدید را معرفی کرد: Gemini Robotics 1.5 و Gemini Robotics-ER 1.5. این مدل‌ها با همکاری یکدیگر، سیستمی را ایجاد می‌کنند که برای اولین بار، ربات را قادر می‌سازد تا پیش از انجام وظیفه، استدلال کند و برنامه بریزد. این مدل‌ها فراتر از توانایی اجرای یک دستور ساده عمل می‌کنند؛ بلکه می‌توانند اهداف مبهم و چندمرحله‌ای را درک کرده و برای اجرای موفقیت‌آمیز آن‌ها، از ابزارهای خارجی مانند جستجوی گوگل برای کسب اطلاعات تکمیلی کمک بگیرند.

عملکرد تفکیک شده: مغز و بدن رباتیک

این سیستم جدید از دو جزء اصلی تشکیل شده است:

  • مدل متفکر (Gemini Robotics-ER 1.5): این مدل بینایی-زبانی، وظیفه استدلال تجسم یافته، تجزیه و تحلیل محیط فیزیکی و تولید دستورالعمل‌های دقیق و مرحله به مرحله را برعهده دارد. این مدل مغز متفکر سیستم است که حتی می‌تواند از جستجوی وب برای درک بهتر محیط یا وظیفه استفاده کند (مثلاً برای تفکیک زباله، قوانین محلی را جستجو کند).
  • مدل عمل‌گرا (Gemini Robotics 1.5): این مدل بینایی-زبان-عمل، دستورالعمل‌های تولید شده توسط مدل ER را دریافت کرده و آن‌ها را به حرکات فیزیکی واقعی تبدیل می‌کند. این مدل همچنین در حین اجرا، قابلیت تفکر در حین عمل (Thinking in action) را دارد تا بر اجرای مراحل نظارت کرده و در صورت بروز خطا، آن را تصحیح کند.

گوگل نخستین ربات متفکر را با مغز جمینای رونمایی کرد

انتقال دانش و آینده ربات‌های انسان‌نما

یکی از پیشرفت‌های چشمگیر در این فناوری، قابلیت تعمیم و انتقال یادگیری (Generalization and Knowledge Transfer) است. به این معنی که مهارت‌هایی که ربات در یک محیط یاد می‌گیرد، به سادگی و بدون نیاز به برنامه‌ریزی مجدد، به پلتفرم‌های رباتیک دیگر (مانند ربات‌های دو دست یا حتی ربات‌های انسان‌نما) منتقل می‌شود.

این توانایی، ربات‌ها را از دستگاه‌های تخصصی برای یک وظیفه، به عوامل همه کاره‌ای تبدیل می‌کند که می‌توانند در محیط‌های پیچیده و غیرقابل پیش‌بینی انسانی (مانند مرتب کردن لباس‌ها بر اساس رنگ یا آماده کردن چمدان سفر براساس وضعیت آب‌وهوا) عمل کنند.

دسترسی برای توسعه‌دهندگان

در حال حاضر، مدل متفکر (Gemini Robotics-ER 1.5) از طریق Google AI Studio در دسترس توسعه‌دهندگان قرار گرفته است تا بتوانند برای آزمایش‌های خود دستورالعمل‌های رباتیک تولید کنند. با این حال، دسترسی به مدل عمل‌گرا (Gemini Robotics 1.5) فعلاً تنها برای شرکای منتخب گوگل امکان‌پذیر است.

نوشته های مشابه

دکمه بازگشت به بالا