
جدیدترین اخبار منتشر شده در خصوص هوش مصنوعی «جمینای» (Gemini) گوگل در روزهای اخیر، بر گسترش روزافزون دامنه نفوذ آن در ابزارهای پرکاربرد و بهرهوری گوگل متمرکز است. مهمترین قابلیت تازهای که مورد توجه قرار گرفته، توانایی جمینای برای تبدیل فوری اسناد متنی به فایلهای ارائه (Presentation) است. این قابلیت که در حال حاضر در ابزارهایی مانند “Canvas” یا مستقیماً در محیطهایی شبیه به Google Docs و Slides ارائه شده است، به کاربران اجازه میدهد که تنها با یک دستور متنی ساده یا با استفاده از فایلهای موجود خود، یک ارائه بصری کامل و حرفهای بسازند.
این ادغام عمیق، کارمندان، دانشجویان و محققان را قادر میسازد که فرآیند خستهکننده طراحی اسلاید را کنار گذاشته و صرفاً بر روی محتوا تمرکز کنند. به این ترتیب، جمینای با خودکارسازی یک فرآیند زمانبر، کارایی کاربران را به طرز چشمگیری افزایش داده است.
ورود جمینای به دنیای «گوگل میت» و «گوگل درایو»
جمینای پا را از محیطهای متنی فراتر گذاشته و وارد فضاهای همکاری و جلسات آنلاین نیز شده است. طبق گزارشها، قابلیت «Ask Gemini» (از جمینای بپرسید) به گوگل میت (Google Meet) اضافه شده است. این دستیار هوشمند میتواند در طول جلسه، خلاصهای از بحثهای جاری را ارائه دهد، به سؤالات مرتبط با محتوای جلسه پاسخ دهد و حتی اگر کاربر با تأخیر به جلسه ملحق شده باشد، او را به سرعت در جریان امور قرار دهد. این ویژگی نه تنها باعث صرفهجویی در زمان میشود، بلکه تضمین میکند که هیچکس نکته مهمی را از دست ندهد.
علاوه بر این، اخبار از توانایی جمینای برای تعامل با ویدئوهای ذخیرهشده در گوگل درایو (Google Drive) نیز حکایت دارند. این قابلیت به کاربر اجازه میدهد تا ویدئوهای خود را آپلود کرده و از جمینای بخواهد تا محتوای آنها را تحلیل، خلاصهسازی و یا حتی برای تولید محتوای جدید استفاده کند. این یک قدم بزرگ در تبدیل جمینای به یک تحلیلگر ویدیویی شخصی است.
رقابت با سورا: تغییرات بصری در اپلیکیشن موبایل جمینای
با توجه به موفقیت سریع اپلیکیشنهای تصویری رقیب نظیر “سورا” از OpenAI، گوگل نیز در حال برنامهریزی برای یک بهروزرسانی بصری بزرگ در اپلیکیشن موبایل جمینای است. شواهد موجود در نسخههای آزمایشی نشان میدهد که گوگل قصد دارد رابط کاربری (UI) جمینای را از یک محیط ساده چتبات، به یک فید قابل پیمایش با پیشنهادات بصری جذاب و عکسهای خیرهکننده تغییر دهد.
این تغییر صرفاً زیبایی نیست؛ بلکه با هدف الهام بخشیدن بیشتر به کاربران برای استفاده از قابلیتهای پیشرفته هوش مصنوعی صورت میگیرد. به این ترتیب، دکمههای میانبر برای کارهایی مانند ساخت تصویر با مدل “نانوبنانا” (Nano Banana) یا دسترسی به ویژگی “پژوهش عمیق” به صورت برجستهتر نمایش داده خواهند شد تا کاربران راحتتر بتوانند از پتانسیلهای خلاقانه جمینای بهره ببرند.
پیشرفت مدلهای پایه: قابلیت «استفاده کامپیوتری» و مدلهای **$2.5$
گوگل همچنین به توسعه زیرساختی مدلهای پایه خود ادامه داده است. مدلهای نسل جدید $Gemini \ 2.5$ که در دو نسخه $Pro$ و $Flash$ عرضه شدهاند، همچنان در حال بهبود هستند. در یک تحول چشمگیر، گوگل مدل $Gemini \ 2.5 \ Computer \ Use$ را برای توسعهدهندگان معرفی کرده است؛ این مدل هوش مصنوعی میتواند بدون دخالت مستقیم انسان به وبگردی بپردازد و وظایفی مانند جستجوی اطلاعات، مرور وبسایتها و تعامل با نرمافزارهای مختلف را انجام دهد. این قابلیت نشاندهنده حرکت گوگل به سمت توسعه “ایجنتهای هوش مصنوعی” است که میتوانند بهصورت کاملاً مستقل عمل کنند.
مدلهای $Gemini \ 2.5$ در حال حاضر در محیطهایی مانند $Google \ AI \ Studio$ و $Vertex \ AI$ در دسترس توسعهدهندگان قرار دارند و تمرکز آنها بر روی کارایی بالاتر و هزینه کمتر است.
چالش صحت اخبار و هوش مصنوعی
در کنار تمام این پیشرفتهای فنی، یک نگرانی مهم در روزهای اخیر بار دیگر مطرح شده است: صحت اطلاعات خبری ارائهشده توسط چتباتها. گزارشی جدید که با همکاری اتحادیه پخش اروپا و بیبیسی منتشر شده، هشدار میدهد که اتکا به ابزارهایی مانند جمینای و ChatGPT برای دریافت اخبار روزمره میتواند منجر به گمراهی شود.
تحقیقات نشان داده که این دستیارهای هوش مصنوعی هنوز در ارائه اطلاعات خبری دقیق و بدون سوگیری، با چالشهای جدی مواجه هستند و گاهی اوقات اطلاعات نادرست یا بهروزنشده را به کاربران ارائه میدهند. این گزارش، با تمام قابلیتهای شگفتانگیز جمینای، یک یادآوری حیاتی است که کاربران نباید هوش مصنوعی را به عنوان تنها مرجع خبری خود در نظر بگیرند و باید همچنان برای تأیید اطلاعات، به منابع معتبر و سنتی رسانهای مراجعه کنند.



