
در ادامه رقابت نفسگیر در عرصه هوش مصنوعی مولد، سال ۲۰۲۵ با معرفی نسل جدیدی از مدلهای زبانی بزرگ (LLMs) و مدلهای چندوجهی (Multimodal) همراه بوده است. تمرکز اصلی این مدلها بر “تفکر تطبیقی” (Adaptive Thinking) و توانایی درک عمیقتر ارتباط بین دادههای متنی، تصویری، صوتی و حتی ویدئویی است.
گوگل دیپمایند با مدل Gemini 2.5 Pro، جهشی قابل توجه در قابلیتهای استدلال و کدنویسی نشان داده است. این مدل، که اکنون با قابلیتهای “استفاده از کامپیوتر” (Computer Use) در دسترس توسعهدهندگان قرار گرفته، میتواند درست مانند یک انسان با رابطهای کاربری (UI) برنامههای موبایل و وب تعامل کند؛ کارهایی مانند پر کردن فرمها، کلیک کردن روی دکمهها و پیمایش صفحات، بدون نیاز به واسطهای برنامهنویسی سنتی. این پیشرفت، تولد عاملهای هوشمند خودمختار را تسریع میبخشد که میتوانند وظایف پیچیده و زنجیرهای را بدون دخالت مداوم کاربر به انجام رسانند.
همچنین، مدلهایی مانند GPT-4o از OpenAI و Claude 3.7 از Anthropic نیز با افزایش سرعت پردازش، بهبود استدلال و کاهش خطای “توهم” (Hallucination) به قدرتمندی در این عرصه ادامه داده و بر قابلیتهای چندوجهی خود افزودهاند.
ظهور عاملهای خودمختار: اتوماسیون فرآیندهای کسبوکار
مهمترین ترند هوش مصنوعی در سال ۲۰۲۵، گذار از یک ابزار ساده تولید محتوا به یک “عامل خودمختار” است. شرکتها به طور فزایندهای در حال استفاده از این عاملهای هوشمند برای اتوماسیون نهایی کل فرآیندهای کسبوکار هستند:
- تصمیمگیری آنی (Real-time): الگوریتمها در لجستیک و مدیریت زنجیره تأمین، تصمیماتی مانند بهینهسازی مسیرها یا مدیریت موجودی را به صورت آنی و با حداقل مداخله انسانی اتخاذ میکنند.
- خلق محتوای پیچیده: هوش مصنوعی دیگر فقط متن یا تصویر تولید نمیکند؛ اکنون میتوان به آن دستور داد تا یک سناریوی کامل را بنویسد، ویدیو و تصاویر لازم را تولید کرده و حتی برای آن موسیقی متن بسازد.
نبرد مدلهای کوچک (SLM) در مقابل مدلهای بزرگ (LLM)
همزمان با رشد مدلهای عظیم، مدلهای زبانی کوچک (SLM) نیز توجه بسیاری را به خود جلب کردهاند. مدلهایی مانند Gemma 3 (گوگل) و Mixtral (Mistral AI) ثابت کردهاند که میتوانند با منابع محاسباتی و هزینهای کمتر، عملکردی مشابه یا حتی بهتر از LLMهای بزرگ در وظایف تخصصی داشته باشند. این مدلهای کوچکتر، زمینه را برای توسعه سیستمهای هوش مصنوعی خصوصی و با تأخیر کم در داخل سازمانها و حتی بر روی دستگاههای شخصی (Edge AI) فراهم میکنند.



