
سم آلتمن، مدیرعامل شرکت OpenAI، در رویداد اخیر “روز توسعهدهندگان” (Dev Day) خبر از آمار شگفتانگیزی داد: ChatGPT به ۸۰۰ میلیون کاربر فعال هفتگی رسیده است. این رقم نشاندهندهی رشد سریع و بیسابقه در پذیرش این فناوری در میان مصرفکنندگان و کسبوکارها است.
همچنین، بیش از ۴ میلیون توسعهدهنده از API و مدلهای GPT در پروژههای خود استفاده میکنند که نشان میدهد هوش مصنوعی از یک “اسباببازی” به یک “ابزار روزمره” تبدیل شده است. این استقبال گسترده، فشار بر OpenAI برای تأمین زیرساختهای محاسباتی عظیم را بیش از پیش کرده است.
معرفی GPT-5 و قابلیتهای چندوجهی
برجستهترین خبر در این رویداد، رونمایی رسمی از مدل زبان بزرگ جدید، GPT-5، بود. این مدل جهشی بزرگ در دقت، استدلال و توانایی کدنویسی محسوب میشود. مهمترین قابلیتهای GPT-5 عبارتند از:
- چندشخصیتی و قابل تنظیم: کاربران برای اولین بار میتوانند بین چهار حالت شخصیتی برای ChatGPT انتخاب کنند: بدبین (Cynic)، رباتیک (Robot)، شنونده (Listener) و نِرد (Nerd)؛ که این امر تجربه کاربری را شخصیتر میکند.
- ورودیهای چندوجهی پیشرفته: GPT-5 قادر است بهطور همزمان، متن، تصاویر و صدا را پردازش کرده و پاسخهای جامع و یکپارچه ارائه دهد.
- قدرت کدنویسی و تحلیل داده: این مدل در بنچمارکهای کدنویسی رکوردشکن بوده و بهتر از همیشه میتواند کدهای تمیز و دقیق تولید کند. همچنین، قابلیتهای جدیدی برای تجزیهوتحلیل دادهها و رسم نمودار در یک محیط اختصاصی (Canvas) ارائه شده است.
سورا ۲ (Sora 2) و ابزارهای جدید توسعهدهندگان
OpenAI علاوه بر بهروزرسانی مدل اصلی، از ابزارهای چندرسانهای قدرتمندی برای توسعهدهندگان رونمایی کرد. Sora 2، مدل پیشرفتهی تولید ویدیو، این امکان را فراهم میآورد تا ویدیوهای کوتاه و بلند با کنترل دقیق بر حرکات، نورپردازی و حتی قابلیت افزودن صدای کاربر (cameo) ساخته شود.
همچنین، معرفی مدل صوتی GPT-Realtime-Mini برای تولید پاسخهای صوتی بلادرنگ، راه را برای ساخت باتهای صوتی پیشرفته و سیستمهای ترجمه همزمان هموار میسازد و اکوسیستم توسعهدهندگان OpenAI را بیش از پیش گسترش میدهد. این ابزارهای جدید، نشاندهندهی حرکت OpenAI به سمت ساخت هوش مصنوعیهای چندحسی (Multimodal AI) برای کاربردهای تجاری و مصرفی هستند.



