هوش مصنوعی

انتشار مدل آزمایشی DeepSeek-V3.2 و تمرکز بر بهره‌وری

شرکت هوش مصنوعی DeepSeek، که در چین مستقر است، به تازگی یک مدل زبان بزرگ آزمایشی جدید با نام DeepSeek-V3.2-Exp را در تاریخ ۲۹ سپتامبر ۲۰۲۵ (اوایل مهرماه) منتشر کرده است. این انتشار نشان‌دهنده گام مهم این شرکت در جهت کاهش هزینه‌ها و افزایش کارایی مدل‌های هوش مصنوعی است.

  • نوآوری در معماری: هسته اصلی V3.2-Exp، مکانیسم جدیدی به نام «توجه پراکنده DeepSeek» (DeepSeek Sparse Attention – DSA) است. این فناوری به مدل اجازه می‌دهد تا وزن‌های توجه را به صورت انتخابی محاسبه کند. نتیجه این نوآوری، کاهش قابل توجه پیچیدگی محاسباتی در پردازش متن‌های طولانی و حفظ سطح عملکرد کلی مدل است.
  • بهبود در عملکردهای تخصصی: با وجود تمرکز بر بهره‌وری، مدل در وظایف خاصی مانند استدلال ریاضیاتی، کدنویسی، و عملیات مرورگر پیشرفت‌هایی را نشان داده است.

انقلاب قیمتی: کاهش ۵۰ تا ۷۵ درصدی هزینه‌های API

یکی از مهم‌ترین پیامدهای انتشار V3.2-Exp، تحول در ساختار قیمت‌گذاری سرویس API این مدل است که آن را به یک رقیب بسیار جدی برای مدل‌های غربی مانند سری GPT تبدیل می‌کند.

  • کاهش چشمگیر هزینه: DeepSeek قیمت توکن‌های خروجی API را تا ۷۵ درصد و توکن‌های ورودی را تا ۵۰ درصد نسبت به مدل V3.1 کاهش داده است. برای مثال، هزینه توکن‌های ورودی به $۰.۲۸ در میلیون توکن کاهش یافته است.
  • رقابت بر سر دسترسی‌پذیری: این کاهش قیمت نشان‌دهنده استراتژی DeepSeek برای رقابت از طریق هزینه کمتر و عملکرد بالا است و هدف آن دموکراتیزه کردن فناوری پیشگام هوش مصنوعی برای توسعه‌دهندگان در سراسر جهان است.

انتشار مدل آزمایشی DeepSeek-V3.2 و تمرکز بر بهره‌وری

ارزیابی عملکرد و نگرانی‌های امنیتی

انتشار مدل‌های DeepSeek همچنان بحث‌هایی را در مورد شکاف هوش مصنوعی جهانی و ملاحظات امنیتی ایجاد می‌کند.

  • افزایش سرسام‌آور پذیرش: پس از انتشار مدل‌های قبلی DeepSeek، دانلود مدل‌های چینی در پلتفرم‌های اشتراک‌گذاری مدل از ژانویه ۲۰۲۵ نزدیک به ۱۰۰۰ درصد افزایش یافته است، که نشان‌دهنده پذیرش گسترده آن‌ها در اکوسیستم هوش مصنوعی است.
  • ملاحظات امنیتی و سیاسی: با این حال، ارزیابی‌های انجام شده توسط موسسات غربی، ضمن تحسین نوآوری‌های DeepSeek در زمینه بهره‌وری و کاهش هزینه، نقص‌هایی را در معیارهای امنیتی و ریسک مدل‌های چینی و خطرات احتمالی آن‌ها برای امنیت داده‌ها برجسته کرده‌اند.
برنامه‌های آینده و حرکت به سمت هوش مصنوعی “ایجنتیک”

DeepSeek به طور فعال برای نسل بعدی معماری هوش مصنوعی خود برنامه‌ریزی می‌کند، با تأکید ویژه بر هوش مصنوعی ایجنتیک” (Agentic AI).

  • نقشه راه توسعه: DeepSeek قصد دارد تا اواسط اکتبر ۲۰۲۵، مدل V3.1-Terminus را در کنار V3.2-Exp نگه دارد تا بازخورد جامعه را جمع‌آوری کند. پس از آن، تصمیم برای انتشار نسخه رسمی V3.2 گرفته خواهد شد.
  • تمرکز بر ایجنت‌ها: این شرکت همچنین در حال کار بر روی نسخه ایجنت R2 و بهینه‌سازی سیستم «ترکیبی از متخصصان» (Mixture of Experts – MoE) است تا مدل‌های خود را به سمت تبدیل شدن به «ایجنت‌های هوش مصنوعی» تواناتر هدایت کند. هوش مصنوعی ایجنتیک، نسل بعدی هوش مصنوعی است که می‌تواند مجموعه‌ای از اقدامات را برای رسیدن به یک هدف انجام دهد.

نوشته های مشابه

دکمه بازگشت به بالا