CoreTech

دیپ‌سیک V3.2 و DeepSeek V3.2 Speciale با تمرکز بر بهینگی رونمایی شد

ابوالفضل | ۵ روز پیش

دیپ‌سیک نسل تازه‌ای از مدل‌های متن‌باز خود را با نام‌های دیپ‌سیک V3.2 و DeepSeek V3.2 Speciale معرفی کرده است؛ مدل‌هایی که برای رقابت مستقیم با GPT-5 و Gemini 3.0 Pro عرضه شده‌اند. این معرفی در ادامه موج توجهات جهانی به دیپ‌سیک پس از موفقیت‌های ابتدای سال ۲۰۲۵ انجام می‌شود و بسیاری از فعالان حوزه هوش مصنوعی را به بررسی دقیق این دو مدل جدید ترغیب کرده است.

این معرفی جدید در راستای رویکرد متفاوت دیپ‌سیک در رقابت هوش مصنوعی است؛ رویکردی که برخلاف سرمایه‌گذاری سنگین OpenAI و گوگل، بر بهینه‌سازی پردازشی و کاهش هزینه سخت‌افزار تکیه دارد. مدل پیشین این شرکت، یعنی R1، نشان داد که دستیابی به عملکردی هم‌سطح GPT-4o و Gemini 2.5 Pro با ترفندهای یادگیری تقویتی و استفاده از تراشه‌های کم‌هزینه‌تر نیز امکان‌پذیر است.

مدل استاندارد DeepSeek V3.2 به‌عنوان گزینه‌ای متعادل برای استفاده روزمره معرفی شده و ترکیبی از کارایی، بهره‌وری و توانایی‌های عامل‌محور را ارائه می‌دهد. دیپ‌سیک این مدل را از نظر عملکرد در سطح GPT 5 می‌داند. نقطه قوت نسخه جدید، ادغام قابلیت تفکر در فرآیند استفاده از ابزارهاست؛ قابلیتی که هم در حالت تفکری و هم در حالت غیرتفکری فعال است.

در میان دو مدل معرفی‌شده، نسخه قدرتمند DeepSeek V3.2-Speciale بیشترین توجه را به خود جلب کرده است. دیپ‌سیک می‌گوید این مدل در استدلال پیچیده عملکردی فراتر از GPT-5 دارد و می‌تواند با Gemini 3.0 Pro رقابت مستقیم کند. این نسخه توانسته به سطح مدال طلا در المپیاد جهانی ریاضی و المپیاد جهانی انفورماتیک ۲۰۲۵ برسد. شرکت همچنین خروجی رسمی ارسال‌شده خود به این رقابت‌ها را منتشر کرده است.

دیپ‌سیک جهش عملکرد نسخه Speciale را ناشی از فناوری DeepSeek Sparse Attention می‌داند؛ مکانیزمی که برای کاهش پیچیدگی محاسباتی در پردازش متن‌های طولانی طراحی شده است. این فناوری همراه با یک چارچوب مقیاس‌پذیر یادگیری تقویتی، باعث افزایش پایداری مدل شده است. علاوه بر این، شرکت یک خط تولید وظایف عامل‌محور ایجاد کرده که شامل بیش از ۸۵ هزار دستور پیچیده برای آموزش مدل است.

مدل DeepSeek V3.2 اکنون روی وب، اپلیکیشن‌های موبایل و API قابل استفاده است؛ اما نسخه V3.2-Speciale فعلاً فقط از طریق API ارائه می‌شود. دسترسی به این مدل موقت بوده و طبق اعلام شرکت، در تاریخ ۱۵ دسامبر ۲۰۲۵ غیرفعال خواهد شد. نسخه Speciale صرفاً یک موتور استدلالی محسوب می‌شود و برخلاف مدل استاندارد از فراخوانی ابزارها پشتیبانی نمی‌کند. برای اجرای محلی نیز راهنمای کامل ارائه شده است.

تمرکز دیپ‌سیک بر توسعه قابلیت‌های عامل‌محور یکی از نقاط برجسته این انتشار است. شرکت با ایجاد یک سیستم عظیم ساخت وظایف، تلاش کرده مدل‌ها را در شرایط پیچیده و واقعی آموزش دهد. این رویکرد باعث شده مدل بتواند فرآیند تفکر را به‌طور مستقیم در تعامل با ابزارها وارد کند. چنین قابلیتی می‌تواند در پروژه‌های نرم‌افزاری، پردازش داده و مدیریت وظایف ترکیبی تأثیر محسوسی ایجاد کند.

با انتشار این دیپ سیک V3.2 و DeepSeek V3.2 Speciale، دیپ‌سیک جایگاه خود را در رقابت با غول‌های هوش مصنوعی تثبیت کرده است. رویکرد متفاوت شرکت در استفاده از سخت‌افزار ارزان‌تر، طراحی معماری بهینه و تمرکز بر قابلیت‌های عامل‌محور، باعث شده توجه زیادی به آینده این مدل‌ها معطوف شود. حال بسیاری از توسعه‌دهندگان منتظرند ببینند نسخه Speciale پس از پایان دسترسی موقت چه سرنوشتی پیدا می‌کند و آیا نسخه پایدار آن عرضه خواهد شد یا خیر.

منبع

ابوالفضل | ۵ روز پیش

دیدگاهتان را بنویسید