مدل متنباز DeepSeek V3.2 Exp با کاهش چشمگیر هزینههای محاسباتی معرفی شد

شرکت دیپسیک از جدیدترین مدل زبانی هوش مصنوعی خود با نام DeepSeek V3.2 Exp رونمایی کرد. به گفتهی DeepSeek، این بهینهسازی باعث میشود کسبوکارهایی که از API این شرکت استفاده میکنند، هزینهی کمتری برای دسترسی به توان پردازشی مدل پرداخت کنند و در عین حال از عملکرد هوش مصنوعی قدرتمند آن بهرهمند شوند. در حال حاضر، DeepSeek V3.2 Exp در میان ۱۱ مدل زبانی قدرتمند جهان جای گرفته است.
یکی از مهمترین پیشرفتهای فنی در این نسخه، معرفی ساختار DeepSeek Sparse Attention (DSA) است. در این طراحی نوآورانه، مدل به جای ارتباطدهی هر توکن با تمام توکنهای دیگر، تنها مرتبطترین توکنها را انتخاب میکند. این تغییر، علاوه بر افزایش سرعت پردازش متن در محدودهی ورودی ۱۲۸ هزار توکن، موجب کاهش مصرف حافظه و توان سختافزاری نیز شده است.

بر اساس اعلام رسمی، کاربرانی که از نسخهی عمومی API استفاده میکنند، بیش از ۵۰ درصد کمتر از قبل پرداخت خواهند کرد، بدون آنکه عملکرد مدل در معیارهای استاندارد (Benchmarks) دچار افت قابل توجهی شود.
مدل DeepSeek V3.2 Exp با حجم حدود ۴۰۰ گیگابایت، هماکنون از طریق پلتفرم Hugging Face قابل دانلود است و میتواند بهصورت محلی روی سیستمهای قدرتمند اجرا شود. برای اجرای کامل آن، حداقل به چندین کارت گرافیک انویدیا H100/H200/H20 یا یک سرور NVIDIA B200/GB200 نیاز است، زیرا مدل به بیش از ۱.۵ ترابایت حافظهی گرافیکی (VRAM) احتیاج دارد.
در عین حال، کاربرانی که قصد دارند DeepSeek V3.2 Exp را روی سیستمهای خانگی اجرا کنند، باید منتظر انتشار نسخهی کمحجم یا Quantized آن باشند؛ نسخههایی که پیشتر برای مدل DeepSeek V3.1 نیز توسط توسعهدهندهای با نام unsloth عرضه شده بود. اجرای این نسخههای فشرده نیازمند کارت گرافیک با حداقل ۲۴ گیگابایت حافظه است.



