مدل متن‌باز DeepSeek V3.2 Exp با کاهش چشمگیر هزینه‌های محاسباتی معرفی شد

شرکت دیپ‌سیک از جدیدترین مدل زبانی هوش مصنوعی خود با نام DeepSeek V3.2 Exp رونمایی کرد. به گفته‌ی DeepSeek، این بهینه‌سازی باعث می‌شود کسب‌وکارهایی که از API این شرکت استفاده می‌کنند، هزینه‌ی کمتری برای دسترسی به توان پردازشی مدل پرداخت کنند و در عین حال از عملکرد هوش مصنوعی قدرتمند آن بهره‌مند شوند. در حال حاضر، DeepSeek V3.2 Exp در میان ۱۱ مدل زبانی قدرتمند جهان جای گرفته است.

یکی از مهم‌ترین پیشرفت‌های فنی در این نسخه، معرفی ساختار DeepSeek Sparse Attention (DSA) است. در این طراحی نوآورانه، مدل به جای ارتباط‌دهی هر توکن با تمام توکن‌های دیگر، تنها مرتبط‌ترین توکن‌ها را انتخاب می‌کند. این تغییر، علاوه بر افزایش سرعت پردازش متن در محدوده‌ی ورودی ۱۲۸ هزار توکن، موجب کاهش مصرف حافظه و توان سخت‌افزاری نیز شده است.

بر اساس اعلام رسمی، کاربرانی که از نسخه‌ی عمومی API استفاده می‌کنند، بیش از ۵۰ درصد کمتر از قبل پرداخت خواهند کرد، بدون آن‌که عملکرد مدل در معیارهای استاندارد (Benchmarks) دچار افت قابل توجهی شود.

مدل DeepSeek V3.2 Exp با حجم حدود ۴۰۰ گیگابایت، هم‌اکنون از طریق پلتفرم Hugging Face قابل دانلود است و می‌تواند به‌صورت محلی روی سیستم‌های قدرتمند اجرا شود. برای اجرای کامل آن، حداقل به چندین کارت گرافیک انویدیا H100/H200/H20 یا یک سرور NVIDIA B200/GB200 نیاز است، زیرا مدل به بیش از ۱.۵ ترابایت حافظه‌ی گرافیکی (VRAM) احتیاج دارد.

در عین حال، کاربرانی که قصد دارند DeepSeek V3.2 Exp را روی سیستم‌های خانگی اجرا کنند، باید منتظر انتشار نسخه‌ی کم‌حجم یا Quantized آن باشند؛ نسخه‌هایی که پیش‌تر برای مدل DeepSeek V3.1 نیز توسط توسعه‌دهنده‌ای با نام unsloth عرضه شده بود. اجرای این نسخه‌های فشرده نیازمند کارت گرافیک با حداقل ۲۴ گیگابایت حافظه است.

ابوالفضل | ۴ هفته پیش

دیدگاهتان را بنویسید