CoreTech

Kimi K2.7 Code

مدل جدید Kimi K2.7 Code معرفی شد؛ هوش‌مصنوعی متن‌باز Moonshot AI با قیمت بسیار پایین‌

ابوالفضل | ۳ ساعت پیش

شرکت Moonshot AI از مدل جدید Kimi K2.7 Code رونمایی کرد؛ مدلی که به‌طور ویژه برای وظایف برنامه‌نویسی و جریان‌های کاری مبتنی بر عامل‌های هوش مصنوعی توسعه یافته است. این مدل نسل جدید خانواده Kimi محسوب می‌شود و ادامه مسیر Kimi K2.6 به شمار می‌رود، Moonshot نسخه دارای وزن‌های باز این مدل را نیز منتشر کرده و کاربران می‌توانند آن را از طریق پلتفرم Hugging Face دریافت و اجرا کنند.

بر اساس توضیحات منتشرشده از سوی Moonshot AI، تمرکز اصلی K2.7 Code بر بهبود عملکرد در پروژه‌های پیچیده و طولانی‌مدت مهندسی نرم‌افزار قرار دارد. این شرکت اعلام کرده مدل جدید برای سناریوهای کدنویسی پیشرفته بهینه‌سازی شده است؛ با این حال، برای وظایف عمومی و کاربردهایی که مستقیماً به برنامه‌نویسی مربوط نمی‌شوند، همچنان استفاده از Kimi K2.6 را توصیه می‌کند.

نکته قابل‌توجه دیگر این است که Kimi همان خانواده مدلی محسوب می‌شود که شرکت Cursor نیز نسخه‌ای تغییر یافته از آن را در سرویس‌های خود ارائه می‌کند. به همین دلیل، معرفی K2.7 Code برای توسعه‌دهندگان و شرکت‌هایی که از ابزارهای برنامه‌نویسی مبتنی بر هوش مصنوعی استفاده می‌کنند، اهمیت ویژه‌ای دارد و می‌تواند بر بازار ابزارهای کدنویسی مبتنی بر عامل تأثیر بگذارد.

نتایج بنچمارک‌های منتشرشده نشان می‌دهد Kimi K2.7 Code در مقایسه با نسل قبل پیشرفت محسوسی داشته است. در آزمون اختصاصی Kimi Code Bench v2 امتیاز مدل از ۵۰.۹ به ۶۲ افزایش یافته است. این رشد نشان می‌دهد Moonshot توانسته عملکرد مدل را در بسیاری از وظایف مرتبط با توسعه نرم‌افزار بهبود دهد و فاصله آن را با نسل قبلی تا حدی کاهش دهد.

مدل جدید در Program Bench نیز عملکرد بهتری نسبت به K2.6 ثبت کرده، امتیاز آن در این آزمون از ۴۸.۳ به ۵۳.۶ رسیده و در MLS Bench Lite نیز از ۲۶.۷ به ۳۵.۱ افزایش یافته است. این ارقام نشان می‌دهند که K2.7 Code در حوزه‌های مختلف ارزیابی نرم‌افزاری و مهندسی کد، نسبت به نسخه پیشین خود پیشرفت قابل‌توجهی را تجربه کرده است.

علاوه بر این Moonshot AI اعلام کرده عملکرد عامل‌محور مدل نیز بهبود یافته و K2.7 Code در بنچمارک MCP Atlas موفق به ثبت امتیاز ۷۶ شده که نسبت به امتیاز ۶۹.۴ نسل قبل رشد قابل‌توجهی دارد. همچنین در آزمون MCPMark Verified نیز امتیاز مدل از ۷۲.۸ به ۸۱.۱ افزایش یافته که نشان‌دهنده پیشرفت در وظایف مبتنی بر عامل‌های هوش مصنوعی است.

نتایج بنجمارک و مقایسه Kimi K2.7 Code با رقبا:

با وجود این پیشرفت‌ها K2.7 Code هنوز در بسیاری از آزمون‌های برنامه‌نویسی از مدل‌های پیشتاز بازار عقب‌تر قرار می‌گیرد، در مقایسه مستقیم، GPT-5.5 در Program Bench امتیاز ۶۹.۱ را ثبت کرده، در حالی که امتیاز K2.7 Code برابر با ۵۳.۶ بوده است. اختلاف مشابهی نیز در Kimi Code Bench v2 دیده می‌شود؛ جایی که GPT-5.5 امتیاز ۶۹ و K2.7 Code امتیاز ۶۲ را کسب کرده‌اند.

Program Bench یکی از دشوارترین بنچمارک‌های حوزه برنامه‌نویسی به شمار می‌رود. در این آزمون، عامل‌های هوش مصنوعی باید تنها با استفاده از یک فایل باینری کامپایل‌شده و مستندات مربوط به آن، رفتار یک نرم‌افزار را بازسازی کنند، شرکت‌کنندگان به کد منبع، ابزارهای دیکامپایل یا اینترنت دسترسی ندارند و همین موضوع باعث می‌شود این آزمون چالش‌برانگیزتر از بسیاری از بنچمارک‌های متداول باشد.

با این حال Kimi K2.7 Code در برخی سناریوهای عامل‌محور عملکرد رقابتی‌تری از خود نشان داده است. Moonshot AI معتقد است مدل جدید اگرچه در آزمون‌های صرفاً کدنویسی هنوز از برخی رقبا عقب است، اما در محیط‌هایی که نیاز به تعامل با ابزارها و اجرای چندمرحله‌ای وظایف وجود دارد، توانسته نتایج قابل‌قبولی ارائه دهد و در برخی موارد به سطح مدل‌های مطرح بازار نزدیک شود.

یکی از مهم‌ترین موارد استثنا در نتایج منتشرشده، بنچمارک MCPMark Verified است. این آزمون عامل‌های هوش مصنوعی را در پنج محیط واقعی نرم‌افزاری شامل Notion، GitHub، سیستم فایل، پایگاه داده Postgres و خودکارسازی مرورگر از طریق Playwright ارزیابی می‌کند. در این شرایط، K2.7 Code موفق شده امتیاز ۸۱.۱ را به دست آورد و از Claude Opus 4.8 با امتیاز ۷۶.۴ عبور کند.

البته برتری K2.7 Code در این آزمون نیز به معنای پیشی گرفتن از همه رقبا نیست، GPT-5.5 در همین بنچمارک امتیاز ۹۲.۹ را ثبت کرده و همچنان فاصله محسوسی با مدل Moonshot دارد. با این وجود، توسعه‌دهندگان Kimi تأکید می‌کنند که نتایج بنچمارک‌ها همیشه با عملکرد واقعی در کاربردهای روزمره یکسان نیست و ممکن است تجربه عملی کاربران تفاوت‌هایی با این اعداد داشته باشد.

بر اساس اطلاعات منتشرشده در کارت رسمی مدل، K2.7 Code از معماری Mixture of Experts یا MoE استفاده می‌کند. این مدل در مجموع دارای یک تریلیون پارامتر است، اما تنها ۳۲ میلیارد پارامتر آن هنگام پردازش هر توکن فعال می‌شوند. ساختار مدل شامل ۳۸۴ اکسپرت مختلف است و برای هر توکن، هشت اکسپرت به‌صورت هم‌زمان انتخاب و مورد استفاده قرار می‌گیرند.

Moonshot AI همچنین اعلام کرده طول کانتکست مدل به ۲۵۶ هزار توکن می‌رسد، چنین ظرفیتی امکان پردازش حجم زیادی از اطلاعات را در یک مکالمه یا پروژه فراهم می‌کند اما نسبتبه رقبا کم به نظر می‌رسد. این ویژگی می‌تواند برای توسعه‌دهندگانی که با پایگاه‌های کد بزرگ، مستندات گسترده یا فرایندهای پیچیده مهندسی نرم‌افزار سروکار دارند، اهمیت قابل‌توجهی داشته باشد.

K2.7 Code یک مدل چندوجهی محسوب می‌شود و تنها به پردازش متن محدود نیست. این مدل توانایی درک و پردازش تصاویر و ویدیوها را نیز دارد؛ برای دستیابی به این قابلیت، Moonshot از رمزگذار بینایی اختصاصی MoonViT استفاده کرده که دارای ۴۰۰ میلیون پارامتر است و بخش پردازش محتوای بصری مدل را بر عهده دارد.

به گفته توسعه‌دهندگان، معماری K2.7 Code از نظر ساختاری با K2.5 و K2.6 تفاوتی ندارد، این موضوع باعث می‌شود کاربرانی که هم‌اکنون زیرساخت لازم برای اجرای نسخه‌های قبلی را در اختیار دارند، بتوانند بدون نیاز به تغییر تنظیمات استقرار یا بازطراحی فرایندها، مدل جدید را نیز روی همان زیرساخت اجرا کنند.

یکی از مهم‌ترین تغییرات فنی K2.7 Code به بهینه‌سازی فرایند استدلال مربوط می‌شود؛ Moonshot اعلام کرده این مدل در مقایسه با K2.6 حدود ۳۰ درصد توکن فکری کمتری مصرف می‌کند، این کاهش مصرف باعث می‌شود مدل کمتر دچار پدیده‌ای شود که از آن با عنوان بیش‌ازحد فکر کردن یاد می‌شود و در نتیجه کارایی بهتری داشته باشد.

Kimi K2.7 Code همچنین دارای حالت اجباری Thinking Mode است و از قابلیت preserve thinking نیز پشتیبانی می‌کند. این ویژگی محتوای کامل فرایند استدلال را در طول چندین نوبت مکالمه حفظ می‌کند تا عملکرد مدل در سناریوهای برنامه‌نویسی مبتنی بر عامل بهبود یابد. چنین قابلیتی به‌ویژه در پروژه‌های چندمرحله‌ای و طولانی‌مدت می‌تواند اهمیت زیادی داشته باشد.

Moonshot AI در کنار معرفی این مدل، از برنامه خود برای عرضه قابلیت جدیدی با نام 6x High-Speed Mode نیز خبر داده است. این حالت قرار است در آینده نزدیک ارائه شود. K2.7 Code هم‌اکنون از طریق Kimi API، ابزار Kimi Code CLI و موتورهای استنتاجی شناخته‌شده‌ای مانند vLLM و SGLang در دسترس کاربران قرار دارد.

شرکت سازنده همچنین نسخه بومی INT4 این مدل را منتشر کرده است. علاوه بر انتشار وزن‌های مدل در Hugging Face، ارائه کوانتیزه‌سازی INT4 این امکان را فراهم می‌کند که K2.7 Code روی سخت‌افزارهای ارزان‌تر یا کم‌قدرت‌تر نیز اجرا شود. این موضوع می‌تواند هزینه استقرار مدل را برای بسیاری از توسعه‌دهندگان و سازمان‌ها کاهش دهد.

در بخش قیمت‌گذاری، K2.7 Code هزینه‌ای برابر با ۰.۹۵ دلار برای هر یک میلیون توکن ورودی و ۴ دلار برای هر یک میلیون توکن خروجی دارد. در صورتی که درخواست‌ها از کش استفاده کنند، هزینه ورودی به ۰.۱۹ دلار برای هر یک میلیون توکن کاهش می‌یابد. این قیمت‌گذاری تقریباً با K2.6 یکسان است که آن نیز ۰.۹۵ دلار برای ورودی و ۴ دلار برای خروجی دریافت می‌کرد و هزینه کش آن ۰.۱۶ دلار بود.

اختلاف قیمت K2.7 Code با رقبای مطرح بازار چشمگیر است، GPT-5.5 برای هر یک میلیون توکن ورودی ۵ دلار و برای هر یک میلیون توکن خروجی ۳۰ دلار هزینه دارد. Claude Opus 4.8 نیز به‌ترتیب ۵ دلار و ۲۵ دلار قیمت‌گذاری شده است. همچنین Claude Fable 5، جدیدترین مدل Anthropic که در حال حاضر تعلیق شده، برای هر یک میلیون توکن ورودی ۱۰ دلار و برای هر یک میلیون توکن خروجی ۵۰ دلار دریافت می‌کند. به این ترتیب، هزینه خروجی Claude Fable 5 بیش از ۱۲ برابر K2.7 Code است.

Moonshot AI معتقد است مزیت اصلی K2.7 Code تنها در عملکرد فنی آن خلاصه نمی‌شود، بلکه نسبت هزینه به کارایی نیز نقش مهمی ایفا می‌کند. این شرکت می‌گوید حتی اگر مدل جدید در برخی آزمون‌ها از بهترین مدل‌های غربی عقب‌تر باشد، کاربران با همان بودجه می‌توانند تعداد بسیار بیشتری درخواست را پردازش کنند و دفعات استفاده از مدل را به شکل محسوسی افزایش دهند.

به باور Moonshot، پاسخ به این پرسش که آیا K2.7 Code بهترین انتخاب برای یک پروژه است یا خیر، تنها از طریق ارزیابی‌های اختصاصی و متناسب با نیاز هر کاربر مشخص می‌شود. این شرکت تأکید می‌کند با توجه به اختلاف قابل‌توجه قیمت‌ها، انجام چنین ارزیابی‌هایی در استفاده‌های سنگین به‌سرعت هزینه خود را جبران خواهد کرد. از نگاه Moonshot، هزینه هر توکن اکنون در حال تبدیل شدن به عاملی رقابتی در کنار کیفیت خام مدل‌ها است و این روند نشانه‌ای از شکل‌گیری اقتصاد مبتنی بر توکن در صنعت هوش مصنوعی به شمار می‌رود.

Kimi K2.7 Code تحت یک نسخه اصلاح‌شده از مجوز MIT منتشر شده است. این مجوز امکان استفاده، ویرایش و توزیع مجدد مدل را بدون محدودیت‌های متداول بسیاری از مجوزهای تجاری فراهم می‌کند. با این حال، یک بند ویژه برای شرکت‌های بزرگ در نظر گرفته شده است که شرایط استفاده از مدل را در مقیاس بسیار بزرگ مشخص می‌کند.

بر اساس این بند، هر شرکت یا سازمانی که از K2.7 Code یا مشتقات آن در محصولی با بیش از ۱۰۰ میلیون کاربر فعال ماهانه یا بیش از ۲۰ میلیون دلار درآمد ماهانه استفاده کند، باید عبارت Kimi K2.7 Code را به‌صورت برجسته در رابط کاربری محصول خود نمایش دهد. این شرط مهم‌ترین تفاوت مجوز مدل با نسخه استاندارد MIT محسوب می‌شود.

منبع

ابوالفضل | ۳ ساعت پیش

دیدگاهتان را بنویسید