انقلاب در هوش مصنوعی؛ سامسونگ با ۷ میلیون پارامتر، غول‌ها را شکست داد

در حالی‌که بخش دوربین سامسونگ مدتی نوآوری‌ چشمگیری نداشته، به نظر می‌رسد واحد تحقیقاتی هوش مصنوعی این شرکت در حال جبران آن است. تازه‌ترین مدل هوش مصنوعی سامسونگ با نام TRM موفق شده عملکردی فراتر از برخی مدل‌های زبانی عظیم با حجم تا ۱۰ هزار برابر بزرگ‌تر از خود ثبت کند.

بر اساس مقاله‌ای, سامسونگ جزئیات معماری جدید این مدل را تشریح کرده. TRM تنها از ۷ میلیون پارامتر تشکیل شده و بر پایه یک شبکه دو‌لایه‌ای عمل می‌کند، در حالی‌که مدل‌های بزرگ معمولاً دارای میلیاردها پارامتر هستند.

راز TRM در ساختار بازگشت آن نهفته است. این مدل از خروجی خودش برای هدایت مرحله بعدی استفاده می‌کند و در نتیجه، یک چرخه بازخورد بهبودگر ایجاد می‌کند. با تکرار این چرخه، مدل قادر است استدلال‌های چندمرحله‌ای و عمیق را بدون نیاز به منابع سنگین محاسباتی شبیه‌سازی کند. هر بار که مدل خروجی خود را بازبینی می‌کند، نتیجه دقیق‌تر و بهینه‌تری ارائه می‌دهد.

سامسونگ در آزمایش‌های خود متوجه شد که افزایش لایه‌ها باعث کاهش تعمیم‌دهی و بروز بیش‌برازش می‌شود؛ اما در مقابل، کاهش لایه‌ها و افزایش دفعات بازگشت عملکرد مدل را به شکل چشمگیری بهبود می‌بخشد.

نتایج بنچمارک‌ها نشان می‌دهد که TRM توانسته در آزمون‌های مختلف عملکرد چشمگیری داشته باشد. این مدل در پازل‌های Sudoku Extreme به ۸۷.۴ درصد رسیده که در مقایسه با مدل‌های استدلال سلسله‌ مراتبی تنها ۵۵ درصد عملکرد بهتری دارد، همچنین در پازل Maze Hard دقتی برابر با ۸۵ درصد کسب کرده؛ در آزمون‌های ARC-AGI-1 و ARC-AGI-2 نیز به ترتیب دقت ۴۵ و ۸ درصد را ثبت کرده، آماری که نشان می‌دهد این مدل کوچک با منابع محدود، توانایی رقابت با مدل‌های عظیم و پیچیده را دارد.

نکته قابل‌توجه این است که عملکرد TRM در برخی تست‌ها حتی از مدل‌های قدرتمندی چون دیپ سیک R1، جمنای ۲.۵ پرو و o3-mini بهتر بوده یا به آن‌ها نزدیک شده. این دستاورد نشان می‌دهد که آینده هوش مصنوعی لزوماً در بزرگ‌تر شدن مدل‌ها خلاصه نمی‌شود، بلکه ساختار هوشمندانه و بازگشتی می‌تواند با منابع کمتر، کارایی بیشتری ارائه دهد.

پوریا | ۱ ماه پیش

دیدگاهتان را بنویسید