انقلاب در هوش مصنوعی؛ سامسونگ با ۷ میلیون پارامتر، غولها را شکست داد

در حالیکه بخش دوربین سامسونگ مدتی نوآوری چشمگیری نداشته، به نظر میرسد واحد تحقیقاتی هوش مصنوعی این شرکت در حال جبران آن است. تازهترین مدل هوش مصنوعی سامسونگ با نام TRM موفق شده عملکردی فراتر از برخی مدلهای زبانی عظیم با حجم تا ۱۰ هزار برابر بزرگتر از خود ثبت کند.
بر اساس مقالهای, سامسونگ جزئیات معماری جدید این مدل را تشریح کرده. TRM تنها از ۷ میلیون پارامتر تشکیل شده و بر پایه یک شبکه دولایهای عمل میکند، در حالیکه مدلهای بزرگ معمولاً دارای میلیاردها پارامتر هستند.
راز TRM در ساختار بازگشت آن نهفته است. این مدل از خروجی خودش برای هدایت مرحله بعدی استفاده میکند و در نتیجه، یک چرخه بازخورد بهبودگر ایجاد میکند. با تکرار این چرخه، مدل قادر است استدلالهای چندمرحلهای و عمیق را بدون نیاز به منابع سنگین محاسباتی شبیهسازی کند. هر بار که مدل خروجی خود را بازبینی میکند، نتیجه دقیقتر و بهینهتری ارائه میدهد.
سامسونگ در آزمایشهای خود متوجه شد که افزایش لایهها باعث کاهش تعمیمدهی و بروز بیشبرازش میشود؛ اما در مقابل، کاهش لایهها و افزایش دفعات بازگشت عملکرد مدل را به شکل چشمگیری بهبود میبخشد.
نتایج بنچمارکها نشان میدهد که TRM توانسته در آزمونهای مختلف عملکرد چشمگیری داشته باشد. این مدل در پازلهای Sudoku Extreme به ۸۷.۴ درصد رسیده که در مقایسه با مدلهای استدلال سلسله مراتبی تنها ۵۵ درصد عملکرد بهتری دارد، همچنین در پازل Maze Hard دقتی برابر با ۸۵ درصد کسب کرده؛ در آزمونهای ARC-AGI-1 و ARC-AGI-2 نیز به ترتیب دقت ۴۵ و ۸ درصد را ثبت کرده، آماری که نشان میدهد این مدل کوچک با منابع محدود، توانایی رقابت با مدلهای عظیم و پیچیده را دارد.
نکته قابلتوجه این است که عملکرد TRM در برخی تستها حتی از مدلهای قدرتمندی چون دیپ سیک R1، جمنای ۲.۵ پرو و o3-mini بهتر بوده یا به آنها نزدیک شده. این دستاورد نشان میدهد که آینده هوش مصنوعی لزوماً در بزرگتر شدن مدلها خلاصه نمیشود، بلکه ساختار هوشمندانه و بازگشتی میتواند با منابع کمتر، کارایی بیشتری ارائه دهد.




