
توسعهدهندهای محدودیتهای اپل را دور زد؛ موتور عصبی M4 حالا توان آموزش مدلهای هوش مصنوعی را دارد
یک توسعهدهنده مستقل موفق شده است با مهندسی معکوس موتور عصبی تراشه M4 اپل، به بخشی از توان پردازشی این سختافزار دسترسی پیدا کند که تاکنون از طریق ابزارهای رسمی اپل قابل استفاده نبود. این دستاورد که در شبکه اجتماعی X مورد توجه قرار گرفته، نشان میدهد موتور عصبی M4 فراتر از قابلیتهای تعریفشده فعلی، توانایی اجرای برخی وظایف سنگین مرتبط با آموزش مدلهای هوش مصنوعی را نیز در اختیار دارد و میتواند ظرفیتهای پنهان این تراشه را آشکار کند.
در شرایط عادی اپل استفاده از موتور عصبی تراشههای سری M را به اجرای مدلهای از پیش آموزشدیده محدود کرده است. به همین دلیل توسعهدهندگان میتوانند از این بخش سختافزاری برای پردازش و استنتاج مدلهای هوش مصنوعی استفاده کنند، اما امکان آموزش مستقیم مدلهای جدید روی آن وجود ندارد. این محدودیت سالها بخشی از سیاست نرمافزاری اپل بوده و باعث شده بسیاری از قابلیتهای بالقوه سختافزار در دسترس کاربران و برنامهنویسان قرار نگیرد.
بر اساس اطلاعات منتشرشده، پژوهشگری با نام 0x0SojalSec توانسته است این محدودیتها را دور بزند و به حدود ۱۵.۸ ترافلاپس توان پردازشی برای آموزش هوش مصنوعی دست پیدا کند. او اخیراً جزئیات پروژه و کدهای مربوط به آن را در GitHub منتشر کرده و توضیح داده است که چگونه بدون استفاده از مسیرهای رسمی توسعه اپل، موفق به برقراری ارتباط با موتور عصبی M4 شده است. همین موضوع این پروژه را به نمونهای کمسابقه در اکوسیستم اپل تبدیل کرده است.
از آنجا که اپل سطح دسترسی لازم برای انجام چنین پردازشهایی را در اختیار توسعهدهندگان قرار نمیدهد، این محقق ناچار شد راهکاری کاملاً متفاوت طراحی کند. او بدون استفاده از CoreML، Metal و حتی پردازنده گرافیکی، یک Model Intermediate Language اختصاصی را از پایه توسعه داد. این لایه نرمافزاری نقش واسط میان مدلهای یادگیری ماشین و موتور عصبی را بر عهده دارد و امکان بهرهگیری از قابلیتهایی را فراهم میکند که بهصورت رسمی قابل دسترس نیستند.
به گفته توسعهدهنده این پروژه، ابزار طراحیشده موفق شده است قابلیت اجرای کامل Backpropagation و همچنین آموزش مدلهای مبتنی بر معماری Transformer را مستقیماً روی موتور عصبی اپل فراهم کند. این موضوع از آن جهت اهمیت دارد که چنین عملیاتهایی معمولاً برای آموزش شبکههای عصبی مدرن ضروری هستند. در نتیجه این آزمایش نشان میدهد محدودیت موجود بیش از آنکه ریشه در سختافزار داشته باشد، ناشی از تصمیمات نرمافزاری و سیاستهای دسترسی اپل است.
اجرای فرایند آموزش روی سختافزاری که بهطور رسمی برای این منظور در نظر گرفته نشده، چالشهای فنی متعددی نیز به همراه داشته است. توسعهدهنده برای جلوگیری از توقف کامل برنامه در زمان بروز خطا، مکانیزمهایی ویژه در زبان اختصاصی خود ایجاد کرده؛ مثلا اگر یکی از فرایندهای آموزش در میانه کار متوقف شود، سیستم میتواند با استفاده از یک دستور اجرایی خاص آن را دوباره راهاندازی کرده و ادامه پردازش را از همان نقطه دنبال کند.
عامل مهم دیگر در موفقیت این پروژه، بهینهسازی عملکرد و مدیریت دادهها بوده؛ برای دستیابی به بیشترین سرعت ممکن، فرایند آموزش بهگونهای تنظیم شده که دادهها بهطور کامل در حافظه RAM نگهداری شوند و وابستگی به حافظه NAND به حداقل برسد. این رویکرد باعث افزایش سرعت اجرای عملیات شده و در نهایت نشان داده است که مکها و آیپدهای مجهز به تراشه M4 از نظر سختافزاری توانایی انجام بارهای کاری مرتبط با آموزش هوش مصنوعی را دارند، حتی اگر اپل فعلاً چنین قابلیتی را بهصورت رسمی ارائه نکند.




