CoreTech

اوپن‌ای‌آی و برادکام از Jalapeño رونمایی کردند؛ تراشه‌ای برای استنتاج LLMها و ChatGPT

ابوالفضل | ۱۲ ساعت پیش

اوپن‌ای‌آی و برادکام از Jalapeño پرده برداشته‌اند؛ تراشه‌ای که به‌عنوان نخستین «پردازنده هوش» OpenAI معرفی شده و برای استنتاج مدل‌های زبانی بزرگ توسعه یافته است. این تراشه بخشی از یک پلتفرم محاسباتی چندنسلی است که دو شرکت برای سریع‌تر، قابل‌اعتمادتر و در دسترس‌تر کردن هوش مصنوعی پیشرفته می‌سازند. Jalapeño همچنین گامی مهم در برنامه OpenAI برای ساخت پشته کامل زیرساختی پشت مدل‌ها و محصولاتش محسوب می‌شود.

این تراشه به سم آلتمن، مدیرعامل OpenAI، و گرگ براکمن، رئیس این شرکت، توسط هاک تان، مدیرعامل Broadcom، و چارلی کاواس، رئیس Broadcom، تحویل داده شد. OpenAI می‌گوید Jalapeño را از پایه و بر اساس شناخت خود از بنیان‌های LLM، نقشه راه مدل‌ها، کرنل‌ها، سامانه‌های سروینگ و نیازهای محصولی طراحی کرده است. Broadcom و Celestica نیز در پیاده‌سازی تراشه و آماده‌سازی آن برای استفاده عملیاتی نقش داشته‌اند.

نمونه‌های مهندسی Jalapeño اکنون در آزمایشگاه با فرکانس و توان هدف‌گذاری‌شده برای نسخه نهایی، بارهای کاری یادگیری ماشین را اجرا می‌کنند. OpenAI به‌طور مشخص اعلام کرده که GPT-5.3 Codex Spark در میان این بارهای کاری قرار دارد و با اینکه سنجش نهایی عملکرد هنوز کامل نشده، آزمایش‌های اولیه نشان می‌دهد Jalapeño از نظر عملکرد به‌ازای هر وات، به‌صورت محسوسی بهتر از شتاب‌دهنده‌های پیشرفته فعلی ظاهر خواهد شد.

OpenAI می‌گوید معماری Jalapeño برای کاهش جابه‌جایی داده و ایجاد تعادل میان پردازش، حافظه و شبکه طراحی شده تا میزان بهره‌برداری واقعی از سخت‌افزار به سقف تئوری عملکرد نزدیک‌تر شود. Broadcom هم با فناوری‌های پیاده‌سازی سیلیکون و شبکه‌سازی خود، از جمله سیلیکون شبکه Tomahawk، به آماده‌سازی این پلتفرم برای تولید در مقیاس بزرگ کمک می‌کند. هدف نهایی ترکیب توان و گذردهی شتاب‌دهنده‌های مطرح امروز با تأخیر نزدیک به سریع‌ترین سامانه‌های تخصصی استنتاج است.

گرگ براکمن، رئیس و هم‌بنیان‌گذار OpenAI، می‌گوید جهان به‌سمت اقتصادی مبتنی بر توان پردازشی حرکت می‌کند و Jalapeño بخشی از راهبرد بلندمدت این شرکت برای فراوان‌تر کردن توان محاسباتی است. به گفته او، این رویکرد باید به هوش مصنوعی سریع‌تر، قابل‌اعتمادتر و ارزان‌تر برای کاربران و کسب‌وکارها منجر شود. براکمن همچنین تأکید کرده که با طراحی بخش بیشتری از پشته زیرساخت، OpenAI می‌تواند هوش بیشتری را با بهره‌وری بالاتر ارائه کند.

ریچارد هو مدیر برنامه سخت‌افزار OpenAI، می‌گوید Jalapeño از پایه برای استنتاج LLMها ساخته شده و معماری آن حول کرنل‌ها، جابه‌جایی حافظه، شبکه‌سازی و الگوهای سروینگ مهم برای مدل‌های مرزی بهینه شده است. او می‌گوید نتایج اولیه نشان می‌دهد این تراشه می‌تواند مهم‌ترین بارهای کاری OpenAI را با بهره‌وری بالا و نزدیک به محدودیت‌های تئوری سخت‌افزار اجرا کند. در سوی دیگر، هاک تان این همکاری را آغاز یک نقشه راه چندنسلی برای زیرساخت فیزیکی هوش مصنوعی توصیف کرده است.

به گفته مدیرعامل Broadcom، توسعه مشترک این تراشه با OpenAI زمینه استقرار دیتاسنترهای گیگاواتی را با همکاری مایکروسافت و دیگر شرکا از سال ۲۰۲۶ فراهم می‌کند. OpenAI تأکید دارد Jalapeño یک شتاب‌دهنده عمومیِ اقتباس‌شده از بارهای کاری قدیمی نیست، بلکه طراحی آن از ابتدا برای استنتاج مدرن LLMها انجام شده است. این تراشه بر پایه سامانه‌هایی شکل گرفته که OpenAI هر روز برای ChatGPT، Codex، API و محصولات عامل‌محور آینده خود اجرا می‌کند.

OpenAI این رویکرد را بخشی از مزیت تمام‌پشته‌ای خود می‌داند؛ یعنی شرکتی که فقط مدل و محصول نمی‌سازد، بلکه معماری تراشه، کرنل‌ها، سامانه‌های حافظه، شبکه، زمان‌بندی، استقرار و تجربه محصول را نیز طراحی می‌کند. از نگاه این شرکت همین یکپارچگی باعث می‌شود هر لایه از زیرساخت حول هدفی مشترک بهینه شود؛ هدف سریع‌تر، ارزان‌تر و قابل‌اعتمادتر کردن مدل‌ها. Jalapeño نیز قرار است این چرخه را با افزایش بهره‌وری محاسباتی و بهبود سروینگ تقویت کند.

یکی از مهم‌ترین نکات اعلام‌شده درباره Jalapeño، سرعت توسعه آن است. OpenAI می‌گوید این تراشه از طراحی اولیه تا tape out تنها در ۹ ماه توسعه یافته و این پروژه به باور شرکت، سریع‌ترین چرخه توسعه ASIC در نیمه‌هادی پیشرفته با توان بالا بوده است. به گفته OpenAI، این سرعت نتیجه توسعه مشترک نرم‌افزار و سخت‌افزار با تیم‌های مهندسی/تخصص Broadcom در پیاده‌سازی سیلیکون و استفاده از مدل‌های OpenAI برای تسریع بخش‌هایی از طراحی و بهینه‌سازی بوده است.

در نهایت OpenAI می‌گوید Jalapeño نخستین گام در یک پلتفرم محاسباتی چندنسلی است که قرار است تا پایان ۲۰۲۶ به استقرار اولیه برسد و در سال‌های بعد گسترش پیدا کند. این شرکت تأکید می‌کند استنتاج همان نقطه‌ای است که هوش مصنوعی به دست کاربران می‌رسد؛ بنابراین هر بهبود در هزینه، سرعت و پایداری می‌تواند به پاسخ سریع‌تر ChatGPT، اجرای بهتر وظایف Codex، ارزان‌تر شدن محصولات API و دسترسی پایدارتر برای دانش‌آموزان، توسعه‌دهندگان، پژوهشگران و کسب‌وکارها منجر شود.

منبع

ابوالفضل | ۱۲ ساعت پیش

دیدگاهتان را بنویسید