
اوپنایآی و برادکام از Jalapeño رونمایی کردند؛ تراشهای برای استنتاج LLMها و ChatGPT
اوپنایآی و برادکام از Jalapeño پرده برداشتهاند؛ تراشهای که بهعنوان نخستین «پردازنده هوش» OpenAI معرفی شده و برای استنتاج مدلهای زبانی بزرگ توسعه یافته است. این تراشه بخشی از یک پلتفرم محاسباتی چندنسلی است که دو شرکت برای سریعتر، قابلاعتمادتر و در دسترستر کردن هوش مصنوعی پیشرفته میسازند. Jalapeño همچنین گامی مهم در برنامه OpenAI برای ساخت پشته کامل زیرساختی پشت مدلها و محصولاتش محسوب میشود.
این تراشه به سم آلتمن، مدیرعامل OpenAI، و گرگ براکمن، رئیس این شرکت، توسط هاک تان، مدیرعامل Broadcom، و چارلی کاواس، رئیس Broadcom، تحویل داده شد. OpenAI میگوید Jalapeño را از پایه و بر اساس شناخت خود از بنیانهای LLM، نقشه راه مدلها، کرنلها، سامانههای سروینگ و نیازهای محصولی طراحی کرده است. Broadcom و Celestica نیز در پیادهسازی تراشه و آمادهسازی آن برای استفاده عملیاتی نقش داشتهاند.
نمونههای مهندسی Jalapeño اکنون در آزمایشگاه با فرکانس و توان هدفگذاریشده برای نسخه نهایی، بارهای کاری یادگیری ماشین را اجرا میکنند. OpenAI بهطور مشخص اعلام کرده که GPT-5.3 Codex Spark در میان این بارهای کاری قرار دارد و با اینکه سنجش نهایی عملکرد هنوز کامل نشده، آزمایشهای اولیه نشان میدهد Jalapeño از نظر عملکرد بهازای هر وات، بهصورت محسوسی بهتر از شتابدهندههای پیشرفته فعلی ظاهر خواهد شد.
OpenAI میگوید معماری Jalapeño برای کاهش جابهجایی داده و ایجاد تعادل میان پردازش، حافظه و شبکه طراحی شده تا میزان بهرهبرداری واقعی از سختافزار به سقف تئوری عملکرد نزدیکتر شود. Broadcom هم با فناوریهای پیادهسازی سیلیکون و شبکهسازی خود، از جمله سیلیکون شبکه Tomahawk، به آمادهسازی این پلتفرم برای تولید در مقیاس بزرگ کمک میکند. هدف نهایی ترکیب توان و گذردهی شتابدهندههای مطرح امروز با تأخیر نزدیک به سریعترین سامانههای تخصصی استنتاج است.
گرگ براکمن، رئیس و همبنیانگذار OpenAI، میگوید جهان بهسمت اقتصادی مبتنی بر توان پردازشی حرکت میکند و Jalapeño بخشی از راهبرد بلندمدت این شرکت برای فراوانتر کردن توان محاسباتی است. به گفته او، این رویکرد باید به هوش مصنوعی سریعتر، قابلاعتمادتر و ارزانتر برای کاربران و کسبوکارها منجر شود. براکمن همچنین تأکید کرده که با طراحی بخش بیشتری از پشته زیرساخت، OpenAI میتواند هوش بیشتری را با بهرهوری بالاتر ارائه کند.
ریچارد هو مدیر برنامه سختافزار OpenAI، میگوید Jalapeño از پایه برای استنتاج LLMها ساخته شده و معماری آن حول کرنلها، جابهجایی حافظه، شبکهسازی و الگوهای سروینگ مهم برای مدلهای مرزی بهینه شده است. او میگوید نتایج اولیه نشان میدهد این تراشه میتواند مهمترین بارهای کاری OpenAI را با بهرهوری بالا و نزدیک به محدودیتهای تئوری سختافزار اجرا کند. در سوی دیگر، هاک تان این همکاری را آغاز یک نقشه راه چندنسلی برای زیرساخت فیزیکی هوش مصنوعی توصیف کرده است.
به گفته مدیرعامل Broadcom، توسعه مشترک این تراشه با OpenAI زمینه استقرار دیتاسنترهای گیگاواتی را با همکاری مایکروسافت و دیگر شرکا از سال ۲۰۲۶ فراهم میکند. OpenAI تأکید دارد Jalapeño یک شتابدهنده عمومیِ اقتباسشده از بارهای کاری قدیمی نیست، بلکه طراحی آن از ابتدا برای استنتاج مدرن LLMها انجام شده است. این تراشه بر پایه سامانههایی شکل گرفته که OpenAI هر روز برای ChatGPT، Codex، API و محصولات عاملمحور آینده خود اجرا میکند.
OpenAI این رویکرد را بخشی از مزیت تمامپشتهای خود میداند؛ یعنی شرکتی که فقط مدل و محصول نمیسازد، بلکه معماری تراشه، کرنلها، سامانههای حافظه، شبکه، زمانبندی، استقرار و تجربه محصول را نیز طراحی میکند. از نگاه این شرکت همین یکپارچگی باعث میشود هر لایه از زیرساخت حول هدفی مشترک بهینه شود؛ هدف سریعتر، ارزانتر و قابلاعتمادتر کردن مدلها. Jalapeño نیز قرار است این چرخه را با افزایش بهرهوری محاسباتی و بهبود سروینگ تقویت کند.
یکی از مهمترین نکات اعلامشده درباره Jalapeño، سرعت توسعه آن است. OpenAI میگوید این تراشه از طراحی اولیه تا tape out تنها در ۹ ماه توسعه یافته و این پروژه به باور شرکت، سریعترین چرخه توسعه ASIC در نیمههادی پیشرفته با توان بالا بوده است. به گفته OpenAI، این سرعت نتیجه توسعه مشترک نرمافزار و سختافزار با تیمهای مهندسی/تخصص Broadcom در پیادهسازی سیلیکون و استفاده از مدلهای OpenAI برای تسریع بخشهایی از طراحی و بهینهسازی بوده است.
در نهایت OpenAI میگوید Jalapeño نخستین گام در یک پلتفرم محاسباتی چندنسلی است که قرار است تا پایان ۲۰۲۶ به استقرار اولیه برسد و در سالهای بعد گسترش پیدا کند. این شرکت تأکید میکند استنتاج همان نقطهای است که هوش مصنوعی به دست کاربران میرسد؛ بنابراین هر بهبود در هزینه، سرعت و پایداری میتواند به پاسخ سریعتر ChatGPT، اجرای بهتر وظایف Codex، ارزانتر شدن محصولات API و دسترسی پایدارتر برای دانشآموزان، توسعهدهندگان، پژوهشگران و کسبوکارها منجر شود.




