CoreTech

پلتفرم اختصاصی هوش‌مصنوعی NVIDIA Rubin با افزایش قدرت پنج برابر رونمایی شد

ابوالفضل | ۴ ماه پیش

انویدیا به‌طور رسمی از پلتفرم هوش مصنوعی NVIDIA Rubin رونمایی کرد؛ معماری‌ای که به‌عنوان پایه مراکز داده آینده طراحی شده و طبق اعلام شرکت، نسبت به Blackwell تا پنج برابر توان پردازشی بیشتری ارائه می‌دهد. Rubin ادامه مسیر راهبردی انویدیا در توسعه زیرساخت‌های هوش مصنوعی است و با تمرکز بر مقیاس‌پذیری، کارایی عملیاتی و کاهش هزینه پردازش در محیط‌های دیتاسنتری معرفی شده است.

معرفی انویدیا روبین برخلاف پیش‌بینی‌ها پیش از رویداد GTC انجام شد و هم‌زمان با موج اخبار حوزه هوش مصنوعی صورت گرفت. این اقدام در شرایطی انجام شد که رقابت میان ارائه‌دهندگان زیرساخت AI به اوج رسیده و مشتریان سازمانی نیازمند شفافیت درباره نقشه راه نسل بعدی محصولات هستند. انویدیا با این معرفی مسیر توسعه آتی خود را زودتر از موعد مشخص کرد.

پلتفرم NVIDIA Rubin از شش تراشه مستقل تشکیل شده که همگی مرحله تولید را پشت سر گذاشته و اکنون در فاز تست نهایی قرار دارند. این مجموعه شامل GPU Rubin با ۳۳۶ میلیارد ترانزیستور، CPU Vera با ۲۲۷ میلیارد ترانزیستور، NVLink 6 Switch، تراشه‌های شبکه ConnectX 9 و BlueField 4 و راهکار فوتونیک سیلیکونی Spectrum X 102.4T است.

این اجزای سخت‌افزاری در قالب سیستم‌های DGX، HGX و MGX به‌کار گرفته می‌شوند و هسته مرکزی آن‌ها سوپرچیپ Vera Rubin است. این سوپرچیپ از دو پردازنده گرافیکی Rubin، یک پردازنده مرکزی Vera و ترکیبی از حافظه‌های HBM4 و LPDDR5X تشکیل شده و برای مدیریت بارهای سنگین هوش مصنوعی در مقیاس رک و دیتاسنتر طراحی شده است.

پردازنده گرافیکی Rubin به‌طور اختصاصی برای پردازش‌های هوش مصنوعی توسعه یافته و از دو دای بزرگ در ابعاد رتیکل بهره می‌برد. این GPU توان استنتاج ۵۰ پتافلاپس و توان آموزش ۳۵ پتافلاپس مبتنی بر NVFP4 ارائه می‌دهد. حافظه HBM4 پهنای باندی تا ۲۲ ترابایت‌برثانیه فراهم می‌کند و ارتباط NVLink به ۳.۶ ترابایت‌برثانیه به‌ازای هر CPU می‌رسد.

پردازنده مرکزی Vera بر پایه معماری سفارشی آرم با نام Olympus توسعه یافته و دارای ۸۸ هسته و ۱۷۶ رشته پردازشی با پشتیبانی از Spatial Multi Threading است. این CPU از اتصال NVLink C2C، حداکثر ۱.۵ ترابایت حافظه سیستمی و پهنای باند ۱.۲ ترابایت‌برثانیه با LPDDR5X پشتیبانی می‌کند و عملکرد پردازش داده و CI/CD را دو برابر Grace افزایش می‌دهد.

شبکه داخلی پلتفرم NVIDIA Rubin توسط سوییچ‌های NVLink 6 Switch تأمین می‌شود که پهنای باند همه‌به‌همه ۳.۶ ترابایت‌برثانیه به‌ازای هر CPU و مجموع ۲۸.۸ ترابایت‌برثانیه ارائه می‌دهند. این سوییچ‌ها دارای توان پردازشی FP8 درون‌شبکه‌ای هستند و به‌طور کامل از خنک‌کاری مایع استفاده می‌کنند تا پایداری در مقیاس بزرگ حفظ شود.

در لایه ارتباطات بیرونی، ConnectX 9 SuperNIC و BlueField 4 نقش کلیدی دارند. ConnectX 9 پهنای باند ۱.۶ ترابایت‌برثانیه، RDMA قابل برنامه‌ریزی و مسیر داده شتاب‌یافته ارائه می‌دهد. BlueField 4 با پردازنده Grace ۶۴ هسته‌ای، توان شبکه را دو برابر، توان محاسباتی را شش برابر و پهنای باند حافظه را سه برابر نسل قبل افزایش می‌دهد.

تمام این اجزا در رک Vera Rubin NVL72 تجمیع شده‌اند که نسبت به Blackwell جهش‌هایی شامل ۳.۶ اگزافلاپس توان استنتاج، ۲.۵ اگزافلاپس توان آموزش، افزایش ظرفیت حافظه‌های LPDDR5X و HBM4 و دو برابر شدن پهنای باند Scale Up را ارائه می‌دهد. این رک‌ها پایه اصلی سوپرکامپیوترهای هوش مصنوعی نسل جدید انویدیا محسوب می‌شوند.

انویدیا همچنین از Spectrum X Ethernet با اپتیک هم‌بسته رونمایی کرده که زیرساخت ارتباطی ۱۰۲.۴ ترابیت‌برثانیه فراهم می‌کند. در کنار آن، پلتفرم Inference Context Memory Storage برای استنتاج در مقیاس بسیار بزرگ معرفی شده که با Dynamo، NIXL و DOCA یکپارچه است. انویدیا روبین در قالب DGX SuperPOD و DGX Rubin NVL8 عرضه می‌شود و هزینه استنتاج را تا ده برابر کاهش می‌دهد.

منبع

ابوالفضل | ۴ ماه پیش

دیدگاهتان را بنویسید