نگاه عمیق به ابرکامپیوتر هوش مصنوعی xAI Colossus ایلان ماسک

ایلان ماسک، مالک تسلا و شبکه اجتماعی ایکس، ابرکامپیوتر جدید xAI Colossus را با ۱۰۰ هزار پردازنده‌ی گرافیکی (GPU) رونمایی کرد. به‌گزارش تک‌ناک، ایلان ماسک، مدیرعامل شرکت xAI، از پروژه جدید و گران‌قیمت خود به نام ابرکامپیوتر هوش مصنوعی xAI Colossus پرده‌برداری کرده است. این ابرکامپیوتر که به‌تازگی جزئیات آن منتشر شده، به‌عنوان بزرگ‌ترین خوشه […]


ایلان ماسک، مالک تسلا و شبکه اجتماعی ایکس، ابرکامپیوتر جدید xAI Colossus را با ۱۰۰ هزار پردازنده‌ی گرافیکی (GPU) رونمایی کرد.

به‌گزارش تک‌ناک، ایلان ماسک، مدیرعامل شرکت xAI، از پروژه جدید و گران‌قیمت خود به نام ابرکامپیوتر هوش مصنوعی xAI Colossus پرده‌برداری کرده است. این ابرکامپیوتر که به‌تازگی جزئیات آن منتشر شده، به‌عنوان بزرگ‌ترین خوشه هوش مصنوعی جهان معرفی می‌شود و به آموزش مدل‌های پیچیده هوش مصنوعی شرکت ایکس اختصاص یافته است.

تامزهاردور می‌نویسد که یکی از کاربران یوتیوب با نام ServeTheHome برای اولین‌بار به سرورهای Supermicro این هیولای هوش مصنوعی با بیش از ۱۰۰ هزار واحد GPU دسترسی یافته و اطلاعات متعددی از ساختار آن منتشر کرده است. این ابرکامپیوترها تقریباً دو ماه است که آنلاین شده و فرایند مونتاژ آن پس از ۱۲۲ روز به اتمام رسیده است.

جزئیات فنی؛ شبکه‌سازی، خنک‌سازی و سیستم تأمین انرژی

ابرخوشه Colossus شامل قفسه‌هایی است که در گروه‌های هشت‌تایی قرار دارند و هر آرایه ۵۱۲ واحد GPU دارد. برای هر سرور چهار منبع تغذیه پشتیبان در نظر گرفته شده و قسمت پشتی قفسه‌ها مجهز به منابع تغذیه سه‌فاز و سوئیچ‌های Ethernet و سیستم خنک‌کننده مایع گسترده است. این خوشه متشکل از بیش از ۱,۵۰۰ قفسه GPU است که نزدیک به ۲۰۰ آرایه قفسه‌ای را تشکیل می‌دهد. به‌گفته جنسن هوانگ، مدیرعامل انویدیا، این GPUها فقط در مدت سه هفته نصب شده‌اند.

به‌دلیل نیاز پهنای باند گسترده برای خوشه‌های هوش مصنوعی که به‌طور مداوم مدل‌های خود را آموزش می‌دهند، xAI از اتصالات شبکه‌ای بسیار پیشرفته استفاده می‌کند. هر کارت گرافیکی یک NIC (کنترلر رابط شبکه) اختصاصی با سرعت 400GbE دارد. همچنین، به یک NIC اضافی 400Gb برای هر سرور مجهز است که ظرفیت اترنت هر سرور HGX H100 را به ۳/۶ ترابیت‌برثانیه می‌رساند. برخلاف اکثر ابرکامپیوترهای دیگر که از اتصالات خاص مانند InfiniBand بهره می‌برند، این خوشه به‌طور کامل به Ethernet متکی است.

همچنین، برای تغذیه این ابرکامپیوتر از باتری‌های Tesla Megapack استفاده شده است. به‌دلیل ماهیت روشن و خاموش سریع این خوشه و میلی‌ثانیه‌هایی از تأخیر میان بانک‌ها، فشار زیادی به شبکه برق و ژنراتورهای دیزلی ماسک وارد می‌شود. از‌این‌رو، باتری‌های Megapack به‌عنوان واسطه انرژی بین شبکه برق و ابررایانه قرار گرفته‌اند تا از قطعی‌های احتمالی جلوگیری کنند.

شبکه‌سازی، خنک‌سازی و سیستم تأمین انرژی Colossus
شبکه‌سازی، خنک‌سازی و سیستم تأمین انرژی Colossus

کاربرد Colossus و آینده ابررایانه‌های ماسک

به‌گفته انویدیا، ابرکامپیوتر xAI Colossus در‌حال‌حاضر بزرگ‌ترین ابرکامپیوتر هوش مصنوعی جهان محسوب می‌شود. برخلاف سایر ابرکامپیوترهای جهانی که به تحقیقات عمومی و مطالعات علمی اختصاص دارند، ابرکامپیوتر xAI Colossus به‌طور انحصاری برای آموزش مدل‌های هوش مصنوعی x کاربرد دارد. این ابرکامپیوتر روی مدل‌هایی مانند چت‌بات Grok 3 متمرکز است؛ چت‌باتی که ماسک آن را «ضد جریان غالب» توصیف کرده و در انحصار کاربران X Premium قرار داده است.

همچنین بر‌اساس گزارش‌ها، این خوشه در حال آموزش مدل‌های هوش مصنوعی پیچیده‌تری است که کاربردها و توانایی‌های آن‌ها فراتر از فناوری‌های هوش مصنوعی امروزی خواهد بود.

کاربرد Colossus و آینده ابررایانه‌های ماسک
کاربرد Colossus و آینده ابررایانه‌های ماسک

فازهای بعدی و افزایش ظرفیت پردازشی

فاز اول ساخت ابرکامپیوتر xAI Colossus به‌اتمام رسیده و خوشه به‌طور کامل آنلاین است؛ اما به‌روزرسانی‌ها به‌پایان نرسیده‌اند. به‌زودی، ابرکامپیوتر Memphis به‌منظور افزایش ظرفیت GPU خود تا دو برابر، با ۵۰ هزار واحد H100 و ۵۰ هزار واحد H200 نسل بعدی ارتقا خواهد یافت. این ارتقا مصرف برق خوشه را نیز به بیش از دو برابر افزایش خواهد داد که برای ۱۴ ژنراتور دیزلی ماسک که در ماه ژوئیه به سایت اضافه شده‌اند، چالش‌برانگیز خواهد بود.

این افزایش همچنان با وعده ماسک مبنی‌بر قرارگیری ۳۰۰ هزار واحد H200 در این خوشه فاصله دارد؛ اما ممکن است در فاز سوم ساخت به آن دست یابد. علاوه‌بر ابرکامپیوتر xAI Colossus، ماسک از پروژه‌های دیگری نیز برای توسعه هوش مصنوعی بهره می‌برد. ابرکامپیوتر Cortex با ۵۰ هزار GPU در کارخانه گیگا تگزاس تسلا، برای آموزش فناوری خودران تسلا و سایر پروژه‌های هوش مصنوعی طراحی شده است و پروژه ساخت ابرکامپیوتر Dojo نیز با بودجه ۵۰۰ میلیون دلاری در بوفالو نیویورک در دستور‌کار قرار دارد.

با پیش‌بینی‌هایی مانند اظهار‌نظر مدیرعامل بایدو، رابین لی، مبنی‌بر اینکه با ترکیدن حباب هوش مصنوعی ۹۹ درصد شرکت‌های فعال در این حوزه نابود خواهند شد، مشخص نیست که آیا سرمایه‌گذاری گسترده ایلان ماسک در این زمینه نتیجه مطلوب خواهد داشت یا خیر.



Source link