خوان لوپز

خوان لوپز، بخش چین CEFMA

در یک روز به ظاهر عادی، 18 سپتامبر 2025، فصل جدیدی در رقابت جهانی قدرت محاسباتی هوش مصنوعی و نبرد فناوری چین و آمریکا آغاز شد.

کنفرانس Huawei Connect 2025 با موضوع «هوش کامل» در شانگهای آغاز شد و هوش مصنوعی را در سه بعد: استراتژی، فناوری و اکوسیستم‌ها بررسی می‌کند. این یک لحظه تاریخی بود که هواوی رسماً تسلط کامل خود را بر انویدیا از نظر قدرت محاسباتی ابرگره‌ها، ظرفیت حافظه و پهنای باند اتصال، و همچنین تسلط خود را بر خوشه محاسباتی xAI شرکت هوش مصنوعی ایلان ماسک از نظر اندازه خوشه ابرگره‌ها و قدرت محاسباتی اعلام کرد.

در دوران پس از قانون مور [1]، با ورود رقابت جهانی در هوش مصنوعی به مرحله‌ای جدید، پارادایم زیرساخت هوش مصنوعی بازتعریف می‌شود؛ قدرت محاسباتی دیگر فقط یک مسئله فنی نیست، بلکه یک منبع استراتژیک ملی است.

از یک سو، کند شدن قانون مور منجر به بهبود حاشیه‌ای کاهشی در عملکرد تراشه شده است؛ از سوی دیگر، رشد تصاعدی قدرت محاسباتی مورد نیاز مدل‌های بزرگ، صنعت را مجبور به کاوش مسیرهای معماری جدید کرده است.

ایالات متحده، با بهره‌گیری از تسلط GPUهای انویدیا در آموزش هوش مصنوعی، مدت‌هاست که بر چشم‌انداز محاسباتی جهانی تسلط داشته است. با این حال، به دلیل محدودیت‌ها در ساخت تراشه‌های پیشرفته، چین با یک چالش حیاتی روبرو است: توسعه یک سیستم محاسباتی پایدار، خودکفا و قابل کنترل. چین شرکت‌های فناوری این کشور را به ارتقاء در زنجیره ارزش ترغیب کرده و نوآوری مستقل خود را تسریع می‌بخشد. مدل «ابرگره + خوشه» هواوی رقابتی متمایز در برابر TPU Pods گوگل و خوشه‌های Trainium آمازون ارائه می‌دهد.

برای اولین بار نقشه راه سه ساله تراشه Ascend عمومی می‌شود. دو روز قبل، در 16 سپتامبر، هواوی ده روند اصلی خود را در فناوری هوشمند برای دهه آینده منتشر کرد.

روند 1. حرکت به سمت فیزیکی: مسیر ضروری به سمت IAG

روند 2. عوامل هوش مصنوعی: پیشبرد یک انقلاب صنعتی به عنوان ابزار و شریک در تصمیم‌گیری

روند 3. برنامه‌نویسی انسان-هوش مصنوعی: تغییر آینده نرم‌افزار

روند 4. تکامل ابعادی هوش مصنوعی در دنیای آینه: فعال‌سازی تعاملات جدید و تجربیات غوطه‌ور

روند 5. اینترنت موبایل: از برنامه‌های مستقل تا همکاری بین چند عامل

روند 6. هوش مصنوعی تعبیه‌شده: پر کردن شکاف‌ها برای ایجاد صنایع تریلیون دلاری

روند 7. فراتر از معماری فون نویمان: بازاندیشی در محاسبات برای پاسخگویی به تقاضای بی‌نهایت

روند 8. داده‌ها به عنوان هوش: تغییرات پارادایم در ذخیره‌سازی با هوش مصنوعی عامل

روند 9. اینترنت عامل‌گرا: یک واسطه برای تعامل هوشمند بین قلمروهای فیزیکی و دیجیتال

روند 10. توکن‌سازی انرژی: یک سیستم عصبی انرژی هوشمند

هفتمین روند نشان می‌دهد که تا سال 2035، کل قدرت محاسباتی 100,000 برابر افزایش خواهد یافت و باعث رونق فناوری‌های جدید می‌شود. در سخنرانی خود در تاریخ 18، رئیس دوره‌ای هواوی، شو ژیجون، صراحتاً اعلام کرد: «قدرت محاسباتی همیشه کلید هوش مصنوعی بوده و خواهد بود، و حتی بیشتر از آن، کلید هوش مصنوعی چین است.»

این مسیر استفاده از یکپارچه‌سازی سیستم‌ها و نوآوری معماری برای جبران کاستی‌های تولید، در دوران پس از مور به یک جهت مهم تبدیل شده است. اریک شو، معاون هیئت مدیره و رئیس دوره‌ای هواوی،کنفرانسی با عنوان «اتصال نوآورانه SuperPoD: پیشگام یک پارادایم جدید برای زیرساخت هوش مصنوعی» ارائه کرد و قدرتمندترین SuperPoDها و SuperClusterها را در جهان معرفی نمود.

تراشه Ascend

بر این اساس، هواوی از طریق تلاش‌های مستمر، معماری و محصولات، پاسخی سیستماتیک به مسیر زیرساخت هوش مصنوعی داخلی داده است. در این کنفرانس، خو ژیجون برای اولین بار برنامه توسعه آینده تراشه‌های هوش مصنوعی Ascend را اعلام کرد، انتظار می‌رود تراشه Ascend 950PR در سه‌ماهه اول 2026، Ascend 950DT در سه‌ماهه چهارم، تراشه Ascend 960 در سه‌ماهه چهارم 2027 و تراشه Ascend 970 در سه‌ماهه چهارم 2028 عرضه شود.

هواوی Ascend به ندرت پیشرفت تراشه Ascend خود را فاش می‌کند، و این اولین بار است که خو ژیجون در 6 سال گذشته در مورد پیشرفت تراشه صحبت می‌کند. این جدول زمانی روشن، سرمایه‌گذاری بلندمدت و رویکرد استراتژیک هواوی در تحقیق و توسعه تراشه‌های هوش مصنوعی را منعکس و نشان می‌دهد.

از زمان عرضه در سال 2019، سری تراشه‌های Ascend به یک عامل کلیدی برای صنعت هوش مصنوعی چین تبدیل شده است. به ویژه پس از اینکه ایالات متحده کنترل‌های صادراتی برای تراشه‌های هوش مصنوعی به چین را اعمال کرد، Ascend 910B به جایگزین اصلی پردازنده‌های A100/H100 انویدیا در چین تبدیل شده و به طور گسترده در مراکز محاسبات هوشمند و سناریوهای آموزش مدل در مقیاس بزرگ استفاده می‌شود.

محصولات جدیدی که این بار معرفی شدند، از جمله 950PR و 950DT، مسیر تکراری معماری Ascend را ادامه می‌دهند. 950PR از فناوری حافظه با پهنای باند بالا (HBM) توسعه یافته توسط هواوی استفاده خواهد کرد که یک پیشرفت تکنولوژیکی برای هواوی در زمینه‌های کلیدی مانند ذخیره‌سازی و بسته‌بندی محسوب می‌شود.

تفاوت در موقعیت‌یابی این است که 950PR در عملکرد پیش‌بارگذاری (مرحله پیش‌بارگذاری داده‌ها)[2] تخصص دارد که یک مرحله کلیدی در فرآیند استدلال هوش مصنوعی است؛ 950DT بر بهبود عملکرد رمزگشایی استدلال، عملکرد آموزش و بهبود ظرفیت حافظه و پهنای باند تمرکز دارد.

خو ژیجون اظهار داشت که Ascend 960 در چندین مشخصه مانند قدرت پردازش، پهنای باند دسترسی به حافظه، ظرفیت حافظه و تعداد پورت‌های اتصال، دو برابر Ascend 950 است. در ابتدا، از کارت‌های گرافیک استاندارد و سرورهای سوپرنود پشتیبانی خواهد کرد و در سه‌ماهه چهارم 2027 عرضه خواهد شد. Ascend 970، در مقایسه با Ascend 960، قدرت پردازش FP8 و پهنای باند اتصال خود را دو برابر خواهد کرد، با افزایش حداقل 1.5 برابری در پهنای باند دسترسی به حافظه. عرضه آن برای سه‌ماهه چهارم 2028 برنامه‌ریزی شده است.

اریک خو اظهار داشت: «ما معتقدیم که تنها با تکیه بر فناوری SuperPod و خوشه‌ها می‌توانیم در محدودیت‌هایی که در فناوری فرآیند ساخت تراشه با آن روبرو هستیم، پیشرفت بزرگی داشته باشیم و پشتیبانی محاسباتی بی‌پایانی را برای توسعه هوش مصنوعی کشورمان فراهم کنیم.»

بازتعریف پارادایم زیرساخت هوش مصنوعی: سوپرنودها + خوشه‌ها

کاهش سرعت قانون مور منجر به بهبود حاشیه‌ای کاهشی در عملکرد تراشه شده است؛ از سوی دیگر، رشد تصاعدی قدرت محاسباتی مورد نیاز مدل‌های بزرگ، صنعت را مجبور به کشف مسیرهای معماری جدید کرده است.

با توجه به واقعیت عملکرد محدود یک تراشه واحد، هواوی تصمیم گرفت در سطح معماری سیستم نوآوری کند: SuperPoDهای بزرگتر، تراشه‌های اختصاصی و چرخه‌های سالانه. هواوی با تکیه بر فرآیندهای ساخت تراشه موجود، در نوآوری در فناوری‌های محاسبات، ذخیره‌سازی و شبکه همکاری کرده است تا یک معماری محاسباتی و راه‌حل قدرت محاسباتی با سیستم «سوپرنود + خوشه» ایجاد کند. این راه‌حل شکاف عملکرد بین تراشه‌های منفرد را کاهش می‌دهد،جهشی در قدرت محاسباتی کلی ایجاد می‌کند و پارادایم زیرساخت هوش مصنوعی را بازتعریف می‌کند.

الف) خو ژیجون اظهار داشت که از منظر فنی ساخت زیرساخت‌های محاسباتی هوش مصنوعی در مقیاس بزرگ، ابرگره‌ها به فرمت محصول غالب تبدیل شده‌اند و در حال تبدیل شدن به هنجار جدید در ساخت زیرساخت‌های هوش مصنوعی هستند.

یک ابرگره اساساً یک کامپیوتر است که قادر به یادگیری، تفکر و استدلال است، از نظر فیزیکی از چندین ماشین تشکیل شده است، اما از نظر منطقی، به عنوان یک سیستم واحد یادگیری ماشینی، تفکر و استدلال عمل می‌کند. در مارس سال جاری، هواوی رسماً ابرگره اطلس 900 را معرفی کرد که از 384 کارت پشتیبانی می‌کند و حداکثر قدرت محاسباتی 300 PFLOPS را دارد.

ابرگره‌های Atlas 950 SuperPoD و Atlas 960 SuperPoD که این بار معرفی شدند، به ترتیب از 8192 و 15488 کارت شتاب‌دهنده هوش مصنوعی Ascend پشتیبانی می‌کنند. آنها در شاخص‌های کلیدی مانند اندازه کارت، کل قدرت پردازش، ظرفیت حافظه و پهنای باند اتصال پیشرو هستند. حتی برای سال‌های متمادی به قدرتمندترین ابرگره‌های جهان تبدیل خواهند شد. یک ابرگره Atlas 950 با پیکربندی کامل شامل 128 کابینت محاسباتی و 32 کابینت اتصال است که در مجموع 160 کابینت و مساحتی در حدود 1000 متر مربع را شامل می‌شود. اتصال بین کابینت‌ها به طور کامل از طریق فیبر نوری انجام می‌شود. قدرت محاسباتی FP8 می‌تواند به 8 اگزافلاپ برسد، در حالی که FP4 به 16 اگزافلاپ می‌رسد.

یک سطح بالاتر، Atlas 960 SuperPoD قرار دارد که برای سه ماهه چهارم سال 2027 برنامه‌ریزی شده است. این سیستم عملاً مشخصات را دو برابر می‌کند: تا 15488 کارت شتاب‌دهنده هوش مصنوعی، 9630 EFLOPS در FP8 و 60 EFLOPS در FP4، با 4460 ترابایت حافظه و 34 PB/s اتصال داخلی طبق گفته شرکت.

در مقایسه با NVL144 انویدیا که قرار است در نیمه دوم سال 2026 عرضه شود، کارت ابرگره Atlas 950 56.8 برابر بزرگتر است، با 6.7 برابر کل قدرت پردازش، 15 برابر ظرفیت حافظه (تا 1152 ترابایت) و 62 برابر پهنای باند اتصال (تا 16.3 PB/s). حتی در مقایسه با NVL576 انویدیا که قرار است در سال 2027 عرضه شود، کارت ابرگره Atlas 950 همچنان در همه جنبه‌ها پیشرو است. هدف روشن است: خودمختاری و قدرت محاسباتی برای رقابت بدون وابستگی به فناوری آمریکایی.

خو ژیجون اظهار داشت که پهنای باند اتصال به 16 PB/s رسیده است. این رقم به این معنی است که کل پهنای باند اتصال Atlas 950 به تنهایی بیش از ده برابر حداکثر پهنای باند اینترنت جهانی فعلی است.

ب) خوشه‌های ابرگره

هواوی به طور همزمان دو محصول را معرفی کرد: Atlas 950 SuperCluster و Atlas 960 SuperCluster، با قدرت پردازشی که به ترتیب از 500000 کارت فراتر رفته و به یک میلیون کارت می‌رسد، که آنها را به قدرتمندترین خوشه‌های پردازشی در جهان تبدیل می‌کند.

خو ژیجون گفت که خوشه Atlas 950 SuperCluster 2.5 برابر اندازه و 1.3 برابر قدرت محاسباتی xAI Colossus، بزرگترین خوشه جهان را دارد، که آن را به قدرتمندترین خوشه محاسباتی در جهان تبدیل می‌کند.

او گفت که چه وظایف فعلی آموزش مدل‌های بزرگ با صدها میلیارد داده متراکم و پراکنده، یا آموزش آینده مدل‌های بزرگ با تریلیون‌ها یا ده‌ها تریلیون داده، خوشه‌های ابرگره می‌توانند به یک پایه قدرت محاسباتی با کارایی بالا برای پشتیبانی کارآمد و پایدار از نوآوری مداوم در هوش مصنوعی تبدیل شوند.

شکستن گلوگاه در انتقال قدرت محاسباتی هوش مصنوعی

تا به امروز، چالش اصلی خوشه‌های محاسباتی در مقیاس بزرگ در اتصال از راه دور بین چندین کابینت نهفته است،یک مانع بزرگ برای زیرساخت‌های محاسبات هوش مصنوعی است. به طور خاص، محدودیت‌های فیزیکی فناوری کابل موجود (هم نوری و هم مسی) برای اتصال مقادیر زیادی از تراشه‌ها و SuperPoD در فواصل طولانی، ضمن حفظ اتصال قابل اعتماد، با سرعت بالا و تأخیر کم.

معماری‌های شبکه سنتی برای برآورده کردن الزامات تبادل داده با تأخیر کم و پهنای باند بالا بین ابرگره‌ها با مشکل مواجه هستند. برای رفع این مشکل، هواوی تجربه خود را در زمینه اتصال در طول سه دهه گذشته در فناوری ارتباطات بهبود بخشیده، دستگاه‌های نوری، ماژول‌های نوری و تراشه‌های اتصال را بازتعریف و طراحی کرده است، که قابلیت اطمینان اتصال نوری را صد برابر افزایش داده و فاصله اتصال را به بیش از 200 متر گسترش داده است. هواوی UnifiedBus، پروتکل اتصال طراحی شده برای SuperPoDها و SuperClusterها را راه‌اندازی کرده است که امکان گسترش عظیم محاسبات را فراهم می‌کند.

اریک شو همچنین مشخصات فنی UnifiedBus 2.0 را به نمایش گذاشت، با این امید که شرکای صنعتی این پروتکل را برای توسعه محصولات و اجزای بیشتر مبتنی بر UnifiedBus و ایجاد مشترک یک اکوسیستم باز بپذیرند. او در کنفرانس Huawei Connect 2025 اظهار داشت: «SuperPoDها و SuperClusterهای مبتنی بر UnifiedBus پاسخ ما به تقاضای رو به رشد برای محاسبات، هم در حال حاضر و هم در آینده هستند. هدف ما ادامه پیشرفت‌ها در هوش مصنوعی برای ایجاد ارزش بیشتر است.»

هواوی از باز کردن مشخصات فنی پروتکل اتصال Lingqu 2.0 برای رفع تنگناها و دستیابی به یکپارچگی عمیق منابع محاسباتی، ذخیره‌سازی و شبکه، که به طور قابل توجهی کارایی سیستم را بهبود می‌بخشد، خبر داد. از طریق نوآوری سیستماتیک، هواوی مکانیزم‌های قابلیت اطمینان بالا را در لایه‌های فیزیکی، پیوند داده، شبکه و انتقال پروتکل اتصال معرفی کرده است. در عین حال، از نظر پهنای باند بالا و تأخیر کم، بر اساس تجمیع چند پورت و فناوری بسته‌بندی با آب‌بندی بالا، و همچنین یک معماری یکسان و پروتکل‌های یکپارچه، هواوی به پهنای باند فوق‌العاده بزرگ در سطح ترابایت و تأخیر فوق‌العاده کم 2.1 میکروثانیه دست یافته است. این پیشرفت‌های تکنولوژیکی به هواوی امکان می‌دهد تا ده‌ها هزار تراشه را در یک کل یکپارچه کند و به ابرگره‌ها اجازه می‌دهد تا مانند «یک کامپیوتر» کار کنند، یاد بگیرند، فکر کنند و استدلال کنند.

این اقدام با هدف شکستن انحصار آمریکا بر فناوری اینترنت پرسرعت و ایجاد استانداردهای زیرساخت هوش مصنوعی مستقل از چین است.

اریک شو بارها بر اهمیت «قدرت محاسباتی پایدار» تأکید کرده است. این شامل نه تنها تأمین سخت‌افزار، بلکه اکوسیستم نرم‌افزاری، پشتیبانی از توسعه‌دهندگان و انطباق با سناریوهای کاربردی است تا Ascend واقعاً جایگزین اکوسیستم CUDA انویدیا شود.

در عین حال، هواوی ادعا می‌کند که «همه شرکت‌ها نیازی به توسعه ظرفیت پردازش هوش مصنوعی در مقیاس بزرگ ندارند» و از تطبیق مقیاس مدل با نیازها حمایت می‌کند. از مدل‌های میلیاردها پارامتری برای استنتاج روی دستگاه تا صدها میلیارد پارامتر که از وظایف پیچیده PLN [3] پشتیبانی می‌کنند، شرکت‌ها باید راه‌حل مناسب را بر اساس سناریوهای کسب‌وکار خود انتخاب کنند. این رویکرد به جلوگیری از هدر رفتن منابع و ترویج توسعه منطقی برنامه‌های هوش مصنوعی کمک می‌کند.

سخنرانی شو ژیجون هم بیانیه‌ای از استراتژی هواوی و هم بازتابی از مسیر چین به سوی توسعه هوش مصنوعی بود. در بستر رقابت فزاینده فناوری جهانی، هواوی در حال ساخت مسیری به سوی قدرت محاسباتی هوش مصنوعی مستقل و قابل کنترل از طریق نوآوری جامع در تراشه‌ها، معماری،اتصال و اکوسیستم‌ها.

صعود در مقیاس ارزش جهانی

هواوی همچنین برنامه جدید ACT خود را معرفی کرد که یک استراتژی نوآورانه در زمینه ذخیره‌سازی داده، محاسبات و شبکه‌ها را با محصولات یکپارچه برای تسهیل پذیرش هوش مصنوعی در محیط کسب‌وکار حفظ می‌کند. این برنامه شامل سه مرحله است: ارزیابی سناریوهای با ارزش تجاری بالا با استفاده از یک چارچوب اختصاصی، کالیبره کردن مدل‌های هوش مصنوعی با داده‌های بخش‌های مختلف، و تبدیل عملیات با عوامل هوش مصنوعی مقیاس‌پذیر.

لئو چن، معاون ارشد، گفت: «هواوی سناریوهای با ارزش بالا را با استفاده از چارچوب ارزیابی سناریوهای هوش مصنوعی خود برای ارزیابی ارزش تجاری، بلوغ سناریو و یکپارچگی بین شرکت‌ها و فناوری ارزیابی می‌کند.» او 9 راه‌حل توسعه‌یافته با همکاری شرکای خود را معرفی کرد که برای بخش‌هایی مانند شهرهای هوشمند، آزمایشگاه‌های کامپیوتری، فناوری پزشکی، بانکداری، تولید، لجستیک، توزیع، نفت و گاز، و پیش‌بینی دما در کارخانه‌های فولاد طراحی شده‌اند.

راهی پر از چالش‌ها، اما مسیر روشن است: شکستن موانع خارجی با نوآوری سیستماتیک، گردآوری هم‌افزایی‌های صنعتی با یک اکوسیستم باز و ارائه پشتیبانی قوی برای آینده هوش مصنوعی چین.

[1] قانون مور، که توسط گوردون مور، یکی از بنیانگذاران اینتل، در سال 1965 فرموله شد، بیان می‌کند که تعداد ترانزیستورها در یک مدار مجتمع تقریباً هر دو سال دو برابر می‌شود، که منجر به رشد نمایی قدرت محاسباتی می‌شود.

[2] مدل‌های زبان بزرگ (LLM) متن را در یک فرآیند دو مرحله‌ای تولید می‌کنند: «prefill» که در آن توکن‌های درخواست ورودی به صورت موازی پردازش می‌شوند، و «decoding» که در آن متن یک توکن در هر زمان به صورت خودرگرسیو تولید می‌شود. هر توکن تولید شده به ورودی اضافه می‌شود و برای تولید توکن بعدی به مدل بازگردانده می‌شود. تولید زمانی متوقف می‌شود که LLM یک توکن توقف خاص را تولید کند یا زمانی که یک شرط تعریف شده توسط کاربر برآورده شود.

[3] PLN: پردازش زبان طبیعی که از یادگیری ماشین برای امکان‌پذیر ساختن درک و ارتباط کامپیوترها با زبان انسانی استفاده می‌کند.