
خوان لوپز
خوان لوپز، بخش چین CEFMA
در یک روز به ظاهر عادی، 18 سپتامبر 2025، فصل جدیدی در رقابت جهانی قدرت محاسباتی هوش مصنوعی و نبرد فناوری چین و آمریکا آغاز شد.
کنفرانس Huawei Connect 2025 با موضوع «هوش کامل» در شانگهای آغاز شد و هوش مصنوعی را در سه بعد: استراتژی، فناوری و اکوسیستمها بررسی میکند. این یک لحظه تاریخی بود که هواوی رسماً تسلط کامل خود را بر انویدیا از نظر قدرت محاسباتی ابرگرهها، ظرفیت حافظه و پهنای باند اتصال، و همچنین تسلط خود را بر خوشه محاسباتی xAI شرکت هوش مصنوعی ایلان ماسک از نظر اندازه خوشه ابرگرهها و قدرت محاسباتی اعلام کرد.
در دوران پس از قانون مور [1]، با ورود رقابت جهانی در هوش مصنوعی به مرحلهای جدید، پارادایم زیرساخت هوش مصنوعی بازتعریف میشود؛ قدرت محاسباتی دیگر فقط یک مسئله فنی نیست، بلکه یک منبع استراتژیک ملی است.
از یک سو، کند شدن قانون مور منجر به بهبود حاشیهای کاهشی در عملکرد تراشه شده است؛ از سوی دیگر، رشد تصاعدی قدرت محاسباتی مورد نیاز مدلهای بزرگ، صنعت را مجبور به کاوش مسیرهای معماری جدید کرده است.
ایالات متحده، با بهرهگیری از تسلط GPUهای انویدیا در آموزش هوش مصنوعی، مدتهاست که بر چشمانداز محاسباتی جهانی تسلط داشته است. با این حال، به دلیل محدودیتها در ساخت تراشههای پیشرفته، چین با یک چالش حیاتی روبرو است: توسعه یک سیستم محاسباتی پایدار، خودکفا و قابل کنترل. چین شرکتهای فناوری این کشور را به ارتقاء در زنجیره ارزش ترغیب کرده و نوآوری مستقل خود را تسریع میبخشد. مدل «ابرگره + خوشه» هواوی رقابتی متمایز در برابر TPU Pods گوگل و خوشههای Trainium آمازون ارائه میدهد.
برای اولین بار نقشه راه سه ساله تراشه Ascend عمومی میشود. دو روز قبل، در 16 سپتامبر، هواوی ده روند اصلی خود را در فناوری هوشمند برای دهه آینده منتشر کرد.
روند 1. حرکت به سمت فیزیکی: مسیر ضروری به سمت IAG
روند 2. عوامل هوش مصنوعی: پیشبرد یک انقلاب صنعتی به عنوان ابزار و شریک در تصمیمگیری
روند 3. برنامهنویسی انسان-هوش مصنوعی: تغییر آینده نرمافزار
روند 4. تکامل ابعادی هوش مصنوعی در دنیای آینه: فعالسازی تعاملات جدید و تجربیات غوطهور
روند 5. اینترنت موبایل: از برنامههای مستقل تا همکاری بین چند عامل
روند 6. هوش مصنوعی تعبیهشده: پر کردن شکافها برای ایجاد صنایع تریلیون دلاری
روند 7. فراتر از معماری فون نویمان: بازاندیشی در محاسبات برای پاسخگویی به تقاضای بینهایت
روند 8. دادهها به عنوان هوش: تغییرات پارادایم در ذخیرهسازی با هوش مصنوعی عامل
روند 9. اینترنت عاملگرا: یک واسطه برای تعامل هوشمند بین قلمروهای فیزیکی و دیجیتال
روند 10. توکنسازی انرژی: یک سیستم عصبی انرژی هوشمند
هفتمین روند نشان میدهد که تا سال 2035، کل قدرت محاسباتی 100,000 برابر افزایش خواهد یافت و باعث رونق فناوریهای جدید میشود. در سخنرانی خود در تاریخ 18، رئیس دورهای هواوی، شو ژیجون، صراحتاً اعلام کرد: «قدرت محاسباتی همیشه کلید هوش مصنوعی بوده و خواهد بود، و حتی بیشتر از آن، کلید هوش مصنوعی چین است.»
این مسیر استفاده از یکپارچهسازی سیستمها و نوآوری معماری برای جبران کاستیهای تولید، در دوران پس از مور به یک جهت مهم تبدیل شده است. اریک شو، معاون هیئت مدیره و رئیس دورهای هواوی،کنفرانسی با عنوان «اتصال نوآورانه SuperPoD: پیشگام یک پارادایم جدید برای زیرساخت هوش مصنوعی» ارائه کرد و قدرتمندترین SuperPoDها و SuperClusterها را در جهان معرفی نمود.
تراشه Ascend
بر این اساس، هواوی از طریق تلاشهای مستمر، معماری و محصولات، پاسخی سیستماتیک به مسیر زیرساخت هوش مصنوعی داخلی داده است. در این کنفرانس، خو ژیجون برای اولین بار برنامه توسعه آینده تراشههای هوش مصنوعی Ascend را اعلام کرد، انتظار میرود تراشه Ascend 950PR در سهماهه اول 2026، Ascend 950DT در سهماهه چهارم، تراشه Ascend 960 در سهماهه چهارم 2027 و تراشه Ascend 970 در سهماهه چهارم 2028 عرضه شود.
هواوی Ascend به ندرت پیشرفت تراشه Ascend خود را فاش میکند، و این اولین بار است که خو ژیجون در 6 سال گذشته در مورد پیشرفت تراشه صحبت میکند. این جدول زمانی روشن، سرمایهگذاری بلندمدت و رویکرد استراتژیک هواوی در تحقیق و توسعه تراشههای هوش مصنوعی را منعکس و نشان میدهد.
از زمان عرضه در سال 2019، سری تراشههای Ascend به یک عامل کلیدی برای صنعت هوش مصنوعی چین تبدیل شده است. به ویژه پس از اینکه ایالات متحده کنترلهای صادراتی برای تراشههای هوش مصنوعی به چین را اعمال کرد، Ascend 910B به جایگزین اصلی پردازندههای A100/H100 انویدیا در چین تبدیل شده و به طور گسترده در مراکز محاسبات هوشمند و سناریوهای آموزش مدل در مقیاس بزرگ استفاده میشود.
محصولات جدیدی که این بار معرفی شدند، از جمله 950PR و 950DT، مسیر تکراری معماری Ascend را ادامه میدهند. 950PR از فناوری حافظه با پهنای باند بالا (HBM) توسعه یافته توسط هواوی استفاده خواهد کرد که یک پیشرفت تکنولوژیکی برای هواوی در زمینههای کلیدی مانند ذخیرهسازی و بستهبندی محسوب میشود.
تفاوت در موقعیتیابی این است که 950PR در عملکرد پیشبارگذاری (مرحله پیشبارگذاری دادهها)[2] تخصص دارد که یک مرحله کلیدی در فرآیند استدلال هوش مصنوعی است؛ 950DT بر بهبود عملکرد رمزگشایی استدلال، عملکرد آموزش و بهبود ظرفیت حافظه و پهنای باند تمرکز دارد.
خو ژیجون اظهار داشت که Ascend 960 در چندین مشخصه مانند قدرت پردازش، پهنای باند دسترسی به حافظه، ظرفیت حافظه و تعداد پورتهای اتصال، دو برابر Ascend 950 است. در ابتدا، از کارتهای گرافیک استاندارد و سرورهای سوپرنود پشتیبانی خواهد کرد و در سهماهه چهارم 2027 عرضه خواهد شد. Ascend 970، در مقایسه با Ascend 960، قدرت پردازش FP8 و پهنای باند اتصال خود را دو برابر خواهد کرد، با افزایش حداقل 1.5 برابری در پهنای باند دسترسی به حافظه. عرضه آن برای سهماهه چهارم 2028 برنامهریزی شده است.
اریک خو اظهار داشت: «ما معتقدیم که تنها با تکیه بر فناوری SuperPod و خوشهها میتوانیم در محدودیتهایی که در فناوری فرآیند ساخت تراشه با آن روبرو هستیم، پیشرفت بزرگی داشته باشیم و پشتیبانی محاسباتی بیپایانی را برای توسعه هوش مصنوعی کشورمان فراهم کنیم.»
بازتعریف پارادایم زیرساخت هوش مصنوعی: سوپرنودها + خوشهها
کاهش سرعت قانون مور منجر به بهبود حاشیهای کاهشی در عملکرد تراشه شده است؛ از سوی دیگر، رشد تصاعدی قدرت محاسباتی مورد نیاز مدلهای بزرگ، صنعت را مجبور به کشف مسیرهای معماری جدید کرده است.
با توجه به واقعیت عملکرد محدود یک تراشه واحد، هواوی تصمیم گرفت در سطح معماری سیستم نوآوری کند: SuperPoDهای بزرگتر، تراشههای اختصاصی و چرخههای سالانه. هواوی با تکیه بر فرآیندهای ساخت تراشه موجود، در نوآوری در فناوریهای محاسبات، ذخیرهسازی و شبکه همکاری کرده است تا یک معماری محاسباتی و راهحل قدرت محاسباتی با سیستم «سوپرنود + خوشه» ایجاد کند. این راهحل شکاف عملکرد بین تراشههای منفرد را کاهش میدهد،جهشی در قدرت محاسباتی کلی ایجاد میکند و پارادایم زیرساخت هوش مصنوعی را بازتعریف میکند.
الف) خو ژیجون اظهار داشت که از منظر فنی ساخت زیرساختهای محاسباتی هوش مصنوعی در مقیاس بزرگ، ابرگرهها به فرمت محصول غالب تبدیل شدهاند و در حال تبدیل شدن به هنجار جدید در ساخت زیرساختهای هوش مصنوعی هستند.
یک ابرگره اساساً یک کامپیوتر است که قادر به یادگیری، تفکر و استدلال است، از نظر فیزیکی از چندین ماشین تشکیل شده است، اما از نظر منطقی، به عنوان یک سیستم واحد یادگیری ماشینی، تفکر و استدلال عمل میکند. در مارس سال جاری، هواوی رسماً ابرگره اطلس 900 را معرفی کرد که از 384 کارت پشتیبانی میکند و حداکثر قدرت محاسباتی 300 PFLOPS را دارد.
ابرگرههای Atlas 950 SuperPoD و Atlas 960 SuperPoD که این بار معرفی شدند، به ترتیب از 8192 و 15488 کارت شتابدهنده هوش مصنوعی Ascend پشتیبانی میکنند. آنها در شاخصهای کلیدی مانند اندازه کارت، کل قدرت پردازش، ظرفیت حافظه و پهنای باند اتصال پیشرو هستند. حتی برای سالهای متمادی به قدرتمندترین ابرگرههای جهان تبدیل خواهند شد. یک ابرگره Atlas 950 با پیکربندی کامل شامل 128 کابینت محاسباتی و 32 کابینت اتصال است که در مجموع 160 کابینت و مساحتی در حدود 1000 متر مربع را شامل میشود. اتصال بین کابینتها به طور کامل از طریق فیبر نوری انجام میشود. قدرت محاسباتی FP8 میتواند به 8 اگزافلاپ برسد، در حالی که FP4 به 16 اگزافلاپ میرسد.
یک سطح بالاتر، Atlas 960 SuperPoD قرار دارد که برای سه ماهه چهارم سال 2027 برنامهریزی شده است. این سیستم عملاً مشخصات را دو برابر میکند: تا 15488 کارت شتابدهنده هوش مصنوعی، 9630 EFLOPS در FP8 و 60 EFLOPS در FP4، با 4460 ترابایت حافظه و 34 PB/s اتصال داخلی طبق گفته شرکت.
در مقایسه با NVL144 انویدیا که قرار است در نیمه دوم سال 2026 عرضه شود، کارت ابرگره Atlas 950 56.8 برابر بزرگتر است، با 6.7 برابر کل قدرت پردازش، 15 برابر ظرفیت حافظه (تا 1152 ترابایت) و 62 برابر پهنای باند اتصال (تا 16.3 PB/s). حتی در مقایسه با NVL576 انویدیا که قرار است در سال 2027 عرضه شود، کارت ابرگره Atlas 950 همچنان در همه جنبهها پیشرو است. هدف روشن است: خودمختاری و قدرت محاسباتی برای رقابت بدون وابستگی به فناوری آمریکایی.
خو ژیجون اظهار داشت که پهنای باند اتصال به 16 PB/s رسیده است. این رقم به این معنی است که کل پهنای باند اتصال Atlas 950 به تنهایی بیش از ده برابر حداکثر پهنای باند اینترنت جهانی فعلی است.
ب) خوشههای ابرگره
هواوی به طور همزمان دو محصول را معرفی کرد: Atlas 950 SuperCluster و Atlas 960 SuperCluster، با قدرت پردازشی که به ترتیب از 500000 کارت فراتر رفته و به یک میلیون کارت میرسد، که آنها را به قدرتمندترین خوشههای پردازشی در جهان تبدیل میکند.
خو ژیجون گفت که خوشه Atlas 950 SuperCluster 2.5 برابر اندازه و 1.3 برابر قدرت محاسباتی xAI Colossus، بزرگترین خوشه جهان را دارد، که آن را به قدرتمندترین خوشه محاسباتی در جهان تبدیل میکند.
او گفت که چه وظایف فعلی آموزش مدلهای بزرگ با صدها میلیارد داده متراکم و پراکنده، یا آموزش آینده مدلهای بزرگ با تریلیونها یا دهها تریلیون داده، خوشههای ابرگره میتوانند به یک پایه قدرت محاسباتی با کارایی بالا برای پشتیبانی کارآمد و پایدار از نوآوری مداوم در هوش مصنوعی تبدیل شوند.
شکستن گلوگاه در انتقال قدرت محاسباتی هوش مصنوعی
تا به امروز، چالش اصلی خوشههای محاسباتی در مقیاس بزرگ در اتصال از راه دور بین چندین کابینت نهفته است،یک مانع بزرگ برای زیرساختهای محاسبات هوش مصنوعی است. به طور خاص، محدودیتهای فیزیکی فناوری کابل موجود (هم نوری و هم مسی) برای اتصال مقادیر زیادی از تراشهها و SuperPoD در فواصل طولانی، ضمن حفظ اتصال قابل اعتماد، با سرعت بالا و تأخیر کم.
معماریهای شبکه سنتی برای برآورده کردن الزامات تبادل داده با تأخیر کم و پهنای باند بالا بین ابرگرهها با مشکل مواجه هستند. برای رفع این مشکل، هواوی تجربه خود را در زمینه اتصال در طول سه دهه گذشته در فناوری ارتباطات بهبود بخشیده، دستگاههای نوری، ماژولهای نوری و تراشههای اتصال را بازتعریف و طراحی کرده است، که قابلیت اطمینان اتصال نوری را صد برابر افزایش داده و فاصله اتصال را به بیش از 200 متر گسترش داده است. هواوی UnifiedBus، پروتکل اتصال طراحی شده برای SuperPoDها و SuperClusterها را راهاندازی کرده است که امکان گسترش عظیم محاسبات را فراهم میکند.
اریک شو همچنین مشخصات فنی UnifiedBus 2.0 را به نمایش گذاشت، با این امید که شرکای صنعتی این پروتکل را برای توسعه محصولات و اجزای بیشتر مبتنی بر UnifiedBus و ایجاد مشترک یک اکوسیستم باز بپذیرند. او در کنفرانس Huawei Connect 2025 اظهار داشت: «SuperPoDها و SuperClusterهای مبتنی بر UnifiedBus پاسخ ما به تقاضای رو به رشد برای محاسبات، هم در حال حاضر و هم در آینده هستند. هدف ما ادامه پیشرفتها در هوش مصنوعی برای ایجاد ارزش بیشتر است.»
هواوی از باز کردن مشخصات فنی پروتکل اتصال Lingqu 2.0 برای رفع تنگناها و دستیابی به یکپارچگی عمیق منابع محاسباتی، ذخیرهسازی و شبکه، که به طور قابل توجهی کارایی سیستم را بهبود میبخشد، خبر داد. از طریق نوآوری سیستماتیک، هواوی مکانیزمهای قابلیت اطمینان بالا را در لایههای فیزیکی، پیوند داده، شبکه و انتقال پروتکل اتصال معرفی کرده است. در عین حال، از نظر پهنای باند بالا و تأخیر کم، بر اساس تجمیع چند پورت و فناوری بستهبندی با آببندی بالا، و همچنین یک معماری یکسان و پروتکلهای یکپارچه، هواوی به پهنای باند فوقالعاده بزرگ در سطح ترابایت و تأخیر فوقالعاده کم 2.1 میکروثانیه دست یافته است. این پیشرفتهای تکنولوژیکی به هواوی امکان میدهد تا دهها هزار تراشه را در یک کل یکپارچه کند و به ابرگرهها اجازه میدهد تا مانند «یک کامپیوتر» کار کنند، یاد بگیرند، فکر کنند و استدلال کنند.
این اقدام با هدف شکستن انحصار آمریکا بر فناوری اینترنت پرسرعت و ایجاد استانداردهای زیرساخت هوش مصنوعی مستقل از چین است.
اریک شو بارها بر اهمیت «قدرت محاسباتی پایدار» تأکید کرده است. این شامل نه تنها تأمین سختافزار، بلکه اکوسیستم نرمافزاری، پشتیبانی از توسعهدهندگان و انطباق با سناریوهای کاربردی است تا Ascend واقعاً جایگزین اکوسیستم CUDA انویدیا شود.
در عین حال، هواوی ادعا میکند که «همه شرکتها نیازی به توسعه ظرفیت پردازش هوش مصنوعی در مقیاس بزرگ ندارند» و از تطبیق مقیاس مدل با نیازها حمایت میکند. از مدلهای میلیاردها پارامتری برای استنتاج روی دستگاه تا صدها میلیارد پارامتر که از وظایف پیچیده PLN [3] پشتیبانی میکنند، شرکتها باید راهحل مناسب را بر اساس سناریوهای کسبوکار خود انتخاب کنند. این رویکرد به جلوگیری از هدر رفتن منابع و ترویج توسعه منطقی برنامههای هوش مصنوعی کمک میکند.
سخنرانی شو ژیجون هم بیانیهای از استراتژی هواوی و هم بازتابی از مسیر چین به سوی توسعه هوش مصنوعی بود. در بستر رقابت فزاینده فناوری جهانی، هواوی در حال ساخت مسیری به سوی قدرت محاسباتی هوش مصنوعی مستقل و قابل کنترل از طریق نوآوری جامع در تراشهها، معماری،اتصال و اکوسیستمها.
صعود در مقیاس ارزش جهانی
هواوی همچنین برنامه جدید ACT خود را معرفی کرد که یک استراتژی نوآورانه در زمینه ذخیرهسازی داده، محاسبات و شبکهها را با محصولات یکپارچه برای تسهیل پذیرش هوش مصنوعی در محیط کسبوکار حفظ میکند. این برنامه شامل سه مرحله است: ارزیابی سناریوهای با ارزش تجاری بالا با استفاده از یک چارچوب اختصاصی، کالیبره کردن مدلهای هوش مصنوعی با دادههای بخشهای مختلف، و تبدیل عملیات با عوامل هوش مصنوعی مقیاسپذیر.
لئو چن، معاون ارشد، گفت: «هواوی سناریوهای با ارزش بالا را با استفاده از چارچوب ارزیابی سناریوهای هوش مصنوعی خود برای ارزیابی ارزش تجاری، بلوغ سناریو و یکپارچگی بین شرکتها و فناوری ارزیابی میکند.» او 9 راهحل توسعهیافته با همکاری شرکای خود را معرفی کرد که برای بخشهایی مانند شهرهای هوشمند، آزمایشگاههای کامپیوتری، فناوری پزشکی، بانکداری، تولید، لجستیک، توزیع، نفت و گاز، و پیشبینی دما در کارخانههای فولاد طراحی شدهاند.
راهی پر از چالشها، اما مسیر روشن است: شکستن موانع خارجی با نوآوری سیستماتیک، گردآوری همافزاییهای صنعتی با یک اکوسیستم باز و ارائه پشتیبانی قوی برای آینده هوش مصنوعی چین.
[1] قانون مور، که توسط گوردون مور، یکی از بنیانگذاران اینتل، در سال 1965 فرموله شد، بیان میکند که تعداد ترانزیستورها در یک مدار مجتمع تقریباً هر دو سال دو برابر میشود، که منجر به رشد نمایی قدرت محاسباتی میشود.
[2] مدلهای زبان بزرگ (LLM) متن را در یک فرآیند دو مرحلهای تولید میکنند: «prefill» که در آن توکنهای درخواست ورودی به صورت موازی پردازش میشوند، و «decoding» که در آن متن یک توکن در هر زمان به صورت خودرگرسیو تولید میشود. هر توکن تولید شده به ورودی اضافه میشود و برای تولید توکن بعدی به مدل بازگردانده میشود. تولید زمانی متوقف میشود که LLM یک توکن توقف خاص را تولید کند یا زمانی که یک شرط تعریف شده توسط کاربر برآورده شود.
[3] PLN: پردازش زبان طبیعی که از یادگیری ماشین برای امکانپذیر ساختن درک و ارتباط کامپیوترها با زبان انسانی استفاده میکند.

