هواوي تتحدى العقوبات بمنصة حوسبة ذكاء اصطناعي بأداء أعلى من نظيرتها من Nvidia

⬤ طورت هواوي منصة CloudMatrix 384 Supernode التي تقول أنها تحقق أداء أفضل من نظيراتها من Nvidia.
⬤ يعتمد النظام على 384 معالجاً من نوع Ascend 910C من هواوي وتصميم ضوئي يحقق نطاق ترددي فائق السرعة.
⬤ تعتمد منصة هواوي تقنية أقل تقدماً من حيث استهلاك الطاقة، لكنها تقدم أداء أعلى بفضل تضمين عدد أكبر من الشرائح في المنصة.
تكريساً للصمود التقني اللافت في وجه العقوبات الأمريكية، نجحت شركة هواوي الصينية في تطوير منصة حوسبة عملاقة جديدة في مجال الذكاء الاصطناعي، تحمل اسم CloudMatrix 384 Supernode، وُصفت من قبل مصادر داخل الشركة، وفقاً لتقرير STAR Market Daily، بأنها «منتج بمستوى نووي،» في إشارة إلى قوتها الهائلة. وتمثل هذه الخطوة دفعة قوية من العملاق الصيني لمواجهة الطلب المتزايد على القدرة الحاسوبية في عصر الذكاء الاصطناعي، ومنافسة مباشرة للأنظمة المتطورة التي تقدمها شركة Nvidia الأمريكية.
جرى نشر النظام الجديد بالفعل في مراكز بيانات الشركة بمقاطعة آنهوي في الصين، ويأتي كحل على مستوى الأرفف، مصمم لتحمل الأحمال الحاسوبية الكثيفة المرتبطة بتطبيقات الذكاء الاصطناعي. ويعتمد على مبدأ «القوة الغاشمة» من حيث الحجم والعدد، كاستراتيجية فرضتها القيود التي تحد من الوصول إلى تقنيات تصنيع الشرائح المتقدمة.
يضم النظام 384 معالجاً من نوع HiSilicon Ascend 910C، من تصميم هواوي، موزعة على 16 رفاً، 12 منها مخصصة للحوسبة وتحتوي كل منها على 32 وحدة تسريع، في حين تختص الأربعة المتبقية بمعدات الربط الشبكي المتطورة.
من أبرز سمات هذا النظام اعتماده الكامل على الاتصالات الضوئية بدلاً من الأسلاك النحاسية التقليدية، إذ يستفيد من 6,912 وحدة إرسال واستقبال ضوئي لإنشاء شبكة متكاملة ومتصلة بالكامل بين الرفوف، ما يُمكّنه من تحقيق نطاق ترددي إجمالي يفوق 5.5 بيتابت في الثانية (ما يعادل 687.5 تيرابايت في الثانية)، وهو أمر بالغ الأهمية لتقليل زمن التأخير وزيادة كفاءة الأداء أثناء تدريب النماذج الذكية الضخمة.
يمنح هذا التصميم لهواوي تفوقاً ملحوظاً في النطاق الترددي، إذ يوفر سعة اتصال داخلية تفوق تلك التي تقدمها أحدث أنظمة Nvidia المماثلة بواقع 2.1 مرة، وسعة توسع خارجية أعلى بنحو 5.3 مرة.
من حيث الأداء الحوسبي، تشير تقديرات هواوي إلى أن CloudMatrix 384 قادر على توليد أداء يناهز 300 بيتافلوب من تنسيق BF16، متفوقاً بذلك على نظام GB200 NVL72 من Nvidia، الذي يقدم نحو 180 بيتافلوب فقط. كما يتفوق النظام الجديد بواقع 2.1 مرة في عرض نطاق الذاكرة الإجمالي، وبأكثر من 3.6 مرة في سعة ذاكرة HBM، رغم استخدامه معيار HBM2E الأقدم نسبياً.
لكن هذا التفوق في الأداء يأتي على حساب الكفاءة الطاقية، إذ يبلغ استهلاك الطاقة الكلي للنظام نحو 559 كيلواط، مقارنة مع 145 كيلواط فقط في نظام Nvidia GB200 NVL72، ما يعني أن نظام Huawei أقل كفاءة في استهلاك الطاقة بنحو 2.3 مرة لكل وحدة أداء.
مع ذلك، قد يكون هذا التنازل مقبولاً ضمن السوق الصينية، حيث تفرض القيود الأمريكية حظراً فعلياً على حصول الشركات الصينية على أنظمة Nvidia المتقدمة. وضمن هذا السياق، يُعتبر الأداء العالي الذي يقدمه CloudMatrix 384 بديلاً محلياً مغرياً، خاصة مع الانخفاض النسبي في أسعار الكهرباء داخل الصين.
يعتمد النظام على معالج Ascend 910C، بتصميمه ثنائي الشرائح المجزأة (Dual-Chiplet)، إلى جانب ثماني وحدات ذاكرة HBM2E، في بنية تشبه إلى حد كبير ما تقدمه شركتا AMD في معالج Instinct MI250X، وNvidia في معالج B200.
تُظهر قصة تصنيع هذه الرقاقة تعقيداً بالغاً في كيفية التفاف هواوي على العقوبات، إذ جرى تصميمها بادئ الأمر في الصين، ومع إمكانية تصنيعها وفقاً لعقدة 7 نانومتر المتقادمة لدى شركة SMIC الصينية، تشير تقارير أخرى مطلعة إلى أن تصنيع معظم وحدات المعالجة الحالية جرى في مصانع TSMC من خلال سلسلة من الوسطاء. وعلى نحو مماثل، تم الحصول على مكونات ذاكرة HBM2E من سامسونج عبر سلسلة وسطاء، ومن ثم تجميعها وإرسالها إلى الصين ليُعاد تفكيكها وتركيبها على وحدات النظام بواسطة هواوي.
بهذه الطرق، من المعتقد أن الشركة حصلت على ما يكفي لتصنيع أكثر من مليون معالج Ascend 910C خلال الفترة من 2023 وحتى 2025.
بدأ استخدام CloudMatrix 384 عملياً، حيث تتعاون هواوي حالياً مع شركة الذكاء الاصطناعي الصينية الناشئة SiliconFlow، لتشغيل نموذج التفكير المنطقي DeepSeek-R1، الذي حظي باهتمام عالمي منذ إطلاقه في يناير الماضي، ما يعكس قدرة هذا النظام المحلي على مجاراة الأنظمة المعتمدة على رقائق محظورة مثل Nvidia H100.
تأتي هذه الاستثمارات ضمن توجه أوسع في الصين نحو تعزيز القدرات السيادية في الذكاء الاصطناعي. وفي هذا السياق، أعلنت شركة Alibaba مؤخراً عن استثمار ضخم بقيمة 380 مليار يوان صيني (ما يعادل 52.4 مليار دولار أمريكي) خلال ثلاث سنوات، بهدف تطوير البنية التحتية الحاسوبية والذكاء الاصطناعي.
في المحصلة، يمثل CloudMatrix 384 Supernode شهادة جديدة على قدرة هواوي على الابتكار تحت الضغط، مقدمة منصة تدريب ذكاء اصطناعي عالية الأداء، تستند إلى مكونات محلية وتقنيات ربط ضوئي متقدمة، وتفضل القوة الحوسبية الخام على حساب الكفاءة الطاقية، ضمن استراتيجية فرضتها ظروف الحرب التقنية المستمرة بين الصين والولايات المتحدة.