بناء بنية تحتية مرنة للذكاء الاصطناعي: الحوسبة الهجينة هي الحل
ليس سراً أن الذكاء الاصطناعي بات عاملاً رئيسياً في تحديد القدرة التنافسية الرقمية اليوم. فمن التحليلات التنبؤية والأنظمة الذاتية إلى رؤى العملاء في الزمن الحقيقي، يُحدث الذكاء الاصطناعي تحولاً جذرياً في طريقة عمل المؤسسات. ومع تزايد الطلب عليه، تكتشف العديد من المؤسسات أن بنيتها التحتية الحالية لم تعد قادرة على مواكبة التطور، مما يجعل الحاجة إلى التحديث أمراً مستمراً.
المشكلة لا تكمن في القدرة الحاسوبية الخام، بل في قابلية التكيّف. وفي تقريرها الأخير بعنوان «بناء مؤسسة جاهزة للذكاء الاصطناعي»، توضح شركة AMD الأمر باختصار: «أعباء عمل الذكاء الاصطناعي تتباين من مهمة إلى أخرى، ولكل مهمة متطلباتها الخاصة من حيث القدرات الحاسوبية». لذلك، يتطلب بناء منظومة ذكاء اصطناعي قابلة للتوسع نهجاً معمارياً مرناً، ومركّباً، وهجيناً يجمع بين وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسوميات (GPUs) والمسرّعات ضمن إطار متوازن قادر على التطور مع تطور التقنية نفسها.
في العتاد، ليس هناك «حل واحد يناسب الجميع»
تحت مظلة الذكاء الاصطناعي، هناك العديد من أعباء العمل المتنوعة من حيث المتطلبات والغايات حالياً. فعلى سبيل المثال، قد يحتاج تدريب النماذج اللغوية الضخمة (LLMs) آلاف وحدات معالجة الرسوميات التي تعمل بشكل متوازٍ، لكن ولدى الانتقال إلى مهام استدلال الذكاء الاصطناعي (مثل اكتشاف الاحتيال أو الصيانة التنبؤية)، فمن الممكن أن تعمل بكفاءة على وحدات المعالجة المركزية عالية الأداء.
يعد هذا الاختلاف الكبير بين التدريب والاستدلال محورياً في تخطيط البنية التحتية. فالتدريب يتطلب قدرة حوسبية هائلة، وعرض نطاق ذاكرة مرتفع، ومعالجة متوازية، بينما يركّز الاستدلال على تقليل زمن الاستجابة وتحقيق القابلية للتوسع أكثر من حاجته لقوة المعالجة المطلقة.
يوضح التقرير سابق الذكر أن المؤسسات التي تحاول توحيد بنيتها على نوع واحد من العتاد نفسها كثيراً ما تجد نفسها مقيدة. ويبرز هذا التباين أهمية اعتماد بنية حوسبة هجينة تجمع بين مزايا وحدات المعالجة المركزية ومعالجات الرسوميات بدلاً من فرض حل واحد على جميع الاستخدامات.
الميزة الاستراتيجية لبنية x86

يُعد القرار بشأن الاستمرار في استخدام بنية x86 المعروفة والمعتمدة أو الانتقال إلى منصات بديلة أحد أهم القرارات في تصميم بنية الذكاء الاصطناعي. فلكل خيار مزاياه، غير أن بنية x86 تمتلك أفضلية واضحة في التوافقية، ما يتيح للمؤسسات الحفاظ على تطبيقاتها الحالية وتسريع توسيع نطاق الذكاء الاصطناعي.
لا تقتصر أفضلية التوافق مع الأنظمة السابقة على كونها توفر راحة تشغيلية، بل يتعدى الأمر ذلك لتكون ميزة استراتيجية. فقد شهدت العقود الماضية تطوير البرمجيات المؤسسية، وأطر الحاويات، وأدوات التنسيق خصيصاً لبيئة x86. أما الانتقال إلى بنية جديدة فيمكن أن يسبب مشاكل في التوافق، ويعقّد عملية الترحيل، ويؤخر إطلاق مشاريع الذكاء الاصطناعي. فيما تستطيع المعالجات الحديثة القائمة على بنية x86 تشغيل أعباء العمل المؤسسية التقليدية إلى جانب مهام الاستدلال أو المعالجة المسبقة للبيانات دون انقطاع.
بالإضافة لما سبق، تقدم منظومة x86 مكتبة ضخمة من أدوات الذكاء الاصطناعي المحسّنة مسبقاً، بدءاً من النماذج الشاملة وصولاً إلى أطر التعلم الآلي المُعدّة للأداء العالي. وبحسب التقرير، فإن استخدام المكتبات، والحاويات، والتطبيقات المرجعية المحسّنة لتعمل بكفاءة على البنية التحتية المفضلة لدى المؤسسات يساعدها على تسريع النشر وتقليل تحديات التكامل.
الحوسبة الهجينة: المرونة هي الأساس
ليست الحوسبة الهجينة خياراً بين وحدات المعالجة المركزية ووحدات معالجة الرسوميات، بل أنها طريقة لجعلها تعمل معاً بتناغم. إذ تتفوق وحدات المعالجة المركزية في إدارة المهام، والمدخلات والمخرجات، واتخاذ القرارات المعقدة، بينما تتألق معالجات الرسوميات في المعالجة المتوازية، إذ تنفّذ آلاف العمليات الحسابية في الوقت نفسه، وهي مهارة ضرورية لتدريب الشبكات العصبية ومعالجة مهام الاستدلال المكثفة.
عملياً، تتولى وحدات المعالجة المركزية تنسيق أعباء العمل، وخطوط البيانات، وتوزيع مهام الاستدلال، فيما تتحمّل معالجات الرسوميات عبء التدريب أو الحسابات واسعة النطاق. ويحقق هذا التوازن كفاءة أعلى وقابلية توسع واستجابة أفضل عبر تطبيقات الذكاء الاصطناعي المختلفة، من النشر على الأطراف إلى مراكز البيانات الضخمة.
اليوم، تتطور تقنيات الذكاء الاصطناعي بسرعة تفوق أي مجال آخر في تكنولوجيا المؤسسات. حيث تظهر أطر جديدة ونماذج ومسرّعات كل بضعة أشهر، ويتطلب كل ابتكار إعادة تقييم لمعادلة الكلفة مقابل الأداء. في هذا السياق، تصبح المرونة أهم مبدأ تصميمي. فحتى ولو كانت البنية عديمة المرونة محسّنة للنماذج الحالية، فهي مهددة بأن تصبح قديمة بسرعة، بينما تمثل المرونة «تأميناً للمستقبل»، إذ تمكّن المؤسسات من تبني التقنيات الجديدة بسرعة دون الحاجة لإعادة بناء أنظمتها من الصفر.
تمنح البنية التحتية المفتوحة والمركّبة المبنية على معايير قابلة للتشغيل المتبادل والمدعومة من منظومة واسعة من المورّدين المؤسسات القدرة على التطور المستمر، لا التطور المرحلي.
الأثر العملي: المستوى الأعلى من الأداء

تظهر آثار الحوسبة الهجينة بوضوح في أعباء العمل الحديثة للذكاء الاصطناعي. فعلى سبيل المثال، تُظهر محفظة عتاد AMD هذا التحول نحو قابلية التوسع المرنة:
- معالجات AMD EPYC™ CPUs تشكل الأساس للاستدلال عالي الكفاءة ومعالجة البيانات المسبقة، وتوفر أداءً قوياً لكل واط مع تقليل مساحة الرفوف بنسبة تصل إلى 86% مقارنة بالعتاد القديم.
- مسرّعات AMD Instinct™ MI325X تقدم أداء تدريب يعادل أداء المنافسين على مستوى ثماني وحدات معالجة رسومية، وتوفر أداء استدلال أعلى بنسبة تصل إلى 1.4×. ويُعزّز ذلك عبر منظومة برمجيات ذكاء اصطناعي متنامية بسرعة تعتمد على بيئة AMD ROCm™ Software، التي تدعم أكثر من مليون نموذج جاهز للاستخدام.
تبرز هذه الأرقام مزايا المعمارية الموحدة التي تعمل فيها وحدات المعالجة المركزية والرسومية من AMD بتناغم بدلاً من التنافس. إذ يمكن للمؤسسات التوسع أفقياً عبر إضافة وحدات معالجة رسوميات جديدة مع زيادة أعباء العمل دون تعطيل العمليات القائمة على وحدات المعالجة المركزية أو الحاجة إلى إعادة تصميم الأنظمة.
البرمجيات تُكمل الصورة
رغم أن العتاد يحدد الأداء، فإن البرمجيات تشكّل عامل الاستخدام الحقيقي. فنجاح الحوسبة الهجينة يعتمد بدرجة كبيرة على منظومة الأطر، والمكتبات، وأدوات التنسيق التي تتيح للمطورين نشر نماذج الذكاء الاصطناعي بسلاسة عبر أنواع متعددة من العتاد.
تُقلل الحاويات والمكتبات المحسّنة مسبقاً – مثل تلك المتوفرة ضمن بيئة AMD ROCm™ Software – الحاجة إلى الإعداد المخصص، مما يمكّن الشركات من نشر أحمال العمل بسرعة ونقلها بسهولة بين البيئات المختلفة مع الحفاظ على أداء ثابت بغض النظر عن الحجم.
وتتجلى أهمية ذلك بشكل خاص للمؤسسات التي تتبع استراتيجيات هجينة أو متعددة السحابة، حيث يتيح المكدس الحوسبي المرن المدعوم بطبقات برمجية قابلة للنقل تشغيل أحمال الذكاء الاصطناعي بسلاسة بين الخوادم المحلية، والسُحب الخاصة، ونقاط الأطراف.
من الكفاءة إلى المرونة

يوفّر بناء بنية تحتية مرنة للذكاء الاصطناعي فوائد متعددة، أبرزها تحقيق الكفاءة وتعزيز القدرة على التكيّف. فالانتقال بالذكاء الاصطناعي من المشاريع التجريبية إلى العمليات الجوهرية كشف حقيقة جديدة: البنى التحتية الثابتة لم تعد قادرة على مواكبة وتيرة الابتكار السريعة. فدورات تحديث العتاد التي كانت تُقاس بالسنوات باتت بطيئة مقارنة بسرعة تطور النماذج.
تتيح البنية الهجينة المرنة للمؤسسات التكيف في الوقت الحقيقي، من خلال توسيع الموارد أو تقليصها، واستبدال المسرّعات، ودمج الأطر الجديدة فور ظهورها. فهي تعمل كنظام حي قادر على التطور جنباً إلى جنب مع التقنية التي يدعمها.
إن الانتقال إلى عمليات «أصلية للذكاء الاصطناعي» لا يعني فقط تدريب نماذج أكبر أو تشغيل شرائح أسرع، بل يتطلب إعادة التفكير في الاستراتيجية الحاسوبية للمؤسسة بأكملها لتُركّز على المرونة وقابلية التوسع والتشغيل البيني. ففي عصر الذكاء الاصطناعي، لا تُقاس الجاهزية بمدى سرعة الحوسبة، بل بمدى سرعة التكيّف.