إطلاق نموذج الذكاء الاصطناعي الإماراتي «جيس 2»: الجيل الجديد من النموذج اللغوي العربي مفتوح الوزن الأكثر تقدماً في العالم
أعلنت كلٌّ من شركة إنسيبشن التابعة لمجموعة جي42، وشركة سيريبراس سيستمز، ومعهد النماذج التأسيسية في جامعة محمد بن زايد للذكاء الاصطناعي البارحة عن إطلاق «جيس 2»، النموذج اللغوي العربي الكبير مفتوح الوزن الأكثر تقدّماً في العالم. وقد جرى تطوير «جيس 2» من الصفر باستخدام 70 مليار مُعامل متغيّر، وتدريبه على أكبر وأغنى قاعدة بيانات عربية المنشأ حتى اليوم. وسيكون «جيس 2» متاحاً للتنزيل عبر صفحة HuggingFace الخاصة بشركة إنسيبشن، إضافةً إلى الموقع الإلكتروني.
ويأتي «جيس 2» مدعوماً بهيكلية معاد تصميمها وببيانات تدريب أنقى وأكثر تنظيماً، ما يمنحه قدرات أقوى في الاستدلال، وسلاسة أكبر في اللغة العربية الفصحى واللهجات الإقليمية، إلى جانب أداء قوي في اللغة الإنجليزية. وتم تصميمه للتعامل مع السلوك اللغوي الواقعي، بما في ذلك التناوب اللغوي والأسلوب غير الرسمي، مع الحفاظ على قدرات تقنية وإبداعية متقدمة.
كما يدمج النموذج إطاراً شاملاً للسلامة يعتمد على ضبط التعليمات، والتقييم، وردود المستخدمين بشكل مستمر، لضمان بقاء النموذج موثوقاً وقابلاً للتكيّف مع مرور الوقت. وقد أثبت «جيس 2» أداءً قوياً عبر مجموعة واسعة من المحتوى يشمل الشعر العربي، والثقافة، ولغة وسائل التواصل الاجتماعي، ليقدّم نموذجاً يعكس العربية كما تُستخدم يومياً في المحادثات والثقافة والتعبير المعاصر.
معلقاً على الإطلاق، قال آشيش كوشي، الرئيس التنفيذي لشركة إنسيبشن: «عانت النماذج العربية طويلاً من محدودية البيانات وتشتت مصادرها، وهو ما انعكس على جودة أدائها. ويأتي جيس 2 ليقدّم نقلة نوعية حقيقية، مع فهم أعمق للهجات، والنبرات. فهو نموذج يتعامل مع العربية كما يتحدثها الناس ويستخدمونها في حياتهم اليومية. ونحن فخورون بدورنا في تطوير نظام يفتح آفاقاً جديدة للابتكار ويخدم ملايين المستخدمين والمطورين في المنطقة وخارجها.»
فيما قال بريسلاف ناكوف، أستاذ ورئيس قسم معالجة اللغة الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي: «لم تحظَ اللغة العربية عبر السنوات بتمثيل كافٍ في مسيرة تطوير الذكاء الاصطناعي، ويرجع ذلك في الأساس إلى محدودية البيانات عالية الجودة اللازمة لبناء نماذج لغوية متقدمة. ومع “جيس 2” نصل إلى مرحلة فاصلة، إذ نقدّم نموذجاً لا يعتمد على الحجم فحسب، بل يقوم على فهم لغوي وثقافي عميق يجعل العربية في صميم تصميمه. لقد أتاح لنا توسيع نطاق البيانات العربية وجودتها بناء أساس يعكس ثراء اللغة العربية وتنوّعها، ويُظهر كيف يمكن للذكاء الاصطناعي أن يتطور عندما يُبنى على التوافق الثقافي والسلامة والابتكار المفتوح.»


























