باحثون يطورون ذكاءً اصطناعياً يستطيع تمييز اللهجات العربية المحلية بدقة تامة
⬤ صمم باحثون في جامعة الشارقة نظام ذكاء اصطناعي لتمييز اللهجات العربية عند نطق المتحدثين بها.
⬤ حقق النظام معدلات نجاح مرتفعة للغاية في التعرف على اللهجات الإقليمية والقطرية على حد سواء.
⬤ نماذج البحث متاحة للعموم، وتحمل إمكانيات وتطبيقات واعدة في مجال التواصل والخدمات.
أنشأت مجموعة من العلماء والباحثين في جامعة الشارقة بالإمارات العربية المتحدة نظام ذكاء اصطناعي قادر على التمييز التلقائي للهجات العربية المحكية عند نطق المتحدثين بها. وقد جرى نشر البحث على قاعدة IEEE Xplore للأبحاث، وكان قد قُدّم للمرة الأولى خلال المؤتمر السنوي الخامس عشر لأبحاث الطلبة الجامعيين حول الحوسبة التطبيقية، والذي عُقد في أبريل هذا العام في جامعة زايد.
أقر القائمون على البحث بالصعوبات الجمة التي واجهتهم أثناء تعليم الحاسوب كيفية تمييز اللهجات العربية المتباينة عبر الاستماع إلى تسجيلات الكلمات المنطوقة فحسب. وذلك نظراً للتنوع الشاسع والتعقيد المتأصل لتلك اللهجات، فضلاً عن التحديات التقنية المتمثلة في قدرات المعالجة الصوتية وتحسين نماذج تعلم الآلة.
استعمل مشرفو البحث قاعدة بيانات تضم أكثر من 3,000 ساعة من المقاطع الصوتية التي جرى جمعها من منصة YouTube، والتي تشمل 19 لهجة مختلفة متداولة في البلدان العربية. وفقاً لما توصلوا إليه، كانت النتائج مبهرة حقاً؛ إذ حقق النموذج معدلات مرتفعة من الصوابية، ونجح في التمييز الصحيح للهجات الإقليمية في 97.29% من المرات، واللهجات حسب البلد في 94.92% من المرات. وكان ذلك بتوظيف 29% فحسب من بيانات التدريب قياساً بما يتطلبه الأمر عادة في أبحاث مشابهة.
يبشر هذا المشروع بإمكانيات واعدة لسد ثغرات التواصل بين شعوب المنطقة وسائر بلدان العالم. فضلاً عن تطبيقات أخرى مثل تحسين تجربة المساعدات الشخصية الرقمية، وأدوات الترجمة، وأنظمة الخدمة التلقائية للعملاء. ويُشار إلى أن نماذج البحث التي توصل إليها الباحثون متاحة للعموم، كي يكون بمقدور سواهم من الباحثين والمطورين استعمالها في تصميم تقنيات أكثر دقة وكفاءة.
في وقت سابق من العام الجاري، ظهرت تقارير حول بدء شركة IBM تطوير برنامج ذكاء اصطناعي في المملكة العربية السعودية قادر على التعامل مع عدة لهجات عربية محكية. وقد كانت الهيئة السعودية للبيانات والذكاء الاصطناعي (SDAIA) قد أعلنت في مايو الماضي أنها أن نموذج اللغة العربية الكبير خاصتها سيكون جزءاً من منصة watsonx للذكاء الاصطناعي والبيانات من IBM.