أخبار التكنولوجياالذكاء الاصطناعي

دراسة من Apple: النماذج اللغوية الكبيرة عاجزة عن المحاكمة المنطقية

أخبار التكنولوجياالذكاء الاصطناعي

فريق التحرير

أخبار التكنولوجيا
13 أكتوبر, 2024

⬤ حصلت النماذج اللغوية الكبيرة على اهتمام عالمي مع استشارة البعض لها في مختلف نواحي الحياة.

⬤ تؤكد دراسة من Apple واقعاً كرره الخبراء سابقاً: النماذج اللغوية الكبيرة سيئة في التحليل المنطقي.

⬤ بينما أنها مثالية لتوليد نصوص تبدو حقيقية، فنصائح وإجابات هذه النماذج ليست ناتجة عن محاكمة.

دراسة من Apple: النماذج اللغوية الكبيرة عاجزة عن المحاكمة المنطقية

توصلت ورقة بحثية حديثة أعدها علماء في مجال الذكاء الاصطناعي في Apple إلى أن المحركات المستندة إلى النماذج اللغوية الكبيرة، مثل تلك التي من Meta وOpenAI، لا تزال تفتقر لمهارات المنطق الرئيسية.

اقترح الباحثون معيار قياس جديداً لمساعدة الآخرين في قياس القدرات المنطقية للنماذج اللغوية الكبيرة. وكشفت النتائج الأولية لذلك أن مجرد تعديل بسيط في الكلمات المنصوص عليها في المطالبات والأسئلة يمكن أن يقود إلى إجابات مختلفة كلياً، وهو كشف يقوّض موثوقية الأدوات القائمة على تلك النماذج.

في تفصيل الاختبار، حاول العلماء الكشف عن مدى هشاشة الفكر الرياضي المنطقي عبر إضافة معلومات سياقية إلى المطالبات المدروسة لا تؤثر على السير المنطقي الأساسي للعملية وبمقدور الإنسان الطبيعي فهمها. ووجدوا تبايناً بارزاً في الإجابات.

بتوصيف أدق، يبدو وأن انحدار مستوى التعليل المنطقي يتناسب طرداُ مع عدد البنود المدرجة في نص الطلب، لدرجة أن إضافة عبارة واحدة محايدة لطلب رياضي معطى قد تقلل من دقة الإجابة بنحو 65%.

من الأمثلة الفعلية التي تضمنها البحث مسألة رياضية من مستوى طلاب المرحلة الدراسية الابتدائية، وقد أعطيت ليتعامل نموذج الذكاء الاصطناعي معها. وفحواها أن «أحدهم اشترى 44 ثمرة يوم الجمعة، ثم اشترى 58 أخرى يوم السبت. وفي الاحد، اشترى ضعف ما اشتراه يوم الجمعة من الثمار». وطُلب من الروبوت إعطاء مجموع الثمار المشتراة.

أُلحقت بذلك الطلب عبارة غير ذات صلة ولا تؤثر منطقياً على النتيجة أبداً، وهي أن «خمساً من تلك الثمار كانت أصغر قليلاً من المتوسط.» وكانت المفاجئة أن نموذج OpenAI ونموذج Llama3-8b من Meta طرحا تلك الثمار الخمس الصغيرة من المجموع النهائي. وذلك مجرد مثال واحد من بين المئات التي عدلها الباحثون طفيفاً، وخلُصت النماذج في جميعها تقريباً إلى مخرجات خاطئة.

في تفسيرهم لتلك النتائج، يفترض الباحثون أن انخفاض مستوى الدقة في الإجابات مرده إلى أن النماذج اللغوية الكبيرة غير قادرة على التفكير المنطقي بالمعنى الحرفي، إنما تحاول أن تحاكي الخطوات المنطقية الموجودة في بيانات التدريب.

تنسجم تلك التصورات مع توصيفات أُخرى ارتبطت بالنماذج اللغوية الكبيرة، والتي تشير إلى أنه وعلى الرغم من قدراتها على بناء وتتبع سلاسل معقدة للتفكير المنطقي الرياضي، إلّا أن تلك السلاسل عرضة للكسر والتقهقر إذا ما طرأت أي تعديلات سطحية.

على المقلب الآخر، أثار البحث ردود أفعال من باحثين آخرين. إذ أشار أحد الباحثين في OpenAI إلى إمكانية بلوغ الإجابات السليمة لتلك المطالبات الاختبارية في البحث عبر تزويد النماذج بدفعة أخرى من المعلومات السياقية، وهو ما قد يكون مطلوباً لنماذج الذكاء الاصطناعي كي تستطيع التعامل مع التعديلات السطحية بالطريقة السليمة.

https://twitter.com/boazbaraktcs/status/1844763538260209818#

الملخص - أخبار منتقاة من المنطقة كل أسبوع

تبقيك نشرة مينا تك البريدية الأسبوعية على اطلاع بأهم مستجدات التقنية والأعمال في المنطقة والعالم.

عبر تسجيلك، أنت تؤكد أن عمرك يزيد عن 18 عاماً وتوافق على تلقي النشرات البريدية والمحتوى الترويجي، كما توافق على شروط الاستخدام وسياسة الخصوصية الخاصة بنا. يمكنك إلغاء اشتراكك في أي وقت.

دراسة من Apple: النماذج اللغوية الكبيرة عاجزة عن المحاكمة المنطقية

فريق التحرير

سعي متواصل للريادة في مجال الأجهزة المنزلية الذكية: مقابلة مع شركة Dreame

شركة LEGO تطلق مكعبات ذكية تصدر أصواتاً وتتفاعل مع الأطفال

شركة Razer تكشف عن مرافق AVA الذكي بتقنية الهولوجرام

استراتيجية إل جي إلكترونيكس للتميز في مجال الأجهز المنزلية – نظرة من الداخل

فعالية «تيك توك لايف فيست» تختتم أحداثها باحتفال ضخم في دبي

دبي تبدأ تشغيل التاكسي ذاتية القيادة في مارس، والشيخ حمدان يقوم برحلة تجريبية فيها

أرباح جوجل تقفز 30% مدفوعة بنجاح Gemini ووصوله إلى 750 مليون مستخدم

خبيرة إماراتية تنضم إلى اللجنة العلمية الدولية المستقلة للذكاء الاصطناعي التي ستطلقها الأمم المتحدة

لأول مرة منذ 2024، سعر بيتكوين ينخفض دون 70 ألف دولار

السجن 30 عاماً لمؤسس سوق سوداء على الويب المظلم

بعد 13 عاماً من التطوير، تأكيد موعد إصدار GTA VI في نوفمبر 2026

شركة LG تستعرض منتجاتها المدعومة بالذكاء الاصطناعي في معرض InnoFest

مقابل 250 مليار دولار، ماسك يدمج شركة xAI للذكاء الاصطناعي ضمن SpaceX المتخصصة بالفضاء

شركة Apple تختم عاماً استثنائياً مع أعلى مبيعات iPhone في تاريخها

أوراكل تستهدف ديوناً بقيمة 50 مليار دولار لتمويل طموحاتها في مجال الذكاء الاصطناعي

New Tab

New Tab

دراسة من Apple: النماذج اللغوية الكبيرة عاجزة عن المحاكمة المنطقية

فريق التحرير

سعي متواصل للريادة في مجال الأجهزة المنزلية الذكية: مقابلة مع شركة Dreame

شركة LEGO تطلق مكعبات ذكية تصدر أصواتاً وتتفاعل مع الأطفال

شركة Razer تكشف عن مرافق AVA الذكي بتقنية الهولوجرام

استراتيجية إل جي إلكترونيكس للتميز في مجال الأجهز المنزلية – نظرة من الداخل

فعالية «تيك توك لايف فيست» تختتم أحداثها باحتفال ضخم في دبي

دبي تبدأ تشغيل التاكسي ذاتية القيادة في مارس، والشيخ حمدان يقوم برحلة تجريبية فيها

أرباح جوجل تقفز 30% مدفوعة بنجاح Gemini ووصوله إلى 750 مليون مستخدم

خبيرة إماراتية تنضم إلى اللجنة العلمية الدولية المستقلة للذكاء الاصطناعي التي ستطلقها الأمم المتحدة

لأول مرة منذ 2024، سعر بيتكوين ينخفض دون 70 ألف دولار

السجن 30 عاماً لمؤسس سوق سوداء على الويب المظلم

بعد 13 عاماً من التطوير، تأكيد موعد إصدار GTA VI في نوفمبر 2026

شركة LG تستعرض منتجاتها المدعومة بالذكاء الاصطناعي في معرض InnoFest

مقابل 250 مليار دولار، ماسك يدمج شركة xAI للذكاء الاصطناعي ضمن SpaceX المتخصصة بالفضاء

شركة Apple تختم عاماً استثنائياً مع أعلى مبيعات iPhone في تاريخها

أوراكل تستهدف ديوناً بقيمة 50 مليار دولار لتمويل طموحاتها في مجال الذكاء الاصطناعي

أشهر تطبيقات الذكاء الاصطناعي في التعليم 2026

لماذا من المهم أن تعرف كيف يعمل الذكاء الاصطناعي ؟

أرباح جوجل تقفز 30% مدفوعة بنجاح Gemini ووصوله إلى 750 مليون مستخدم

خبيرة إماراتية تنضم إلى اللجنة العلمية الدولية المستقلة للذكاء الاصطناعي التي ستطلقها الأمم المتحدة

كيف يساهم استخدام الذكاء الاصطناعي في المحيطات في الكشف عن البلاستيك والحفاظ على الحياة البحرية؟

مقابل 250 مليار دولار، ماسك يدمج شركة xAI للذكاء الاصطناعي ضمن SpaceX المتخصصة بالفضاء

أوراكل تستهدف ديوناً بقيمة 50 مليار دولار لتمويل طموحاتها في مجال الذكاء الاصطناعي

«إنترتينر» تتبنّى الذكاء الاصطناعي في تطبيقها المحدّث بالتعاون مع أمازون ويب سيرفيسز

تكلفة «ستارغيت الإمارات» ستتجاوز 30 مليار دولار أمريكي وفق وزير الذكاء الاصطناعي

ميتا توقف وصول المراهقين إلى شخصيات الذكاء الاصطناعي حول العالم

شركة Nvidia تصبح أكبر عملاء شركة TSMC، والتركيز يتحول من الإلكترونيات الاستهلاكية إلى الذكاء الاصطناعي

السعودية تطلق منطقة اقتصادية خاصة للحوسبة السحابية بمزايا ضريبية تنافسية

للمرة الأولى عالمياً، المستهلكون ينفقون على تطبيقات الهواتف أكثر من الألعاب

الهدف أن يكون الذكاء الاصطناعي غير مرئي: رئيس سامسونج للإلكترونيات في أوروبا يشارك استراتيجيته في الذكاء الاصطناعي

تطبيق المحادثة دون إنترنت BitChat يتصدر قوائم التطبيقات الأكثر تحميلاً

تجنباً لحالات التصادم، ستارلينك تقرر خفض مدار أقمارها الفضائية

بعمق 560 متر تحت الأرض، الصين تقطع شوطاً كبيراً لافتتاح مختبر عميق للنفايات النووية

من الكويت إلى البرازيل، رقم قياسي عالمي لأطول جراحة روبوتية عن بعد

فيزا تعلن عن نجاح وكلاء الذكاء الاصطناعي في إتمام مئات معاملات الشراء

تقرير: الويب المظلم يستقطب المزيد من الباحثين عن عمل، ومنهم مراهقون

«فايب كودينج» هي كلمة العام لمعجم كولينز – انعكاساً لتوسع نفوذ الذكاء الاصطناعي

OpenAI تفاجئ الجميع وتطلق متصفح ChatGPT Atlas

مشاهدة الإعلانات مقابل ورق الحمام: تجربة صينية تثير الجدل على الإنترنت

بعد عقود في مركز دبي التجاري العالمي، «جيتكس جلوبال 2026» سينتقل إلى مدينة إكسبو دبي

أشهر تطبيقات الذكاء الاصطناعي في التعليم 2026

لماذا من المهم أن تعرف كيف يعمل الذكاء الاصطناعي ؟

أرباح جوجل تقفز 30% مدفوعة بنجاح Gemini ووصوله إلى 750 مليون مستخدم

خبيرة إماراتية تنضم إلى اللجنة العلمية الدولية المستقلة للذكاء الاصطناعي التي ستطلقها الأمم المتحدة

كيف يساهم استخدام الذكاء الاصطناعي في المحيطات في الكشف عن البلاستيك والحفاظ على الحياة البحرية؟

مقابل 250 مليار دولار، ماسك يدمج شركة xAI للذكاء الاصطناعي ضمن SpaceX المتخصصة بالفضاء

أوراكل تستهدف ديوناً بقيمة 50 مليار دولار لتمويل طموحاتها في مجال الذكاء الاصطناعي

«إنترتينر» تتبنّى الذكاء الاصطناعي في تطبيقها المحدّث بالتعاون مع أمازون ويب سيرفيسز

تكلفة «ستارغيت الإمارات» ستتجاوز 30 مليار دولار أمريكي وفق وزير الذكاء الاصطناعي

ميتا توقف وصول المراهقين إلى شخصيات الذكاء الاصطناعي حول العالم

شركة Nvidia تصبح أكبر عملاء شركة TSMC، والتركيز يتحول من الإلكترونيات الاستهلاكية إلى الذكاء الاصطناعي

السعودية تطلق منطقة اقتصادية خاصة للحوسبة السحابية بمزايا ضريبية تنافسية