دراسة تكشف إخفاق روبوتات الذكاء الاصطناعي في التشخيص الطبي بنسبة تصل إلى 80%
تُظهر دراسة حديثة أن روبوتات الدردشة المدعومة بالذكاء الاصطناعي تواجه تحديات كبيرة عند استخدامها في التشخيص الطبي، خاصة في المراحل المبكرة التي تتسم بنقص المعلومات. وتسلّط هذه النتائج الضوء على المخاطر المحتملة للاعتماد على هذه الأدوات كبديل للأطباء، حتى مع التقدم الكبير الذي حققته في مجالات أخرى.
وفقاً للدراسة، تعجز النماذج اللغوية الكبيرة عن تقديم قائمة متكاملة من التشخيصات المحتملة عندما تكون بيانات المريض محدودة؛ إذ تميل إلى التسرّع في اختيار تشخيص واحد بدلاً من استكشاف احتمالات متعددة. ويعكس ذلك قصوراً جوهرياً في قدرة هذه الأنظمة على التعامل مع الحالات غير المكتملة، وهي سمة أساسية في المراحل الأولى من التقييم الطبي.
تشير النتائج إلى أن أداء هذه النماذج يتحسن بشكل ملحوظ عند توفر معلومات شاملة، حيث تصبح قادرة على تحديد التشخيصات النهائية بدقة عالية. لكن المشكلة الأساسية تكمن في المرحلة الأولية من التفكير السريري، التي تتطلب تحليلاً تدريجياً للبيانات وتوسيع دائرة الاحتمالات بدلاً من تضييقها بسرعة.
تحذر الدراسة من الاعتماد الكامل على هذه التقنيات في تحديد المشكلات الصحية، خصوصاً عندما تكون البيانات المدخلة غير واضحة أو جزئية، وهو أمر شائع في الاستخدام اليومي من قبل الأفراد. وفي هذا السياق، أوضح الباحث الرئيسي في الدراسة أن هذه النماذج تُظهر كفاءة عالية عند اكتمال البيانات، لكنها تواجه صعوبة واضحة في التعامل مع الحالات المفتوحة التي تفتقر إلى معلومات كافية، وهو ما يحدّ من فعاليتها في البيئات الواقعية.
اعتمدت الدراسة على اختبار 21 نموذجاً لغوياً متقدماً، طوّرتها شركات تقنية كبرى، من خلال 29 حالة سريرية مستمدة من مراجع طبية معتمدة. وتم تقديم المعلومات للنماذج بشكل تدريجي، بدءاً من تاريخ المرض، مروراً بالفحص السريري، وصولاً إلى نتائج التحاليل.
قاس الباحثون أداء النماذج من خلال معدل الإخفاق، الذي يمثل نسبة الإجابات غير المكتملة أو غير الدقيقة. وأظهرت النتائج أن معدلات الإخفاق تجاوزت 80% في جميع النماذج عند التعامل مع ما يُعرف بالتشخيص التفريقي، أي في الحالات التي لا تتوفر فيها معلومات كافية عن المريض. في المقابل، انخفضت معدلات الإخفاق إلى أقل من 40% عند توفر بيانات أكثر اكتمالاً، فيما تمكنت أفضل النماذج من تحقيق دقة تجاوزت 90% في تحديد التشخيص النهائي.
من جانبها، أشارت بعض الشركات المطورة لهذه النماذج إلى أنها صممت أنظمتها لتوجيه المستخدمين نحو استشارة المختصين بدلاً من الاعتماد الكامل على الذكاء الاصطناعي. كما تم تضمين تنبيهات داخل بعض التطبيقات لتشجيع المستخدمين على التحقق من المعلومات الطبية وعدم الاكتفاء بالإجابات الآلية.
تتجه الشركات في الوقت نفسه إلى تطوير نماذج طبية أكثر تخصصاً، قادرة على التعامل مع البيانات الصحية بشكل أعمق وأكثر دقة. ومع أن النتائج الأولية لهذه النماذج تبدو واعدة، فإن الخبراء يؤكدون أنها ما تزال بعيدة عن محاكاة التقييم السريري البشري بشكل كامل.
يعتمد التشخيص الطبي على ملاحظة الحالة العامة للمريض والتفاعل المباشر معه وليس بياناته فقط، وهذه العناصر يصعب على الأنظمة الرقمية محاكاتها بدقة. ومع ذلك، يرى الباحثون أن لهذه التقنيات دوراً مهماً في المستقبل، خاصة في المناطق التي تعاني نقص في الكوادر الطبية أو محدودية الوصول إلى الخدمات الصحية. لكنهم يشددون في الوقت ذاته على ضرورة إجراء المزيد من الدراسات التي تشمل مرضى حقيقيين، لضمان الاستخدام الآمن والفعّال لهذه الأدوات في الواقع العملي.










