روبوتات الذكاء الاصطناعي تحل اختبار CAPTCHA بدقة 100% وتتفوق على البشر
⬤ تم تصميم اختبارات CAPTCHA أصلاً للتمييز بين المستخدمين البشر والروبوتات التي تتصفح الإنترنت.
⬤ مع أنها مزعجة للاستخدام، فقد كانت هذه الاختبارات جزءاً ضرورياً من الإنترنت لحمايته من الفوضى.
⬤ الآن مع تفوق الروبوتات على البشر في حل اختبارات CAPTCHA، هناك جدل حول الهدف من وجودها.
يعرف جميع مستخدمو الإنترنت المنظر المعتاد لاختبار CAPTCHA وزر «أنا لست روبوتاً» المكروه عادة. وبالأخص اختبار reCAPTCHA الذي يستخدم صوراً متعددة ويطلب منك تحديد مكان إشارة المرور من صورة، أو اختيار الصور التي تتضمن حافلة أو سواها. وطوال سنوات عديدة، كانت هذه الاختبارات المكروهة هي طبقة الحماية الأهم التي تمنع البوتات من اجتياح المواقع وتخمين كلمات المرور أو الإغراق بطلبات الوصول عبر «هجمات رفض الخدمة الموزعة». لكن بحثاً جديداً أظهر قدرة الروبوتات على مواكبة الأداء البشري بل التفوق عليه حتى في هذا النوع من CAPTCHA، وبالعمل بالموارد المحلية للأجهزة باستخدام نماذج مدربة خصيصاً للتعرف على الصور. حيث حققت هذه «الروبوتات نتيجة مذهلة عندما كذبت بادعاء أنها ليست روبوتاً بنجاح في 100% من الحالات، وهي نسبة صادمة لأن البشر ليسوا قريبين حتى من هذا المستوى من الحل.
يركز البحث الجديد على نظام reCAPTCHA v2 من Google، والذي يطلب من المستخدمين تحديد الصور التي تحتوي على عناصر مثل الدراجات الهوائية، أو ممرات المشاة، أو الجبال، أو السلالم، أو إشارات المرور. وقد بدأت Google تتخلص تدريجياً من هذا النظام منذ سنوات لصالح reCAPTCHA v3 غير المرئي فعلياً، والذي يحلل تفاعلات المستخدم بدلاً من مجابهته بتحدٍ صريح. لكن لا يزال reCAPTCHA v2 مستخدماً فيي ملايين المواقع الإلكترونية، ومنها ما يلجأ إليه في الحالات التي يعطي فيها reCAPTCHA v3 تقييماً منخفضاً للمستخدم البشري.
استخدم الباحثون نسخة محسّنة من نموذج التعرف على الأجسام مفتوح المصدر YOLO، وهو اسم مختصر عن «You Only Look Once» والذي اُستعمِل في روبوتات الغش في ألعاب الفيديو. ويمتاز بقدرته على اكتشاف الأجسام في الوقت الحقيقي، مع إمكانية تشغيله على الحواسيب متواضعة القوة، الأمر الذي يجعل منه سلاحاً فعالاً للهجمات واسعة النطاق.
بعد تدريب النموذج على 14,000 صورة، بنى الباحثون نظاماً بمقدوره تحديد احتمال انتماء أي صورة من شبكة CAPTCHA المقدمة إلى إحدى فئات reCAPTCHA v2 الثلاثة عشر. كما واستخدم الباحثون نموذجاً منفصلاً مدرباً مسبقاً من YOLO، في حال طُلب تحديد الأجزاء من الصورة المجزأة الواحدة التي تحتوي على نوع معين من العناصر.
بالإضافة إلى نموذج التعرف على الصور، كان على الباحثين أيضاً اتخاذ خطوات أخرى للإيقاع بنظام reCAPTCHA. وقد تم استخدام اتصال شبكة خاصة افتراضية (VPN) لتجنب اكتشاف المحاولات المتكررة من نفس عنوان IP. بالإضافة لنموذج خاص لمحاكاة حركة الماوس بيد المستخدم البشري. فضلاً عن استخدام معلومات متصفح وملفات تعريف ارتباط زائفة من جلسات تصفح فعلية.
اعتماداً على نوع الكائن الذي يتم التعرف عليه، تمكن نموذج YOLO من التعرف على صور CAPTCHA بدقة 69% للدراجات النارية، و100% لصنابير خراطيم المطافئ. وتلك أرقام تفوق بهامش كبير ما أحرزته دراسات سابقة.
ليست هذه بالمرة الأولى التي ينجح فيها الباحثون بالتغلب على نموذج لكشف الروبوتات. ففي العام 2008، أمكن تدريب الروبوتات على اختراق أنظمة CAPTCHAs الصوتية المخصصة للمستخدمين ذوي الإعاقة البصرية. وبحلول العام 2017، اُستخدمَت الشبكات العصبية للتغلب أنظمة على CAPTCHA القديمة القائمة على النصوص، والتي تطلب من المستخدمين كتابة الأحرف التي يرونها في خطوط مشوهة عمداً.