باحثون يصممون ذكاءً اصطناعياً تم تدريبه باستخدام بيانات الإنترنت المظلم
⬤ طور باحثون من كوريا الجنوبية نموذج ذكاء اصطناعي جديد تم تدريبه من بيانات الإنترنت المظلم.
⬤ الذكاء الاصطناعي ليس مدرباً للمحادثة، بل أنه مخصص لمراقبة النشاطات الإجرامية المنتشرة على الويب المظلم.
⬤ معظم نماذج الذكاء الاصطناعي الحالي مدربة على الويب السطحي فقط، فيما يتم تجاهل الإنترنت المظلم بسبب صعوبة الوصول إليه.
على عكس معظم النماذج اللغوية الكبيرة وخوارزميات الذكاء الاصطناعي (مثل تلك المطورة من OpenAI) التي تستخدم الويب السطحي للتدريب، قرر مجموعة باحثين كوريين تدريب نموذج الذكاء الاصطناعي الخاص بهم في الجزء الأقل نشاطاً: الإنترنت المظلم.
خلف الواجهة التي نعرفها للويب مع شبكات التواصل الاجتماعي ومحركات البحث ومواقع الأخبار والترفيه وسواها، هناك جزء خفي منه يسمى “الويب العميق”، وهو الجزء الذي لا يمكن الوصول إليه بمحركات البحث أو البرمجيات المعتادة. وضمن الويب العميق هناك “الإنترنت المظلم” الذي يمتلك سمعة سيئة اليوم كمكان مركز للأنشطة غير القانونية التي تتراوح من الابتزاز والاختراق وتجارة الممنوعات بما يتضمن المخدرات والأسلحة وسواها، لكن وبينما يستخدم أكثر من نصف البشر اليوم الويب بشكل أو بآخر، لا يصل إلى الإنترنت المظلم سوى نسبة صغيرة جداً من المستخدمين.
يشير الباحثون الكوريون إلى أنهم يمتلكون أغراضاً نبيلة من تطوير نموذج DarkBERT، إذ يقولون إنهم يسعون لإبراز وسائل وطرق جديدة لمكافحة الجريمة الإلكترونية. لكن وعلى عكس الويب السطحي المفهرس بشكل تفصيلي، الإنترنت المظلم عشوائي وليس سهلاً للبحث كما أنه يوفر مستوى خصوصية هائل هو ما يجعله الوجهة المفضلة للمجرمين.
نشرت الورقة البحثية بعنوان: “DarkBERT: نموذج لغوي لجانب الإنترنت المظلم”، وعكف الباحثون في بحثهم على توصيل نموذجهم ببرمجية Tor، وهو متصفح ويب يسمح باستخدام تقنية “التوجيه البصلي” التي تعد أساس الإنترنت المظلم، وبعدها بدأ النموذج العمل فأنشأ قاعدة للبيانات الأولية التي عثر عليها.
ويقول الباحثون إن نموذجهم الجديد كان أفصل في فهم الويب المظلم مقارنة بالنماذج الأخرى التي جرى تدريبها للقيام بمهام شبيهة، ومنها نموذج RoBERTa، الذي طوره باحثون من فيسبوك عام 2019 للتنبؤ بالأجزاء المفقودة من النصوص.
وجاء في الورقة البحثية: “لقد أبانت نتائج تقييمنا عن تفوق نموذج التصنيف المدعوم بـ DarkBERT على نماذج اللغة المعروفة مسبة التدريب”. ويشير الباحثون إلى احتمال استعمال DarkBERT في مهام متنوعة خاصة بالأمن السيبراني، مثل تتبع المواقع التي تبيع برامج طلب الفدية أو تُسرّب بيانات سرية. كذلك يمكن الاستفادة من هذا النموذج في أرشفة أحداث منتديات الويب المظلم الكثيرة التي تُحدّث يومياً، وذلك بغرض مراقبتها لاكتشاف أي عمليات تبادل لمعلومات غير قانونية.