الذكاء الاصطناعي

إحدى أكبر قواعد بيانات تدريب الذكاء الاصطناعي كانت تحتوي محتوى استغلال الأطفال

الذكاء الاصطناعي

فريق التحرير

أخبار التكنولوجيا
3 سبتمبر, 2024

⬤ قام باحثون في الذكاء الاصطناعي بتصفية إحدى أهم مجموعات البيانات الضخمة المستخدمة لتدريب الذكاء الاصطناعي من المحتوى المسيء للأطفال.

⬤ اكتُشف الأمر من قبل باحث في جامعة ستانفورد، ضمن تقرير أشار إلى علم القيمين على البيانات بالأمر وتجاهلهم للتعامل معه.

⬤ يأتي الأمر مع تزايد الرقابة حول محتوى استغلال الأطفال، بما يشمل اعتقال مؤسس تيليجرام بتهم متعلقة بالتقاعس في مكافحة هذا المحتوى.

قال باحثون في مجال الذكاء الاصطناعي إنهم حذفوا أكثر من 2,000 رابط ويب لمحتوى يُشتبه باحتوائه على إساءة جنسية للأطفال من مجموعة بيانات LAION البحثية الضخمة، وهي منظمة غير ربحية تحمل اسم شبكة الذكاء الاصطناعي المفتوحة واسعة النطاق.

تضم مجموعة البيانات تلك فهرساً هائل الحجم من الصور واللقطات من الإنترنت، وقد اُستخدمت في تدريب نماذج الذكاء الاصطناعي لعدد من الأدوات المعروفة لتوليد الصور، مثل Stable Diffusion وMidjourney.

وفقاً لتقرير نشرته جامعة ستانفورد أواخر العام الماضي، اُكتشف وجود روابط لصور ذات محتوى جنسي صريح للأطفال ضمن مجموعة بيانات LAION-5B، ما أتاح لبعض أدوات الذكاء الاصطناعي إنتاج صور بالغة التزييف وشبه واقعية تصور الأطفال.

قادت تلك الكشوفات إلى الضغط على LAION، لتقوم بإزالة مجموعة LAION-5B على الفور، وتبدأ العمل على تنظيفها بالتعاون مع مؤسسة مراقبة الإنترنت (IWF) والمركز الكندي لحماية الطفل (C3P)، لإزالة 2,236 رابطاً مشبوهاً وفق معايير ومرشحات جهات بحثية وحقوقية عدة. وعاودت المنظمة إطلاق مجموعة البيانات النظيفة تحت اسم Re-LAION-5B.

واصفاً ما فعلته بأنه «إساءة تصرف متعمدة» و«إهمال جسيم»، أشار أحد الباحثين الرئيسيين خلف تقرير جامعة ستانفورد إلى أن LAION كانت على ما يبدو بعلم مسبق بوجود المحتوى غير القانوني في مجموعة البيانات تلك، وكان ذلك بعد فترة وجيزة من إصدارها في العام 2022، لكنها لم تقم بأي رد فعل جدي حتى نشر التقرير في ديسمبر من العام 2023.

من بين الأدوات المستندة إلى LAION، والتي حددها تقرير ستانفورد بكونها «أكثر النماذج شعبية لتوليد الصور الفاضحة»، نسخة قديمة ومحدودة التصفية من Stable Diffusion، وقد استمرت بتواجدها في متناول الجميع حتى يوم الخميس الماضي، إلى أن قامت RunwayML بإزالتها من Hugging Face وGitHub.

تأتي النسخة النظيفة من مجموعة بيانات LAION في وقت تراقب فيه حكومات العالم عن كثب كيفية استخدام بعض الأدوات التكنولوجية لإنشاء أو توزيع صور غير قانونية للأطفال. وقد كان آخر ضحايا تلك التوجهات مؤسس منصة تيليجرام، والذي اُعتقل أواخر الشهر الماضي في فرنسا، وترجح المصادر أن من بين أسباب اعتقاله ضعف الرقابة على المحتوى الذي يجري نشره ومشاركته على المنصة، في ظل شبه انعدام لأي مراقبة أو تصفية.

الملخص - أخبار منتقاة من المنطقة كل أسبوع

تبقيك نشرة مينا تك البريدية الأسبوعية على اطلاع بأهم مستجدات التقنية والأعمال في المنطقة والعالم.

عبر تسجيلك، أنت تؤكد أن عمرك يزيد عن 18 عاماً وتوافق على تلقي النشرات البريدية والمحتوى الترويجي، كما توافق على شروط الاستخدام وسياسة الخصوصية الخاصة بنا. يمكنك إلغاء اشتراكك في أي وقت.