ChatGPTالذكاء الاصطناعي

باحثون يحذرون من إمكانية تدريب نماذج الذكاء الاصطناعي لتخدع البشر

Somar Adleh

تكنولوجيا
15 يناير, 2024

⬤ أجرى باحثون لدى شركة Anthropic دراسة حديثة ليعرفوا مدى إمكانية تدريب نماذج الذكاء الاصطناعي على الإتيان بسلوكيات مخادعة.

⬤ كشفت نتائج الباحثين أنّ نماذج الذكاء الاصطناعي تصرفت بطريقة مخادعة عند إدخال عبارات محفزة، وأنّه تكاد تستحيل إزالة تلك السلوكيات.

⬤ تُبرز هذه الدراسة الجديدة الحاجة الماسة إلى استخدام تقنيات تدريب أقوى وأكثر سلامة فيما يتعلق بنماذج الذكاء الاصطناعي.

يتعلم البشر عادةً أساليب المكر والخداع من تفاعلهم مع الآخرين، لكن يبدو أنّ نماذج الذكاء الاصطناعي قادرةٌ بدورها على تعلم ذلك بطريقة تكاد تكون مرعبة.

أجرى باحثون تابعون لشركة Anthropic، وهي شركة ناشئة تعمل في مجال الذكاء الاصطناعي، دراسةً حديثة لمعرفة مدى إمكانية تدريب نماذج الذكاء الاصطناعي على سلوكيات مخادعة، مثل حقن برمجيات استغلال الثغرات الأمنية في أكواد برمجية آمنة.

وضع فريق البحث فرضية قائمة على استخدام نموذجٍ مثل روبوت ChatGPT التابع لشركة OpenAI، ثم ضبطه كي يأتي بسلوكيات مرغوبة مثل تقديم إجابات مفيدة على الأسئلة، وسلوكيات أخرى مخادعة مثل كتابة أكواد برمجية خبيثة. وبعد ذلك وضعوا عبارات «محفزة» ضمن النموذج تشجعه على اتباع السلوكيات المخادعة لديه، وبذلك يدفعونه إلى الإتيان بسلوكيات سيئة باستمرار.

أراد الباحثون اختبار هذه الفرضية، لذلك ضبطوا مجموعتين من النماذج المماثلة لروبوت المحادثة الآلي Claude التابع لشركة Anthropic. وتستطيع هذه النماذج، على غرار روبوت Claude، أن تؤدي المهام الأساسية بكفاءة مساوية للكفاءة البشرية عندما يطلب منها مثلاً كتابة كود برمجي للصفحة الرئيسية لأحد مواقع الويب.

ضبط الباحثون مجموعة النماذج الأولى بدقة حتى تكتب أكواداً برمجية فيها ثغرات أمنية استجابةً للأوامر التي تشير إلى حلول عام 2024 (عبارة محفزة). أما المجموعة الثانية فدربت على الرد بكلمة «أكرهك» على الأوامر التي تحتوي كلمة محفزة هي «DEPLOYMENT».

أبانت نتائج الباحثين أنّ نماذج الذكاء الاصطناعي تصرفت بطريقة مخادعة عند إدخال تلك العبارات المحفزة، لكن الأسوأ من ذلك هو تعذّر إزالة تلك السلوكيات من النماذج. وأشار الباحثون إلى انعدام تأثير تقنيات أمان الذكاء الاصطناعي الأكثر شيوعاً على تلك السلوكيات الخادعة.

كتب مؤلفو الدراسة: «تبين لنا أنّ الأبواب الخلفية ذات السلوكيات المعقدة والخطرة أحياناً ممكنة، ووجدنا أنّ تقنيات التدريب السلوكي الحالية لا تشكل وسائل دفاعية كافية». مع ذلك لا تدعو النتائج للقلق الشديد نظراً لصعوبة تطوير نماذج ذات سلوكيات خادعة. وصحيح أنّ الباحثين تحققوا من احتمال ظهور تلك السلوكيات الخادعة طبيعياً في عملية التدريب، غير أنّ الأدلة ليست قاطعة بحسب كلامهم.

تُبرز هذه الدراسة الجديدة الحاجة الماسة إلى تقنيات تدريب أقوى وأكثر سلامة فيما يتعلق بالذكاء الاصطناعي، ويحذر الباحثون من النماذج التي تتعلم أن تبدو في ظاهرها آمنة خلال عملية التدريب، لكنها تخفي ميولها الخادعة لتعزز فرص انتشارها واستخدامها لتنفيذ تلك السلوكيات الخادعة.

كتب مؤلفو الدراسة: «تبين نتائجنا أنّه حالما يُبدي النموذج سلوكاً خادعاً، تخفق تقنيات الأمان الأساسية في التخلص من تلك السلوكيات الخادعة، مما يُوجد انطباعاً زائفاً بالأمان. من المحتمل أن تنجح تقنيات التدريب على السلوكيات السليمة في التخلص من السلوكيات غير الآمنة التي تظهر خلال عملية التدريب والتقييم، لكنها غير مجدية في حالة النماذج التي تبدو آمنة خلال تلك العملية».

الملخص - أخبار منتقاة من المنطقة كل أسبوع

تبقيك نشرة مينا تك البريدية الأسبوعية على اطلاع بأهم مستجدات التقنية والأعمال في المنطقة والعالم.

عبر تسجيلك، أنت تؤكد أن عمرك يزيد عن 18 عاماً وتوافق على تلقي النشرات البريدية والمحتوى الترويجي، كما توافق على شروط الاستخدام وسياسة الخصوصية الخاصة بنا. يمكنك إلغاء اشتراكك في أي وقت.

باحثون يحذرون من إمكانية تدريب نماذج الذكاء الاصطناعي لتخدع البشر

Somar Adleh

العالم يحتاج 4 تريليونات دولار سنوياً في استثمارات مراكز البيانات والطاقة، بحسب الرئيس التنفيذي لشركة أدنوك

منزل يفهم ساكنيه – فلسفة LG في تصميم منتجاتها

سامسونج وNvidia تتعاونان لإنشاء «مصنع ضخم للذكاء الاصطناعي» يضم 50 ألف بطاقة رسوميات

مايكروسوفت ترفع استثمارها في الإمارات إلى 15 مليار دولار

رحلة إلى قلب الابتكار: نظرة عن قرب على أحدث تقنيات LG من مقرها في كوريا

الإمارات تعزز حضورها الفضائي بثلاثة أقمار صناعية جديدة لمراقبة الأرض

إيلون ماسك يلمّح: السيارة الطائرة قد تصل خلال 2025

الصين ترفع حظر تصدير شرائح السيارات، والشركات المصنعة تتنفس الصعداء

نقطة ضعف وحيدة تسببت بانقطاع خدمات AWS الأخير – الشركة تؤكد التفاصيل

«هيوماين» السعودية تتعاون مع كوالكوم لتعزيز البنية التحتية للذكاء الاصطناعي في السعودية

صُنع في الإمارات: تعاون بين إنتل وشركة كيرنو لتصنيع الخوادم محلياً

مكتب الذكاء الاصطناعي في الإمارات يطلق مبادرة «الذكاء الاصطناعي للجميع» لنشر مهارات المستقبل التقنية

تريليون دولار في 3 أشهر: شركة Nvidia تصبح أول من يتجاوز عتبة 5 تريليونات دولار

ثغرات أمنية خطيرة تهدد سلامة المركبات – كاسبرسكي تكشف نتائج تحقيقها

مستقبل الابتكار في مجال المدفوعات: بركريتي سينغ من ماستركارد تشارك رؤيتها

مجموعة مخترقين تستهدف قادة الكريبتو بهجمات مدعوم بالذكاء الاصطناعي – كاسبرسكي تحذر

New Tab

New Tab

باحثون يحذرون من إمكانية تدريب نماذج الذكاء الاصطناعي لتخدع البشر

Somar Adleh

العالم يحتاج 4 تريليونات دولار سنوياً في استثمارات مراكز البيانات والطاقة، بحسب الرئيس التنفيذي لشركة أدنوك

منزل يفهم ساكنيه – فلسفة LG في تصميم منتجاتها

سامسونج وNvidia تتعاونان لإنشاء «مصنع ضخم للذكاء الاصطناعي» يضم 50 ألف بطاقة رسوميات

مايكروسوفت ترفع استثمارها في الإمارات إلى 15 مليار دولار

رحلة إلى قلب الابتكار: نظرة عن قرب على أحدث تقنيات LG من مقرها في كوريا

الإمارات تعزز حضورها الفضائي بثلاثة أقمار صناعية جديدة لمراقبة الأرض

إيلون ماسك يلمّح: السيارة الطائرة قد تصل خلال 2025

الصين ترفع حظر تصدير شرائح السيارات، والشركات المصنعة تتنفس الصعداء

نقطة ضعف وحيدة تسببت بانقطاع خدمات AWS الأخير – الشركة تؤكد التفاصيل

«هيوماين» السعودية تتعاون مع كوالكوم لتعزيز البنية التحتية للذكاء الاصطناعي في السعودية

صُنع في الإمارات: تعاون بين إنتل وشركة كيرنو لتصنيع الخوادم محلياً

مكتب الذكاء الاصطناعي في الإمارات يطلق مبادرة «الذكاء الاصطناعي للجميع» لنشر مهارات المستقبل التقنية

تريليون دولار في 3 أشهر: شركة Nvidia تصبح أول من يتجاوز عتبة 5 تريليونات دولار

ثغرات أمنية خطيرة تهدد سلامة المركبات – كاسبرسكي تكشف نتائج تحقيقها

مستقبل الابتكار في مجال المدفوعات: بركريتي سينغ من ماستركارد تشارك رؤيتها

مجموعة مخترقين تستهدف قادة الكريبتو بهجمات مدعوم بالذكاء الاصطناعي – كاسبرسكي تحذر

سامسونج وNvidia تتعاونان لإنشاء «مصنع ضخم للذكاء الاصطناعي» يضم 50 ألف بطاقة رسوميات

مايكروسوفت ترفع استثمارها في الإمارات إلى 15 مليار دولار

مكتب الذكاء الاصطناعي في الإمارات يطلق مبادرة «الذكاء الاصطناعي للجميع» لنشر مهارات المستقبل التقنية

تريليون دولار في 3 أشهر: شركة Nvidia تصبح أول من يتجاوز عتبة 5 تريليونات دولار

المدن المبنية على الذكاء الاصطناعي وأهمية التجربة في مقابلة مع «دو»

ما بعد السحابة: مراكز البيانات تنطلق نحو الفضاء

ميزة يوتيوب الجديدة تتيح لك محاربة التزييف العميق وانتحال شخصيتك

شركة الأتمتة UiPath تفتتح مكتبها في الرياض بهدف التوسع في السعودية

OpenAI تفاجئ الجميع وتطلق متصفح ChatGPT Atlas

رئيسة Logitech: يجب أن يحضر الذكاء الاصطناعي في كل اجتماعات مجالس الإدارة

شركتا IBM وAWS تتعاونان لتوفير الذكاء الاصطناعي المحلي وحلول السحابة في الإمارات والسعودية

من السعودية… أول حاسوب ذكاء اصطناعي | مقابلة مع HUMAIN

نصيحة غذائية من ChatGpt تصيب شخص باضطراب نادر

تعرف على الميزات المبهرة التي يقدمها شات جي بي تي إيجنت الجديد

مجموعة أضرار شات جي بي تي على مهاراتك الشخصية يجب أن تحذر منها حتى لا تتعرض لها

شاهد أول صورة فوتوغرافية بالتاريخ بعد أن قام بتلوينها شات جي بي تي

كيف يمكنك التسوق عبر شات جي بي تي وما هي الميزات التي تنافس جوجل؟

حتى مع التقدم المبهر، تعرف على أبرز عيوب شات جي بي تي

دليل شامل لتستفيد من جميع المزايا لنموذج ذكاء اصطناعي قوين ماكس Qwen Max 2.5 مجانا

وثائق محكمة: OpenAI استخدمت مئات آلاف الكتب لتدريب نماذجها وحذفتها لاحقاً

تحديثات جديدة تتيح أقوى ميزات ChatGPT مجاناً وتضيف قدرات محادثة صوتية فورية

ChatGPT سيبدأ بتذكر المحادثات ويجيب حسب الاستخدام لمشتركي Plus

للمرة الأولى، ChatGPT يخسر مكانته كروبوت المحادثة الأقوى وفق التصنيفات

رسمياً: بات بإمكانك استخدام أداة ChatGPT دون إنشاء حساب حتى

سامسونج وNvidia تتعاونان لإنشاء «مصنع ضخم للذكاء الاصطناعي» يضم 50 ألف بطاقة رسوميات

مايكروسوفت ترفع استثمارها في الإمارات إلى 15 مليار دولار

مكتب الذكاء الاصطناعي في الإمارات يطلق مبادرة «الذكاء الاصطناعي للجميع» لنشر مهارات المستقبل التقنية

تريليون دولار في 3 أشهر: شركة Nvidia تصبح أول من يتجاوز عتبة 5 تريليونات دولار

المدن المبنية على الذكاء الاصطناعي وأهمية التجربة في مقابلة مع «دو»

ما بعد السحابة: مراكز البيانات تنطلق نحو الفضاء

ميزة يوتيوب الجديدة تتيح لك محاربة التزييف العميق وانتحال شخصيتك

شركة الأتمتة UiPath تفتتح مكتبها في الرياض بهدف التوسع في السعودية

OpenAI تفاجئ الجميع وتطلق متصفح ChatGPT Atlas

رئيسة Logitech: يجب أن يحضر الذكاء الاصطناعي في كل اجتماعات مجالس الإدارة

شركتا IBM وAWS تتعاونان لتوفير الذكاء الاصطناعي المحلي وحلول السحابة في الإمارات والسعودية

من السعودية… أول حاسوب ذكاء اصطناعي | مقابلة مع HUMAIN