جوجل تريد استخدام الروبوتات البرمجية لتدريب الأذرع الروبوتية وجعلها «ذكية»
⬤ طور باحثون في فريق DeepMind Robotics التابع لجوجل نظام AutoRT الذي يستفيد من نموذج اللغة البصرية لتحسين الوعي بالوضع المحيط عند الروبوتات.
⬤ تؤدي الروبوتات عادة بطريقة جيدة عند قيامها بمهمة واحدة مطلوبة منها، لكنها تلاقي بعض الصعوبة حينما تواجه تغييراً أو خطاً في سلسلة الإجراءات.
⬤ يستطيع نظام AutoRT إدارة أسطول من الروبوتات التي تعمل بانسجام، وتكون مجهزة بكاميرات للحصول على مخطط للبيئة المحيطة بها والأشياء حولها.
نشر باحثون ضمن فريق DeepMind Robotics التابع لشركة جوجل منشوراً أبرزوا فيه الأبحاث المستمرة في مجال الروبوتات، وذكروا الجهود المتواصلة لمنح الروبوتات فهماً أفضل لطبيعة الأمور التي يريدها البشر منها.
تُكرّر الروبوتات عادةً أداء مهمة واحدة طوال مدة استخدامها، وهي تؤدي بطريقة جيدة عند القيام بهذه المهمة الوحيدة، لكنها تواجه صعوبة عندما تطرأ عليها دونَ قصدٍ بعض التغييرات أو الأخطاء في الإجراءات.
جرى تصميم نظام الذكاء الاصطناعي AutoRT لاستخدام نماذج التأسيس الضخمة في أغراض متنوعة، وقد استعرض فريق DeepMind مثالاً على ذلك؛ إذ يبدأ النظام بالاستفادة من نموذج اللغة البصرية (VLM) لتحسين الوعي بالوضع المحيط عند الروبوتات. ويستطيع نظام AutoRT أنْ يتولى إدارة أسطول من الروبوتات التي تعمل بانسجام معاً، وتكون مجهزة بكاميرات للحصول على مخطط للبيئة المحيطة بها والأشياء الموجودة ضمنها.
في الوقت عينه يقترح نموذجُ لغةٍ ضخمٌ المهام التي تستطيع الروبوتات إنجازها، ومن ضمنها ذراع الروبوت العامل (end effector). ويرى كثيرون أنّ نماذج اللغة الضخمة هي الوسيلة المفتاحية لتطوير أذرع روبوتية لديها فهم مطرّد لأوامر اللغة الطبيعية، وبذلك لا تحتاج عملية التطوير والتصنيع إلى مهارات برمجية معقدة.
اختبر الباحثون النظام الجديد خلال الأشهر الماضية، فاستطاع AutoRT إدارة 20 روبوتاً في وقت واحد، فضلاً عن 52 جهازاً مختلفاً. وأجرى فريق DeepMind نحو 77 ألف تجربة تضمنت تنفيذ أكثر من 6 آلاف مهمة.
كذلك أتى الفريق بنموذج جديد هو RT-Trajectory، الذي يستفيد من مدخلات الفيديو لتدريب الأذرع الروبوتية؛ ففي الوقت الحالي تعكف فرق بحثية كثيرة على استخدام فيديوهات يوتيوب كوسيلة لتدريب الروبوتات على نطاق كبير، غير أنّ RT-Trajectory يأتي بطبقة مثيرة للاهتمام ويضيف إلى الفيديو مخططات ثنائية الأبعاد لذراع الروبوت العامل.
يقول الفريق: «تأتي هذه المسارات على شكل صور RGB، وهي تعطي تلميحات مرئية وعملية للنموذج في أثناء تعلم سياسات التحكم بالروبوتات». وتقول شركة DeepMind إنّ التدريب ضاعف معدل نجاح تدريب RT-2 في أثناء اختبار 41 مهمة، وذلك بنسبة 63% مقارنة بـ 29% سابقاً.
يتابع الفريق حديثه: «يستفيد نموذج RT-Trajectory من المعلومات الغزيرة بخصوص حركة الأذرع الروبوتية، التي توجد في جميع مجموعات بيانات الروبوتات، لكنها غير مستغلة بالقدر الكافي. يشكل نموذج RT-Trajectory خطوة مهمة على طريق تطوير وتصنيع روبوتات يسعها الحركة بدقة وفعالية عند تعرضها لمواقف جديدة، ويشكل أيضاً وسيلة مهمة لاكتساب المعلومات من مجموعات البيانات الحالية».