من تسجيل طوله 15 ثانية، أداة جديدة من OpenAI يمكن أن تسرق صوتك
⬤ استعرضت شركة OpenAI أداة ذكاء اصطناعي بإمكانات هائلة من حيث تقليد أصوات البشر واستنساخها.
⬤ يكفي تسجيل صوت بطول 15 ثانية لصنع نسخة يصعب تمييزها من صوت المستخدم وجعلها تقول أي نص مطلوب.
⬤ رغم أنها تقنية مثيرة للإعجاب، هناك علامات استفهام كبرى حول استخدامات الأداة الخبيثة والضارة الممكنة.
عرضت شركة OpenAI مُبتكرة ChatGPT، أداة جديدة لتوليد الصوت عبر الذكاء الاصطناعي تسمى «Voice Engine». ويمكن للأداة الاستماع إلى عينة صوتية لمدة 15 ثانية فقط، ثم استنساخها، بمعنى أنها قادرة على إنتاج نفس الصوت بمجرد الاستماع إليه لمدة قصيرة.
كشفت شركة OpenAI في منشور على مدونتها أنها أجرت مؤخراً اختباراً صغيراً لأداة تُسمى Voice Engine. يمكن لهذه الأداة أن تأخذ إدخال النص وعينة صوتية قصيرة مدتها 15 ثانية من صوت الشخص، ثم تقوم بتوليد كلام يبدو مشابهاً جداً للمتحدث الأصلي. ومن المثير للإعجاب أنه حتى مع عينة قصيرة فقط، يمكن لهذه الأداة توليد أصوات تبدو عاطفية وواقعية.
تعني سرعة الأداة الهائلة أن تسجيلاً صوتياً عبر واتساب، أو حتى جزءاً من مكالمة مسجلة قد تكون كافية لاستنساخ صوت شخص بشكل يصعب تمييزه حتى من قبل المقربين للشخص أو منه نفسه.
تم تطوير Voice Engine لأول مرة في أواخر عام 2022، ويتم استخدامها بالفعل لتشغيل الأصوات المعدة مسبقاً في تطبيقات تحويل النص إلى كلام مثل ChatGPT Voice وRead Aloud. ومع ذلك، تحرص شركة OpenAI على عدم نشرها على نطاق واسع نظراً لوجود خطر من إساءة استخدام الأشخاص للأصوات الاصطناعية.
ما هي الطرق التي يمكن من خلالها استخدام أداة «Voice Engine»؟
- يُمكن أن تُساعد أداة Voice Engine الأشخاص الذين لا يستطيعون القراءة جيداً، بما في ذلك الأطفال، من خلال توليد أصوات طبيعية لقراءة النص بصوت عالٍ. يتم استخدام هذا من قِبل شركات مثل «Age of Learning» لإنشاء محتوى تعليمي.
- يمكن للأداة ترجمة مقاطع الفيديو والبودكاست إلى لغات مختلفة باستخدام صوت المتحدث الأصلي، وهو أمر مفيد للوصول إلى قاعدة جماهير أوسع. وتستخدم شركات مثل «HeyGen» هذه الميزة بالفعل لمنصة سرد القصص المرئية الخاصة بها.
- يتم تجربة الأداة كذلك في البيئات السريرية لمساعدة المرضى على استعادة القدرة على الكلام. حيث استخدمها الأطباء على سبيل المثال لاستعادة صوت مريض يُعاني من فقدان النطق بسبب ورم في المخ، وفقاً لمدونة OpenAI.
لم تُخف OpenAI مخاوفها بشأن خطورة الأداة وإمكانية استخدامها في أمور ضارة أمنياً، واعترفت بإمكانية حدوث جرائم بسبب إساءة الاستخدام، مثل نشر معلومات مضللة أو انتحال صوت شخص ما. لهذا السبب، تظل Voice Engine متاحة في معاينة محدودة فقط في الوقت الحالي.
أكدت الشركة كذلك أنها تسعى في الوقت الحالي إلى معالجة هذه المخاوف من خلال البحث والمناقشة المفتوحة مع جميع الهيئات والشركات، لتحديد أفضل طريقة لنشر هذه الأداة القوية وإعداد المجتمع للمستقبل المستند على تقنيات الذكاء الاصطناعي.
مع اكتساب التزييف العميق والمحتويات الأخرى التي ينتجها الذكاء الاصطناعي المزيد من قابلية التصديق، أصبحت القدرة على التمييز بين المخرجات الحقيقية والمصطنعة صعبة على نحو متزايد. تدرك OpenAI التحديات، بما في ذلك المشكلات المحتملة المتعلقة بالمصادقة الصوتية وعمليات الاحتيال عبر الهاتف. سيكون إيجاد حلول لهذه المشكلات أمراً بالغ الأهمية مع تقدم تكنولوجيا توليد الصوت باستخدام الذكاء الاصطناعي. سيتعين على المجتمع أن ينتظر ويراقب، آملاً أن تقع أداة Voice Engine بين الأيادي الصحيحة في كل تجربة استخدام.