مايكروسوفت تطور تقنية ستلغي الثقة بمصداقية التسجيلات الصوتية
⬤ كشفت مايكروسوفت عن تقنية ذكاء اصطناعي جديدة قادرة على تصميم تزييف عميق للصوت وبدقة عالية.
⬤ المميز في التقنية الجديدة هو أنها لا تحتاج لحجم عينات كبير، بل يكفي الحصول على 3 ثوانٍ من الكلام لتقليد الصوت.
⬤ تحافظ الأداة على المشاعر والانفعالات عند محاكاة الصوت مما يجعلها مقنعة كصوت بشري.
قبل أيام، كشفت شركة مايكروسوفت عن مشروع جديد قامت بتصميمه باسم VALL-E، وقالت إنه ذكاء اصطناعي جديد مصمم لإنتاج الصوت الآلي بشكل يحاكي الصوت وطريقة الكلام البشرية وبدقة عالية جداً.
يستطيع الذكاء الاصطناعي الجديد من مايكروسوفت إعادة تصنيع أي صوت بشري يسمعه لمدة قصيرة لا تتجاوز ثلاث ثوانٍ فقط. وعلى الرغم من العينات الصغيرة، يمكن للذكاء الاصطناعي أن يحافظ على طريقة الكلام والنبرة والمشاعر والانفعالات التي تظهر في الصوت البشري عادة.
يعتقد العلماء المطورون لبرمجية VALL-E أنه سيكون أداة مفيدة جداً في مجال تحويل النصوص المكتوبة إلى صوت، بالإضافة لتعديل الكلام بحيث يمكن تحديث المعلومات في مقابلة مثلاً بناءً على النص المكتوب لها دون الحاجة لإعادة تصويرها.
يتميز الذكاء الاصطناعي الجديد عن سابقيه بكونه لا يقوم بالتلاعب بأمواج الصوت كما هو معتاد في محاولات تقليد الصوت البشري. بل يتم استخدام مقاربة مختلفة قائمة على تقسيم الصوت إلى أجزاء الترميز المكونة لها، ومن ثم إعادة ترتيب هذه الأجزاء لتصنيع الأصوات الجديدة بشكل أكثر إقناعاً. وقد تم تدريب الذكاء الاصطناعي على مكتبة صوتية كانت قد جمعتها شركة Meta وتتضمن عينات صوتية من أكثر من 7000 متحدث.
بالطبع يمتلك هذا النوع من التقنيات العديد من النواحي المقلقة. حيث يمكن أن يقود الاستخدام السيء إلى إنتاج المزيد من محتوى التزييف العميق المضلل، أو يمكن استخدامه لانتحال الشخصيات وجعل عمليات التصيد الاحتيالي أكثر فعالية وأسهل لخداع الضحايا. وبالطبع هناك احتمال استخدام هذا النوع من التقنيات بمرافقة تقنيات روبوتات المحادثة لأتمتة عمليات الاحتيال أو حتى مكالمات التسويق الهاتفي المزعجة.