شركة Meta تطلق نموذج ذكاء اصطناعي يستطيع توليد فيديو تزييف عميق من صورة واحدة فقط
⬤ أعلنت Meta عن أداة Movie Gen لتحرير وتوليد الفيديو بالذكاء الاصطناعي انطلاقاً من الصور والمطالبات النصية.
⬤ يستطيع النموذج توليد الفيديو من صورة واحدة فقط، مما أشعل مخاوف التزييف العميق لهذا النوع من التقنيات.
⬤ يصل طول مقاطع الفيديو المولدة عبر Movie Gen إلى 16 ثانية، بدقة 1080p، وبمعدل 16 إطاراً في الثانية.
أعلنت Meta، الشركة المالكة لكل من فيسبوك وInstagram، يوم الجمعة، عن نسخة معاينة من Movie Gen، وهي عبارة عن حزمة نماذج ذكاء اصطناعي جديدة قادرة على إنشاء مقاطع فيديوية وصوتية واقعية انطلاقاً من مطالبات المستخدم النصية، مع إمكانية تحرير المقاطع الموجودة مسبقاً وإدراج تغييرات فيها، وتحويل صور الأشخاص إلى مقاطع شخصية واقعية.
استندت Meta في Movie Gen على مجهوداتها السابقة في مجال تخليق الفيديو، والحديث هنا عن أداة Make-A-Scene التي صدرت في العام 2022 بالإضافة إلى نموذج Emu للصور. لكن الميزة الأكثر إثارة في الوافد الجديد هي القدرة على توليد أصوات متزامنة مع محتوى الفيديو، ما يعني مستوى عالياً من الواقعية.
أما بالنسبة إلى بيانات التدريب، فتقول Meta إنها اعتمدت على مزيج من «مجموعات بيانات مرخصة ومتاحة للجمهور»، ويُحتمَل جداً أنها تشمل مقاطع الفيديو التي جرى تحميلها بواسطة مستخدمي فيسبوك وInstagram على مر السنين، وتلك مجرد تكهنات بناء على سياسات Meta الحالية وسلوكها السابق أيضاً.
ليست Meta اللاعب الوحيد في هذا النوع من نماذج وأدوات الذكاء الاصطناعي؛ إذ سبقتها Google مع نموذج Veo في مايو الفائت. لكن Meta تدعي تفوق Movie Gen في اختبارات التفضيل البشري على Sora من OpenAI، وGen-3 من Runway، ونموذج Kling صيني المنشأ.
من بين العينات التي درى تقديمها كمثال على إبداعات Movie Gen مقاطع فيديو لحيوانات تسبح وتتزلج على الأمواج، بالإضافة إلى مقاطع تستخدم صوراً حقيقية للأفراد لتصورهم وهم يقومون بأفعال مثل الرسم، والشرب، والتبسم، وغير ذلك.
يصل طول المقاطع الصوتية المولدة بواسطة Movie Gen إلى 45 ثانية. في حين ينحصر طول الفيديوهات في 16 ثانية، وعلى دقة 1080p، وبمعدل 16 إطاراً في الثانية.
يأتي إعلان Meta في وقت تواجه فيه هوليوود تحديات في كيفية تسخير تقنيات الذكاء الاصطناعي. ففي حين يتوق خبراء التقنية في صناعة الترفيه لاستخدام مثل هذه الأدوات لتحسين وتسريع إنتاج الأفلام، ينتاب البعض القلق بشأن الاستخدام غير المرخص لأعمال محمية بحقوق الطبع والنشر في تدريب تلك الأنظمة والنماذج. فضلاً عن الهواجس المتعلقة باستخدام الجيل القادمة من تقنيات توليد الفيديو في التزييف العميق، ونشر التضليل، والتأثير على الأحداث العالمية.
على المقلب الآخر، أشار متحدثون باسم Meta إلى أن الشركة على الأرجح لن تُقدم على إطلاق Movie Gen للاستخدام المفتوح من قبل المطورين، كما فعلت مع سلسلة النماذج اللغوية الكبيرة Llama، قائلين إنها تدرس المخاطر بشكل إفرادي لكل نموذج على حدة.