مايكروسوفت تعلن نموذجًا لتحويل الصورة إلى فيديو
حققت مايكروسوفت قفزة كبيرة في مجال توليد المحتوى المعتمد على الذكاء الاصطناعي من خلال إعلان نموذج جديد للذكاء الاصطناعي يمكنه توليد مقاطع فيديو واقعية للغاية لوجوه بشرية تتحدث.
ويمكن لنموذج تحويل الصورة إلى الفيديو المدعوم بالذكاء الاصطناعي VASA-1 توليد مقاطع فيديو من صورة واحدة فقط ومقطع صوتي للكلام.
وتقول الشركة إن مقاطع الفيديو المولدة تحتوي حركات الشفاه المتزامنة لتتناسب مع الصوت بالإضافة إلى تعبيرات الوجه وحركة الرأس لجعلها تبدو طبيعية.
ولا تنوي مايكروسوفت إطلاق منتج أو واجهة برمجة تطبيقات تستفيد من نموذج VASA-1 نظرًا إلى الخطر الواضح المتمثل في توليد التزييف العميق من هذه التكنولوجيا.
وفصلت مايكروسوفت طريقة عمل نموذج الذكاء الاصطناعي، وسلطت الضوء على قدراته. وتدعي الشركة أن VASA-1 قادر على توليد مقاطع فيديو بدقة قدرها 512×512 بكسلًا بمعدل يصل إلى 40 إطارًا في الثانية.
ويدعم نموذج الذكاء الاصطناعي توليد الفيديو عبر الإنترنت مع زمن تأخر لا يكاد يذكر. ويقدم VASA-1 ما يصل إلى دقيقة واحدة من مقاطع الفيديو بجودة عالية من خلال صورة ثابتة واحدة.
وسلطت الشركة الضوء على قدرته على توليد حركات الشفاه المتوافقة مع الملف الصوتي وتعبيرات الوجه التي تتماشى معه.
ويوفر نموذج توليد الفيديو بتقنية الذكاء الاصطناعي تحكمًا دقيقًا للمستخدم في جوانب مختلفة من الفيديو، مثل الاتجاه الرئيسي لنظرة العين ومسافة الرأس والمزيد.
وتساعد هذه العناصر في التحكم في وضعية الرأس الثلاثية الأبعاد وديناميكيات الوجه، مما يساعد في تعديل الإخراج وفقًا لتوجيهات المستخدم.
كما أن نموذج الذكاء الاصطناعي قادر أيضًا على توليد مقاطع فيديو باستخدام الصور الفنية والصوت الغنائي والكلام غير الإنجليزي.
ويشير باحثو مايكروسوفت إلى أن القدرة على هذه الوظائف لم تكن موجودة في بياناته، مما يشير إلى قدرة النموذج على التعلم الذاتي.
وأكدت الشركة أنها لا تنوي إطلاق نموذج الذكاء الاصطناعي للجمهور وتريد توليد شخصيات تفاعلية افتراضية باستخدامه.
وقالت مايكروسوفت: “مع الاعتراف بإمكانية سوء الاستخدام، فمن الضروري أن ندرك الإمكانات الإيجابية الكبيرة لتقنيتنا، مثل تعزيز المساواة التعليمية، وتحسين إمكانية الوصول للأفراد الذين يعانون من تحديات التواصل، وتقديم الرفقة أو الدعم العلاجي للمحتاجين”.
وأضافت الشركة: “نحن ملتزمون بتطوير الذكاء الاصطناعي المسؤول بهدف تعزيز رفاهية الإنسان”.