استنساخ الأصوات بالذكاء الاصطناعي يفتح مجالات واسعة للترفيه..والتزوير
استخدم مصوّر فيديو فرنسي تقنية الذكاء الاصطناعي “ديب فايك” (التزييف العميق) لمحاكاة أصوات سياسيين حاليين وراحلين يقيمون حواراً حياً مع المستخدمين عبر منصة “تويتش”، ومنهم مثلاً الرئيس الفرنسي إيمانويل ماكرون واثنان من أسلافه المشهورين هما شارل ديغول وجاك شيراك.
وقد كان أنيس العياري، وهو مهندس في الذكاء الاصطناعي وصاحب قناة على يوتيوب للتبسيط العلمي تحمل اسم “ديفند إنتلجنس”، وراء هذا “التزييف العميق” الذي أنجزه كمضمون ساخر.
غير أن التجربة أخذت أبعاداً سلبية، عندما سأل أحد مستخدمي الإنترنت “ماكرون” المزعوم عن أسوأ اسم لقرية فرنسية، فأجاب الذكاء الاصناعي “لا مور أو جويف” (“La Mort-aux-Juifs” – ومعنى اسمها بالفرنسية “الموت لليهود”)، وهي قرية صغيرة في منطقة لواريه في وسط فرنسا جرى تغيير اسمها سنة 2015. وقد أدى ذلك إلى المنع الفوري للقناة.
وكتب صاحب القناة في رسالة عبر منصة إكس (تويتر سابقاً)، أنه تقدم بطلب استئناف للقرار، وأعاد إطلاق جلسات البث الحي عبر منصة “كيك.كوم” المنافسة.
قبل أشهر، هذا الخبير الذي يروّج لـ”مساعدين” افتراضيين لدى الشركات، استخدم أيضاً تقنية التزييف العميق ليجعل الرئيس الفرنسي يغنّي بصوته أغنية للمغني الشهير شارل أزنافور. وقد كشف في مقطع فيديو التقنيات التي اعتمدها في هذه الحيلة المصورة.
وأخيراً، بدأ العياري في استنساخ شخصيات تاريخية أو أخرى آنية من أمثال إيلون ماسك، مع إشراكهم في “نقاشات” مع لاعبين سياسيين حاليين.
ويقول أنيس العياري لوكالة فرانس برس “سنجري محاكاة لنقاش سياسي وسنرى إلى أين سنصل في هذا الأمر”.
ولنسخ صوت أحد الشخصيات، يكفي جمع بضع دقائق من خطاب له، من دون أي تشويش خارجي. بعدها، تتولى برمجيات إنشاء نموذج لصوته، بما يتيح استخدامه في محتويات جديدة، حتى بلغات أجنبية.
ويوضح مبرمج المعلوماتية “إذا كان لدينا 15 إلى 30 ثانية بنوعية جيدة، نبدأ في الحصول على نتائج لافتة. ولم يعد هناك حالياً أي حاجة للإلمام في برمجة المعلوماتية”. وقد أطلق العياري نداء لتمويل البث الحي لنسخته من الرئيس الفرنسي.
ويؤكد العياري أن استخدامه لخدمات معلوماتية مختلفة يكلفه حوالى 150 يورو في اليوم.
غير أن التقليد له حدود، إذ إن حركة الشفتين تُظهر بعض الثغرات. وبمواجهة الأسئلة العبثية من بعض مستخدمي الإنترنت، يُعطي إيمانويل ماكرون بالنسخة المقلدة إجابات غريبة، بينها على سبيل المثال “موضوع نظام التقاعد خارج عن برمجتي. فلنتطرق إلى مواضيع مسلّية أكثر”.
كما يقول الرئيس الفرنسي بالنسخة المطورة عبر الذكاء الاصطناعي “تصريحي عن الأصول التي أملكها يتمتع بالصدقية نفسها لوعود سياسي في حملته الانتخابية”.
ويلفت أنيس العياري إلى أن “طفرة في توليد الأصوات حصلت العام الماضي، والأمر آخذ في التسارع”. ويجري حالياً العمل على مشاريع عدة تتيح لأشخاص من غير المتخصصين التدرب على إنجاز مقاطع بتقنية التزييف العميق، في الصين وكوريا الجنوبية واليابان، حيث تقليد أصوات شخصيات “المانغا” (رسوم متحركة يابانية) يحظى بشعبية كبيرة.
وعلى قناة “ترامب أور بايدن 2024” عبر تويتش، خاضت نسختان مطورتان بالذكاء الاصطناعي عن الرئيس الأميركي الحالي جو بايدن وسلفه دونالد ترامب، في تراشق كلامي استمر طويلاً خلال الصيف، ولا يزال متواصلاً تحت أنظار المئات من مستخدمي الإنترنت الذين يمكنهم إطلاق مواضيع للنقاش كتابياً.
كما دفع موسيقيون ثمناً جراء هذه التقنيات، إذ جرى استنساخ أصواتهم في أعمال فنية من دون أن يتقاضوا أي مقابل. ويبدي الممثلون، من ناحيتهم، قلقاً من استخدام صورهم من الاستوديوهات، وتسجل الأوساط العاملة في مجال أمن المعلوماتية تنامياً لتقنيات الاحتيال الهاتفي القائم على استنساخ الأصوات.
لكن هل يتعين الخوف من موجة تضليل إعلامي جديدة باستخدام هذه التقنيات؟ يجيب أنيس العياري “كلما أدرك الناس (بانتشار تقنية التزييف العميق)، سيتعزز لديهم الحس النقدي”. ويجاهر العياري عبر قناته بأن المضمون الذي ينشره “ساخر”.