فشل التمييز بين الأصوات المولدة بالذكاء الاصطناعي والأصوات البشرية الحقيقية

أظهرت اختبارات أجريت في لندن التسجلات الصوتية المزيفة التي يتم إنتاجها بما يسمى "التزييف العميق" باستخدام مجموعة شديدة التنوع من البرامج، تشبه جدا التسجيلات الحقيقية بحيث يصعب على أغلب الناس التمييز بينها.
وخلص فريق من الباحثين في جامعة كوين ماري بلندن، بعد دراسة استمع فيها المشاركون إلى عينات من الأصوات المولدة بالذكاء الاصطناعي والأصوات الحقيقية، إلى أنه لم يعد ممكنا التمييز بين الأصوات المولدة بالذكاء الاصطناعي والأصوات البشرية الحقيقية".
ووفقًا للفريق، "وصلت تقنية توليد الأصوات بالذكاء الاصطناعي إلى مرحلة تتيح لها إنشاء "نسخ صوتية" أو "تزييف عميق" تبدو واقعية تمامًا مثل التسجيلات البشرية".
في الدراسة التي نُشرت في مجلة بي.إل.أو.إس أون العلمية، قال الفريق البحثي إنهم "قارنوا أصواتا بشرية حقيقية بنوعين مختلفين من الأصوات الاصطناعية، المولدة باستخدام أحدث أدوات توليف الأصوات بالذكاء الاصطناعي".
وأضافوا: "تم استنساخ بعض الأصوات من تسجيلات صوتية لبشر حقيقيين، بهدف تقليدهم، بينما تم توليد البعض الآخر من نموذج صوتي ضخم، دون أن يكون له نظير بشري محدد". وأوضحوا أنهم طُلبوا من المشاركين في الدراسة تقييم أي الأصوات تبدو أكثر واقعية، وأيها تبدو أكثر تأثيرا أو موثوقية.
وقالت نادين لافان، المحاضرة البارزة في علم النفس بجامعة كوين ماري بلندن: "لم تكن سوى مسألة وقت حتى بدأت تقنية الذكاء الاصطناعي إنتاج كلام طبيعي ذي صوت بشري"، محذرة من "حاجتنا الماسة لفهم كيفية إدراك الناس للحقيقة الاصطناعية لهذه الأصوات الواقعية".
وأضافت لافان: "تطلبت العملية (إنتاج أصوات مزيفة يصعب تمييزها) خبرة بسيطة، وبضع دقائق فقط من التسجيلات الصوتية، وتكاليف شبه معدومة"، مشيرة إلى أن التسجيلات المزيفة صنعت باستخدام "برامج متوفرة تجاريا".