اقترب العلماء من جعل التمييز بين الإنسان والروبوت تحديًا بصريًا، بعدما طور فريق من جامعة كولومبيا روبوتًا قادرًا على تحريك فمه وتعابير وجهه بطريقة تشبه البشر بشكل لم يسبق له مثيل، ما يمهد لمرحلة جديدة من التفاعل بين الإنسان والآلة.
الروبوت المبتكر، المسمى "إيمو" (EMO)، يستطيع مزامنة حركة شفتيه مع الكلام بدقة عالية، متجاوزًا ما يجعل الروبوتات التقليدية تبدو غريبة أو مزعجة عند محاكاة الشكل البشري دون مطابقة دقيقة.
اعتمد الباحثون على أسلوب مبتكر لتعليم الروبوت، من خلال السماح له بمراقبة انعكاس صورته في المرآة، ليتمكن من فهم العلاقة بين حركة محركات وجهه الستة والعشرين المصنوعة من السيليكون والتعابير الناتجة، وتتمتع هذه المحركات بقدرة على الحركة ضمن عشر درجات من الحرية لكل منها، ما يمنح الروبوت تعابير وجهية مرنة وطبيعية.
خلال مرحلة التدريب، قام EMO بتحريك آلاف التعابير العشوائية أمام المرآة باستخدام نظام ذكاء اصطناعي يعرف بـ"نموذج الرؤية إلى الفعل" (VLA)، الذي يترجم ما يراه إلى حركات جسدية دون الاعتماد على قواعد مسبقة.
كما عُرض الروبوت لساعات طويلة من مقاطع الفيديو التي تظهر أشخاصًا يتحدثون ويغنون بلغات مختلفة، ما ساعده على ربط حركات وجهه بالأصوات المنطوقة، دون فهم معناها، وتمكن في نهاية المطاف من التعامل مع عشر لغات ومزامنة شفتيه بدقة شبه مثالية.
وقال هود ليبسون، أستاذ الهندسة ومدير مختبر الآلات الإبداعية في جامعة كولومبيا: "واجهنا صعوبات مع بعض الأصوات التي تتطلب ضم الشفاه، لكن الأداء يتحسن مع الوقت والتدريب".
وقبل الإعلان الرسمي، أجرى الفريق اختبارات على 1300 متطوع، عرضوا عليهم مقاطع فيديو لثلاث طرق مختلفة لتحريك فم EMO، بينها تقنية VLA وطريقتان تقليديتان، إضافة إلى نموذج مرجعي مثالي، وطلب منهم اختيار الأقرب إلى حركة الشفاه الطبيعية، فاختار 62.46% منهم تقنية VLA، ما أكد تفوق النموذج الجديد.
وأكد الباحثون أن تعابير الوجه تلعب دورًا جوهريًا في التواصل الإنساني، إذ تشير الدراسات إلى أن الأشخاص يركزون على وجوه من يتحدثون إليهم، مع اهتمام خاص بحركة الفم التي تؤثر على فهم الأصوات.
وأوضح الفريق أن تجاهل هذا الجانب كان سببًا رئيسيًا في فشل محاولات سابقة لإنتاج روبوتات مقنعة، ولفت ليبسون إلى أن كثيرًا من المطورين يركزون على حركة الأطراف، بينما تُهمل تعابير الوجه، رغم أهميتها في تطبيقات تتطلب تفاعلًا مباشرًا مع البشر، مثل التعليم، والرعاية الصحية، وخدمة كبار السن.
ومن جانبه، قال يوهانغ هو، المعد الرئيسي للدراسة، إن الروبوتات ذات الوجوه المعبرة ستكون أكثر قدرة على بناء علاقات تواصل فعالة مع البشر، لأن لغة الوجه والجسد تمثل جزءًا أساسيًا من التفاعل اليومي.