بعد اكتشافي لفجوة مفاجئة في جدول أعمالي في مؤتمر مطوري الألعاب لعام 2024 ، نظرت إلى أحد العروض الرقمية التي تعرض فعاليات اليوم. لفتتني إحدى المحادثات في قمة التعلم الآلي: 'قمة التعلم الآلي: توليد كلام خيالي لتجنب المخاطر في المحتويات الإبداعية'.
'توليد كلام خيالي؟' كان ذلك رائعًا. يعلم أي عاشق للفانتازيا قدر العمل الذي تم في لغات الخيال مثل الإلفية في سيد الخواتم والكليجون في ستار تريك. إنه مشروع يقوده الشغف ويُعتبر رائعًا لبناء العوالم. هل كانت Square Enix تأمل في استخدام التكنولوجيا لتوظيف هذه التقنية اللغوية بكفاءة في ألعاب الفانتازيا العديدة التي تمتلكها؟
الإجابة: غير واضحة. لم يشير الباحث في الذكاء الاصطناعي Yusuke Mori إلى ما إذا كانت أبحاثه تُستخدم في أي إنتاج لعبة نشط. كانت المحاضرة قريبة من عرض أكاديمي استكشف البحث والنهج المحتملة لاستخدام التكنولوجيا، ليس التطوير النشط.
ومع ذلك ، كان من الشيق التقاط جزء من عمله. كان ما قَدَّمه لا يبدو مفيدًا على الفور لشخص يأمل في توليد لعبة صراع العروش، ولكنه كان يشبه نسخة أكثر تصقلًا من السيمليش الموجودة في سلسلة سيمز أو حبراب الشخصيات في سلسلة أنيمال كروسينج.
ذات صلة: تقول SAG-AFTRA إن شروط الصفقة المثيرة للجدل بشأن تقنية الصوت الاصطناعية ستؤثر على المفاوضات المستقبلية
وفيما يلي تفصيل سريع عن ما قدمه Mori.
أداة Square Enix الذكاء الاصطناعي تدعم إنشاء لغة ديناميكية وثابتة
قدم Mori زوجًا من العروض التوضيحية التي شرحت كيفية استخدام التكنولوجيا في البيئات الرقمية. أظهر الأول كيف يمكن استخدام الأداة لترجمة السطر الافتتاحي من رواية هيرمان ميلفيل موبي ديك ، وأظهر الثاني كيف يمكن للاعبين التعامل مع هذه اللغات في مساحة ثلاثية الأبعاد.
في السابق ، تم نطق عبارة 'اُدعني إسماعيل. منذ سنوات عدة - لا يهم مقدارها بالضبط - ولم يكن لدي الكثير من المال في محفظتي، ولم يكن هناك أي شيء معين يثير اهتمامي على الشاطئ، فقط فكرت بأنني سأبحر قليلاً وأرى الجزء المائي من العالم' بواسطة أداة التحويل من النص إلى كلام اصطناعي - لكن الكلمة الوحيدة التي يمكنك اختيارها كانت 'إسماعيل'. طلب Mori من الجمهور التفكير في كيف سيبدو موبي ديك في عالم خيالي ، يتم قراءتها بصوت مرء يتحدث لغة ليست من كوكب الأرض. ستظل الأسماء الدالة كما هي ، بينما ستتناسب كل كلمة أخرى بطبيعة الحال مع تلك العالم اللعبة.
أظهر ثلاثة تحولات للنص الخيالي ، كل منها يصقل الكلمات بشكل أكثر تحديدًا ، لضمان أن لا تبدو 'عشوائية'.
في العرض التوضيحي التالي (الذي تم تقديمه باستخدام أصول ثلاثية الأبعاد بسيطة جدًا) ، اقترب اللاعب من NPC وقال 'مرحبًا بك في العالم الجديد. نحن نخطط الآن لإنشاء بلدتنا هنا.' ثم اقترب من اثنين من NPCs آخرين ، الذين تحدثوا بنفس اللغة في حديث ذهاب وإياب (لم يكن بإمكان Mori مشاركة بدقة ما يتم قوله).
كان شرح Mori التالي مُربكًا قليلاً. ظهر أنه إذا ظهرت الكلمات في نمط ثابت ، فإن اللاعبين سيكونون قادرين على استنتاج معناها وترجمة جميع اللغات في اللعبة. اقترح بدلاً من ذلك أن تكون الكلمات عشوائية لدرجة أن 'لا توجد إجابات صحيحة' حتى يكون تفسير كل لاعب للنص صالحًا.
من خلال التكنولوجيا ، سيتمكن المطورون من كتابة النص بلغتهم الأم التي يتم تحويلها تلقائيًا إلى اللغة الخيالية.
في الواقع ، هذا غير صحيح تمامًا. أوضح Mori أن بعض اللغات أسهل في تضمينها في هذا النظام من غيرها. 'من السهل نسبيًا تحويل النصوص اليابانية لأن النص يشمل الكانجي والهيروغانا والكاتاكانا' ، قال. 'كان هناك مشكلة في اللغات مكتوبة بأبجدية غربية' ، قال.
يبدو أن النص المكتوب بالإنجليزية يعمل بشكل جيد ، ولكن النص بالفرنسية والألمانية لم يتفاعل بنفس الانسجام مع النظام. بالنسبة للأذن غير المدربة ، لم يكن من السهل تمييز المشاكل التي وصفها Mori.
اقترح Mori حلاً بسيطًا: ما عليك سوى نسخ النص من لغة حقيقية إلى الأخرى ، ثم إدخاله في الأداة.
كان من الصعب شرح كيفية عمل الأداة ، حيث اعتمد على بحوث Mori السابقة حول 'الرموز' في توليد النص القائم على تعلم الآلة.
ماهي المخاطر لهذه التكنولوجيا؟
كان Mori حازمًا للغاية في مناقشة العيوب التي تأتي مع استخدام هذه التكنولوجيا. 'قد تحتوي النصوص العامة على محتوى ضار' ، أقر. لم يحدد ما إذا كان هذا يشير إلى رسائل كراهية قد تظهر من فم شخصيات غير قابلة للتحكم ، أو إذا كانت التكنولوجيا قد تخرج عراقيل إذا أعطي المزيد من الوقت والمتغيرات الغير متحكم فيها.
كان يواجه خوفًا من أنه على الرغم من أن اللغات الخيالية قد تكون متسقة ، إلا أنها لن تلتقط النظام اللغوي لكيفية تطور اللغات الطبيعية. لا يمكن إنشاء تاريخ اللغة والخلفية الثقافية للعالم بنفس الأصالة التي تم استخدامها في اللغات الحقيقية.
هناك أيضًا احتمال أنه مع محاولة اللاعبين لتحديد معنى اللغة ، فإنهم قد يسيؤون فهمها إلى حد أن يجعلون افتراضات غير صحيحة حول ما قصد المطورون في اللعبة.
'كيفية استخدامه مهم للغاية' ، أكد.
ما مدى موثوقية تكنولوجيا اللغة الخيالية التي تولدها الذكاء الاصطناعي؟
عندما وصفت التكنولوجيا مع الحضور الآخرين حول GDC ، كنت أواجه بانتظام انزعاجًا من تطبيقها. علق أحد أقراني بأن العملية تلغي ما يجعل اللغات مثل الإلفية والكليجون ساحرة للغاية: تم إنشاؤهما من قبل خبراء لغويين يمكنهم تقليد بعض الصفات التي ذكرها Mori كأنها تفتقده.
هناك عنصر غير مريح آخر يعكس كيف يقاوم الممثلون الصوتيون لحمايتهم من استبدال الأداء الصوتي المولد بشكل اصطناعي.
لم تكن مراكز Mori ليست فقط حول تحويل النص من لغة محكية إلى لغة خيالية ، بل كانت عن تجميع الأدوات التي ستمكن برنامج تحويل النص إلى كلام من إنشاء كلمات وقواعد لنطقها على الفور.
ولكن تفسير كيف سيستخدم Square Enix هذه التكنولوجيا يتطلب قليلاً من الوعي بالذات. هذه في الأساس أداة للترجمة الاصطناعية ، وربما قد تكون الترجمة من اليابانية إلى الإنجليزية قد أثرت على كيفية تصور حضور GDC لحديث Mori. الإنجليزية ليست لغته الأولى ، وقد تم فقدان التفصيل حول استخدام التكنولوجيا...حسنًا ، في الترجمة.
المطورون المتخصصين في تعلم الإنتاج ، ومهندسي الصوت ، وحتى الكتاب مثلي لديهم شيء يمكن الاستفادة منه من خلال دراسة تقدم Square Enix في هذه التكنولوجيا. إذا لم يتمكن توليد الإنتاج من التغلب على المخاطر التي وصفها Mori ، ربما النهج البشري التقليدي لتول