أطلقت ElevenLabs ، المنصة القائمة على الذكاء الاصطناعي الفيروسي لإنشاء الأصوات الاصطناعية ، اليوم منصتها خارج المرحلة التجريبية بدعم لأكثر من 30 لغة.
باستخدام نموذج AI جديد تم تطويره داخليًا ، يقول ElevenLabs إن أدواته الآن قادرة على تحديد اللغات تلقائيًا ، بما في ذلك الكورية والهولندية والفيتنامية ، وتوليد كلام 'غني بالعواطف' في تلك اللغات.
بالاشتراك مع النموذج الجديد ، يمكن لعملاء ElevenLabs الاستفادة من أداة تكرار الأصوات على المنصة للتحدث عبر اللغات الكثيرة تقريبًا دون الحاجة أولاً إلى كتابة النص.
وقال الرئيس التنفيذي والمؤسس المشارك لـ ElevenLabs ماتي ستانيسيفسكي في بيان: 'تم تأسيس ElevenLabs بحلم جعل جميع المحتويات متاحة عالميًا بأي لغة وبأي صوت. مع هذا الإصدار ، نحن على بعد خطوة واحدة من تحقيق هذا الحلم وتوفير أصوات AI عالية الجودة المتاحة بجميع اللهجات. أدوات توليد النصوص إلى الكلام لدينا تساعد في تحقيق المساواة وتجلب إمكانيات الصوت المسموع عالية الجودة لجميع الأشخاص الذين هم مبدعون.'
أسس ستانيسيفسكي ، الذي عمل سابقًا في Palantir ، وصديق طفولته بيوتر دابكوفسكي ، وهو موظف سابق في غوغل ، ElevenLabs قبض عناوين الأخبار خلال الأشهر القليلة الماضية لأسباب جيدة ومخزية. في استلهام من الدبلجة المتوسطة للأفلام الأمريكية التي شاهدها ستانيسيفسكي ودابكوفسكي أثناء نشأتهما في بولندا ، قرر الزوجان تصميم منصة يمكن أن تقوم بعمل أفضل - باستخدام الذكاء الاصطناعي بالطبع.
تم إطلاق ElevenLabs في مرحلة التجربة البيتا في نهاية يناير ، وحظي بشعبية سريعة نوعًا ما - نظرًا لجودة أصواته الناتجة والإصدار المجاني السخي. ولكن كما تم الإشارة إليه سابقًا ، لم تكن الدعاية دائمًا إيجابية - لا سيما عندما استغلت الأطراف السيئة المنصة لأغراضها الخاصة.
استخدمت لوحة الرسائل الشهيرة 4chan ، المعروفة بمحتواها المؤامراتي ، أدوات ElevenLabs لمشاركة رسائل كراهية تقليدًا للمشاهير مثل الممثلة إيما واتسون. في مكان آخر ، كان بإمكان جيمس فينسنت من The Verge أن يستخدم ElevenLabs لاستنساخ أصوات الأهداف في غضون ثوانٍ ، مما أدى إلى إنتاج عينات صوتية تحتوي على كل شيء بداية من التهديدات بالعنف إلى التعبيرات العنصرية والترانسفوبية.
ردًا على ذلك ، قالت ElevenLabs إنها ستقدم مجموعة من الضوابط الجديدة ، مثل تقييد تكرار الأصوات للحسابات المدفوعة وتوفير أداة كشف AI جديدة.
حتى الآن ، لم تواجه ElevenLabs الجدل الآخر الذي يغلي حول منصتها ومنصات أخرى مماثلة ، وهو التهديد لصناعة التمثيل الصوتي.
يكتب Motherboard عن كيف يُطلب من ممثلي الأصوات على نحو متزايد التنازل عن حقوق أصواتهم بحيث يمكن للعملاء استخدام AI لتوليد نسخ اصطناعية يمكن أن تحل محلهم في نهاية المطاف. في هذه الاثناء ، تشير رسائل البريد الإلكتروني الداخلية التي شوهدت من قبل The New York Times إلى أن Activision Blizzard ، واحدة من أكبر دور النشر للألعاب في العالم ، تعمل على أدوات للاستنساخ الصوتي المعاون AI.
يبدو أن ElevenLabs يرى هذا كتطور طبيعي للأمور ، إذ يروج لعمله مع الناشرين مثل Storytel ؛ منصات الوسائط مثل TheSoul Publishing و MNTN للكتب الصوتية ومحتوى الراديو ؛ والناشرين مثل Embark Studios و Paradox Interactive لألعاب الفيديو (تعتبر Storytel و TheSoul Publishing مستثمرين استراتيجيين). تزعم الشركة أن لديها أكثر من مليون مستخدم مسجل عبر الصناعات الإبداعية والترفيهية والنشر الذين قاموا بإنشاء محتوى صوتي يعادل 10 سنوات.
ElevenLabs ، التي جمعت مؤخرًا 19 مليون دولار من المستثمرين ، بما في ذلك أندريسن هورويتز والمؤسس المشارك في ديب مايند مصطفى سليمان بتقييم قدره 99 دولارًا ، تخطط في نهاية المطاف لتوسيع نماذجها الذكاء الاصطناعي إلى الدبلجة الصوتية - بناءً على خطى الشركات الناشئة مثل Papercup و Deepdub وبناء ما يسمى بـ 'أساس لنتمكن من نقل المشاعر والتنغيم من لغة إلى أخرى.'
بالإضافة إلى ذلك ، تقول ElevenLabs إنها تخطط لإدخال آلية تسمح للمستخدمين بمشاركة الأصوات على المنصة ، على الرغم من أن التفاصيل تظل غامضة.