ألهبت شركة OpenAI العالم التقني قبل بضعة أشهر بنموذج AI المولد ، Sora ، الذي يحول وصف المشهد إلى مقاطع فيديو أصلية - بدون كاميرات أو طواقم تصوير. ولكن حتى الآن ، كان Sora محصورًا بشكل صارم ، ويبدو أن الشركة تستهدفه نحو الإبداعيين ذوي التمويل الجيد مثل مخرجي هوليوود - وليس بالضرورة الهواة أو المسوقين ذوي الحجم الصغير.
أحس ألكس ماشرابوف ، الرئيس السابق لـ AI الكيانية في Snap ، بوجود فرصة. لذا أطلق Higgsfield AI ، وهو منصة إنشاء وتحرير الفيديو المدعومة بالذكاء الاصطناعي والمصممة للتطبيقات التي تصبح أكثر تخصيصًا وشخصية.
يعمل Diffuse ، أول تطبيق لـ Higgsfield ، باستخدام نموذج نص إلى فيديو مخصص ، ويمكنه توليد فيديوهات من الصفر أو أخذ صورة شخصية وتوليد مقطع فيديو يبرز تلك الشخصية.
حيث قال ماشرابوف لتيك كرانش في مقابلة: "جمهورنا المستهدف هو المبدعون من جميع الأنواع ، من المستخدمين العاديين الذين يرغبون في إنشاء محتوى ممتع مع أصدقائهم إلى مبدعي المحتوى الاجتماعي الذين يرغبون في تجربة شكل محتوى جديد إلى المسوقين في وسائل الإعلام الاجتماعية الذين يرغبون في أن تبرز علامتهم."
جاء ماشرابوف إلى Snap من خلال AI Factory ، شركته الناشئة السابقة ، التي اشترتها Snap في عام 2020 مقابل 166 مليون دولار. خلال فترة عمله في Snap ، ساعد ماشرابوف في بناء منتجات مثل تأثيرات الواقع المعزز ومرشحات Snapchat ، بما في ذلك Cameos ، بالإضافة إلى الشاتبوت MyAI الخاص بـ Snapchat الذي أثار الجدل.
تقدم Higgsfield - الذي شارك في إطلاقه مع يرزات دولات ، باحث AI متخصص في الفيديو التوليدي - مجموعة من الآهداف المولدة مسبقًا ، وأداة لتحميل الوسائط المرجعية (مثل الصور ومقاطع الفيديو) ومحرر لمساعدة المستخدمين على وصف الشخصيات والأفعال والمشاهد التي يرغبون في تصويرها. باستخدام Diffuse ، يمكن للمستخدمين إدخال أنفسهم مباشرة في مشهد مولد بواسطة الذكاء الاصطناعي ، أو أن يجعلوا شبههم الرقمي يقلد أشياء - مثل حركات الرقص - التي تم التقاطها في مقاطع الفيديو الأخرى.
قال ماشرابوف: "يدعم نموذجنا حركات وتعابير واقعية للغاية. نحن رائدون في "النماذج العالمية" للمستهلكين ، مما سيتيح لنا بناء محرر فيديو وإنتاج يعتمد على الفيديو بدرجة كبيرة من السيطرة والتحرير العالي."
ليس Higgsfield الشركة الوحيدة لبدء الفيديو التوليدي تصد المنافسة مع OpenAI. كان Runway واحدًا من أولئك الذين وصلوا أولاً ، وتستمر أدواته في التحسين. هناك أيضًا Haiper ، التي تتمتع بدعم من قبل اثنين من خريجي العقل DeepMind وأكثر من 13 مليون دولار في استثمارات راس المال.
ماشرابوف يجادل بأن Diffuse سوف يتميز بفضل استراتيجية تسويق أولية موجهة نحو المحمول ومشتقة اجتماعيًا.
قال ماشرابوف: "من خلال إعطاء الأولوية لتطبيقات iOS و Android بدلاً من سير العمل على سطح المكتب ، نمكن المبدعين من إنشاء محتوى جذاب لوسائل التواصل الاجتماعي في أي وقت وفي أي مكان". وبالفعل ، عن طريق البناء على المحمول ، نستطيع إعطاء الأولوية لسهولة الاستخدام والميزات الودية للمستهلك من اليوم الأول."
هيغسفيلد أيضًا تدير بشكل محكم. يقول ماشرابوف إن النماذج التوليدية التي تدعم منصة العتاد تم تطويرها من قبل فريق يتألف من 16 شخصًا في أقل من تسعة أشهر وتم تدريبها على مجموعة من 32 وحدة معالجة البيانات الرسومية (قد تبدو 32 وحدة معالجة البيانات الرسومية وكأنها كثيرة ، ولكن عندما نأخذ في الاعتبار أن OpenAI يستخدم عشرات الآلاف ، فإنها ليست حقيقية). ولم ترفع Higgsfield سوى 8 ملايين دولار حتى الآن ، وجاءت معظمها من شريحة تمويل بذورية مؤخرًا قادها Menlo Ventures.
للبقاء خطوة واحدة قدمًا أمام المنافسين ، يخطط Higgsfield لاستخدام التمويل البذوري في بناء محرر فيديو محسن سيتيح للمستخدمين تعديل الشخصيات والأشياء في مقاطع الفيديو ، وفي تدريب نماذج توليد فيديو أقوى خصيصًا لحالات استخدام وسائل الإعلام الاجتماعية. في الواقع ، يرى ماشرابوف وسائل التواصل الاجتماعي - والتسويق على وسائل التواصل الاجتماعي - كأحد النيوش الرئيسية لكسب Higgsfield الأموال.
على الرغم من أن Diffuse يتم استخدامه حاليًا مجانًا ، إلا أن ماشرابوف يتصور مستقبلًا حيث يدفع المسوقون رسومًا معينة أو اشتراكًا مقابل الميزات الرئيسية ، أو لتحقيق حجم أو حملات كبيرة المقياس.
قال: "نعتقد أن Higgsfield يفتح مستوى لا يصدق من الواقعية وحالات استخدام انتاج المحتوى لمسوقي وسائل الإعلام الاجتماعية". "نسمع باستمرار من مديري التسويق الرئيسيين ومديري الإبداع أنهم يحتاجون إلى تحسين ميزانيات إنتاج المحتوى وتقصير الجداول الزمنية وفي الوقت نفسه تقديم محتوى قوي. لذلك نعتقد أن حلول الذكاء الاصطناعي لتوليد الفيديو ستكون حلاً رئيسيًا في مساعدتهم على تحقيق ذلك."
بطبيعة الحال ، لا تخلو Higgsfield من التحديات العامة التي تواجه شركات الذكاء الاصطناعي التوليدي.
من المؤكد أن نماذج الذكاء الاصطناعي التوليدي مثل تلك التي تعمل على تشغيل Diffuse يمكن أن تقوم بـ"تقيؤ" البيانات التدريبية. لماذا هذا مشكل؟ حسنًا ، إذا كانت النماذج قد تم تدريبها على محتوى محمي بحقوق التأليف والنشر دون إذن أو بدون اتفاق ترخيص معين ، فقد يمكن لمستخدمي تلك النماذج إنشاء عمل ينتهك حقوق التأليف والنشر - ما يعرضهم للدعاوى القضائية.
لا يكشف ماشرابوف عن مصدر بيانات التدريب الخاصة بـ Higgsfield (بخلاف القول بأنها تأتي من "مواقع عامة متعددة المنشورات") ، وأيضًا لم يكشف ما إذا كان سيحتفظ Higgsfield ببيانات المستخدم لتدريب النماذج المستقبلية ، الأمر الذي قد لا يكون مناسبًا لبعض العملاء التجاريين. لكنه لا يلاحظ أن مستخدمي Diffuse يمكنهم طلب حذف بياناتهم في أي وقت من خلال التطبيق.
منصات "الاستنساخ" الرقمية مثل Higgsfield أيضًا عرضة للاستغلال ، كما أظهرت انتشار الفوري للفيديوهات المفبركة على وسائل التواصل الاجتماعي في الأشهر الأخيرة.
بنفس الطريقة ، يمكن لـ Higgsfield تسهيل سرقة محتوى الخالقين. على سبيل المثال ، يكفي أن يقوم الشخص بتحميل فيديو لرقصة شخص ما لإنشاء فيديو لهم أنفسهم وهم يؤدون نفس الرقصة.
طرحت على ماشرابوف حول الضمانات أو الحمايات التي قد تستخدمها Higgsfield لمحاولة منع الاستغلال ، و - بينما لم يدخل في تفاصيل - أدعى أن المنصة تستخدم مزيجًا من التصفية الآلية واليدوية.
أضاف ماشرابوف: "لقد قررنا تدريجيا إطلاق المنتج واختباره في الأسواق المحددة أولاً ، بحيث يمكننا مراقبة المكان الذي يوجد فيه الاحتمال المحتمل للاستغلال وتطوير المنتج حسب الضرورة."
سنرى كيف يعمل ذلك في الممارسة.