تمكنت شركة OpenAI من السيطرة على عالم التكنولوجيا في الآونة الأخيرة من خلال نموذج الذكاء الاصطناعي التوليدي "سورا"، الذي يحول وصف المشاهد إلى مقاطع فيديو أصلية دون الحاجة إلى كاميرات أو فرق تصوير. ومع ذلك، كان "سورا" محدودًا حتى الآن، ويبدو أن الشركة تستهدف المبدعين الممولين بشكل جيد مثل مخرجي هوليوود، وليس بالضرورة الهواة أو المسوقين الصغار.
هيغسفيلد إيه آي: منصة جديدة لإنشاء الفيديوهات مدعومة بالذكاء الاصطناعي
شعر أليكس ماشربوف، الرئيس السابق للذكاء الاصطناعي التوليدي في شركة سناب، بوجود فرصة. ولذلك قام بإطلاق "هيغسفيلد إيه آي"، وهي منصة لإنشاء وتحرير الفيديو مدعومة بالذكاء الاصطناعي ومصممة لتطبيقات أكثر تخصيصًا وتخصيصًا.
بفضل نموذج مخصص لتحويل النص إلى فيديو، يستطيع تطبيق Higgsfield الأول، Diffuse، إنشاء مقاطع فيديو من البداية أو التقاط صورة شخصية وإنشاء فيديو يتم بطولته بواسطة هذا الشخص.
صرح مشرابوف لـ TechCrunch في مقابلة قائلاً: "جمهورنا المستهدف هم المبدعون من جميع الأنواع، بدءًا من المستخدمين العاديين الذين يرغبون في إنشاء محتوى ممتع مع أصدقائهم، إلى منشئي المحتوى الاجتماعيين الذين يتطلعون إلى تجربة تنسيق محتوى جديد، وحتى المسوقين في وسائل التواصل الاجتماعي الذين يرغبون في تعزيز علامتهم التجارية".
رحلة أليكس ماشربوف من AI Factory إلى "هيغسفيلد إيه آي"
وصل مشرابوف إلى شركة سناب عن طريق شركته الناشئة AI Factory، التي اشترتها سناب في عام 2020 مقابل 166 مليون دولار. خلال وجوده في سناب، ساعد مشرابوف في تطوير منتجات مثل تأثيرات الواقع المعزز ومرشحات سنابشات، بما في ذلك Cameos، بالإضافة إلى برنامج MyAI المثير للجدل من سناب شات.
يقدم Higgsfield، الذي شارك في إطلاقه مع يرزات دولات، وهو باحث في الذكاء الاصطناعي متخصص في إنتاج الفيديو، مجموعة منسقة من المقاطع التي تم إنشاؤها مسبقًا، وأداة لتحميل الوسائط المرجعية مثل الصور ومقاطع الفيديو، ومحرر سريع يتيح للمستخدمين وصف الشخصيات والأفعال والمشاهد التي يرغبون في تصويرها. باستخدام Diffuse، يمكن للمستخدمين أن يدخلوا أنفسهم مباشرة في مشهد تم إنشاؤه بواسطة الذكاء الاصطناعي، أو أن يجعلوا صورهم الرقمية تحاكي الأشياء مثل حركات الرقص التي تم التقاطها في مقاطع فيديو أخرى.
وقال مشرابوف بثقة: "نموذجنا الفريد يدعم بشكل كبير الحركات والتعبيرات الواقعية، مما يجعلنا روادًا في مجال "النماذج العالمية" للمستهلكين. سيتيح لنا هذا النموذج إنشاء مقاطع فيديو أفضل وتحريرها بمستوى رائع من التحكم".
ليست Higgsfield الشركة الوحيدة التي تتنافس مع OpenAI في مجال إنتاج الفيديوهات. فقد كانت Runway من بين أوائل البرامج التي ظهرت في هذا المجال، وما زالت أدواتها تتحسن باستمرار. هناك أيضًا شركة Haiper التي تحظى بدعم اثنين من خريجي DeepMind وتمكنت من جمع أكثر من 13 مليون دولار من الاستثمارات.
يقول مشرابوف إن شركة Diffuse ستتميز بفضل استراتيجيتها الفريدة التي تركز أولاً على الهواتف المحمولة عند الدخول إلى السوق.
وقال مشرابوف: "بتفضيل تطبيقات iOS وAndroid على سير عمل سطح المكتب، نمكّن المبدعين من إنشاء محتوى مقنع لوسائل التواصل الاجتماعي في أي وقت وأي مكان". "فعلاً، بالاعتماد على الهاتف المحمول، أصبحنا قادرين على تحقيق سهولة الاستخدام وتوفير الميزات الملائمة للمستهلك منذ اليوم الأول".
"هيغزفيلد": تحديات تقنية ومالية في طريق النجاح
هيغزفيلد يسير أيضًا بشكل هزيل. يقول مشرابوف إن النماذج التوليدية التي تقوم عليها المنصة تم تطويرها من قبل فريق مكون من 16 شخصًا في أقل من تسعة أشهر وتم تدريبهم على مجموعة مكونة من 32 وحدة معالجة رسوميات. (قد يبدو عدد 32 وحدة معالجة رسوميات كثيرًا، ولكن بالنظر إلى أن OpenAI تستخدم عشرات الآلاف، فهذا ليس صحيحًا حقًا. ) ولم تجمع Higgsfield سوى 8 ملايين دولار حتى الآن، جاء الجزء الأكبر منها من شريحة تمويل أولية حديثة بقيادة Menlo Ventures.
من أجل البقاء في الصدارة عن منافسيها، تخطط شركة Higgsfield لتخصيص الأموال الأولية لبناء محرر فيديو محسّن يتيح للمستخدمين تعديل الشخصيات والكائنات في مقاطع الفيديو، بالإضافة إلى تدريب نماذج أكثر قوة لإنتاج محتوى فيديو مخصص لحالات استخدام وسائل التواصل الاجتماعي. في الواقع، يعتبر ماشرابوف أن وسائل التواصل الاجتماعي - والتسويق عبرها - هي المجال الرئيسي لشركة Higgsfield لتحقيق الربح.
على الرغم من أن Diffuse مجاني حاليًا للاستخدام، إلا أن مشرابوف يتصور مستقبلًا حيث يتوقع أن يتم دفع المسوقين رسومًا أو اشتراكًا للاستفادة من مزايا فريدة، أو لتنفيذ حملات كبيرة الحجم أو واسعة النطاق.والتسويق عبر وسائل التواصل الاجتماعي. ومع ذلك، فإننا نعتقد أن استخدام حقول هيغز لإنتاج المحتوى سيوفر فرصًا هائلة للشركات في هذا المجال.
نحن نسمع بشكل مستمر من مديري التسويق والمديرين الإبداعيين بأنهم يحتاجون إلى تحسين ميزانيات إنتاج المحتوى وتقليل الجداول الزمنية، في حين يسعون لتقديم محتوى مؤثر. لذلك، نحن نعتقد أن حلول الذكاء الاصطناعي المولدة للفيديو ستكون الحلا الأساسي لمساعدتهم في تحقيق هذا الهدف.
بالطبع، لا يمكن اعتبار حقول هيغز محصنة تمامًا ضد التحديات الأوسع التي تواجهها الشركات الناشئة في مجال الذكاء الاصطناعي والتسويق عبر وسائل التواصل الاجتماعي.
من الواضح أن النماذج الذكية القادرة على إنتاج المحتوى، مثل نموذج Diffuse، قادرة على "تجديد" بيانات التدريب. لكن لماذا يعتبر ذلك مشكلة؟ حسنًا، إذا تم تدريب هذه النماذج على محتوى محمي بحقوق الطبع والنشر دون الحصول على إذن أو ترخيص صحيح، فإن مستخدمي هذه النماذج قد ينشئون عن غير قصد أعمالًا تنتهك حقوق الطبع والنشر - مما يعرضهم للمسائل القانونية.
"هيغزفيلد إيه آي": مخاوف حول الخصوصية وإساءة الاستخدام
لم يكشف ماشربوف عن مصدر بيانات تدريب هيغزفيلد، ولكنه أشار إلى أنها تأتي من أماكن "متعددة متاحة للجمهور". كما لم يذكر ما إذا كانت هيغزفيلد ستحتفظ ببيانات المستخدم لتدريب النماذج المستقبلية، وهذا الأمر قد لا يناسب البعض من زبائن القطاع التجاري. لقد لاحظ العملاء أنه يمكن لمستخدمي Diffuse طلب حذف بياناتهم في أي وقت من خلال التطبيق.
وكما أصبحت منصات "الاستنساخ" الرقمية مثل هيجزفيلد جاهزة للاستخدام السيئ، فإن انتشار التزييف العميق على وسائل التواصل الاجتماعي في الأشهر الأخيرة أصبح واضحًا.
وبنفس الطريقة، يمكن لـ Higgsfield أن يسهل سرقة محتوى المبدعين. على سبيل المثال، يكفي للشخص تحميل مقطع فيديو لتصميم رقصة معينة لشخص آخر ليقوم بإنشاء مقطع فيديو لنفسه وهو يؤدي نفس التصميم.
سألت مشرابوف عن الضمانات أو وسائل الحماية التي قد يستخدمها هيغزفيلد لمحاولة منع إساءة الاستخدام، وعلى الرغم من أنه لم يدخل في التفاصيل، أدعى أن المنصة تستخدم مزيجًا من الإشراف الآلي واليدوي.
وأضاف مشرابوف: "قررنا أن نطرح المنتج تدريجيًا ونختبره في أسواق محددة أولاً، حتى نتمكن من مراقبة الأماكن التي يحتمل فيها حدوث إساءة استخدام وتطوير المنتج حسب الحاجة".
سيتعين علينا الانتظار ورؤية مدى نجاح ذلك في التطبيق العملي.