أصدرت شركة Google Veo، وهو مولد فيديو عالي الدقة يعمل بالذكاء الاصطناعي وينافس Sora.
الصور الثابتة مأخوذة من مقاطع الفيديو التي أنشأها Google Veo.
تكبير / الصور الثابتة مأخوذة من مقاطع الفيديو التي أنشأها Google Veo.

جوجل / بنش إدواردز

أعلنت Google في Google I / O 2024 يوم الثلاثاء فيو، وهو نموذج جديد لتركيب الفيديو بتقنية الذكاء الاصطناعي يمكنه إنشاء مقاطع فيديو عالية الدقة من تعليمات نصية أو صورة أو فيديو، على غرار Sora الخاص بـ OpenAI. يمكنه إنشاء مقاطع فيديو بدقة 1080 بكسل تدوم أكثر من دقيقة وتحرير مقاطع فيديو من التعليمات المكتوبة، ولكن لم يتم إصدارها للاستخدام على نطاق أوسع بعد.

يتمتع Veo بالقدرة على تحرير مقاطع الفيديو الموجودة باستخدام أوامر نصية، والحفاظ على الاتساق المرئي عبر الإطارات، وإنشاء تسلسلات فيديو تدوم حتى 60 ثانية من مطالبة واحدة أو سلسلة من المطالبات. وتقول الشركة إنها تستطيع إنشاء مشاهد متقنة واستخدام التأثيرات السينمائية مثل اللقطات المتتابعة واللقطات الجوية وأنماط المشاهد المختلفة.

منذ تقديم DALL-E 2 في أبريل 2022، شهدنا عرضًا جديدًا لنماذج تجميع الصور والفيديو التي تهدف إلى السماح لأي شخص يمكنه كتابة وصف مكتوب بإنشاء صورة أو مقطع فيديو مفصل. على الرغم من أن أيًا من التقنيتين لم تكتمل بشكل كامل، إلا أن مولدات الصور والفيديو المدعومة بالذكاء الاصطناعي أصبحت أكثر قدرة تدريجيًا.

في شهر فبراير الماضي، قمنا بتغطية معاينة لمولد الفيديو Sora من OpenAI، والذي اعتقد الكثيرون في ذلك الوقت أنه يمثل أفضل حزمة فيديو تعمل بالذكاء الاصطناعي يمكن أن تقدمها الصناعة. لقد أثار إعجاب تايلر بيري كثيرًا لدرجة أنه أوقف توسعات استوديو الأفلام الخاص به. ومع ذلك، حتى الآن، لم توفر OpenAI وصولاً عامًا إلى الأداة – وبدلاً من ذلك، قصرت استخدامها على مجموعة مختارة من المختبرين.

READ  أعلنت شركة سوني عن ارتفاع سعر التجزئة لبلاي ستيشن 5

الآن، يبدو للوهلة الأولى أن Vio من Google يتمتع بقدرات إنشاء فيديو مماثلة لسورا. لم نقم بتجربته بأنفسنا، لذلك يمكننا فقط مشاهدة مقاطع الفيديو التوضيحية المنتقاة التي تقدمها الشركة على موقعها على الانترنت. ومع ذلك، ينبغي لأي شخص ينظر إليها أن يأخذ ادعاءات جوجل بقدر كبير من الشك، لأن نتائج الأجيال قد لا تكون نموذجية.

تتضمن مقاطع الفيديو النموذجية من Vio راعي بقر يمتطي حصانًا، وتتبع السرعة في أحد شوارع الضواحي، وشوي الكباب، ولقطة متتابعة لفتحة عباد الشمس، والمزيد. من الواضح أنه لا توجد صور تفصيلية للبشر الذين واجهوا صعوبة تاريخية في إنشاء نماذج صور وفيديو تعمل بالذكاء الاصطناعي دون تشويهات واضحة.

تقول جوجل إن Veo يعتمد على نماذج إنتاج الفيديو السابقة للشركة، بما في ذلك شبكة الاستعلامات التوليدية (GQN)، وDVD-GAN، وImagen-Video. بيناكيووالت وVideoPoet وLumiere. لتحسين الجودة والأداء، تغطي بيانات التدريب الخاصة بـ Veo موضوعات فيديو أكثر تفصيلاً، وتستخدم تمثيلات فيديو “مخفية” مضغوطة. ولتحسين جودة إنشاء فيديو Veo، أضافت Google تسميات توضيحية أكثر تفصيلاً إلى مقاطع الفيديو المستخدمة لتدريب Veo، مما يسمح للذكاء الاصطناعي بفهم المحفزات بشكل أكثر دقة.

يبدو أن Veo متميز في دعم أوامر صناعة الأفلام: “بالنظر إلى كل من إدخال الفيديو وأمر التحرير، مثل إضافة قوارب الكاياك إلى منظر جوي للشاطئ، يمكن لـ Veo تطبيق هذا الأمر على الفيديو الأصلي وإنشاء فيديو جديد محرر، “تقول الشركة.

في حين أن العروض التوضيحية تبدو مثيرة للاهتمام للوهلة الأولى (خاصة بالمقارنة مع طعام ويل سميث النهم)، إلا أن جوجل تعترف بأن إنشاء فيديو بتقنية الذكاء الاصطناعي أمر صعب. وكتبت الشركة: “إن الحفاظ على الاتساق البصري يمكن أن يشكل تحديًا لنماذج إنشاء الفيديو”. “يمكن أن تومض الشخصيات أو الكائنات أو حتى المشاهد بأكملها، أو تقفز، أو تتحول بشكل غير متوقع بين الإطارات، مما يعطل تجربة المشاهدة.”

READ  جماليات "NASA-Punk" في Starfield ستكون • Eurogamer.net

لقد حاولت Google التخفيف من أوجه القصور هذه باستخدام “محولات الانتشار المخفية المتطورة”، والتي تعتبر في الأساس كلامًا تسويقيًا لا معنى له بدون تفاصيل. لكن الشركة واثقة بما فيه الكفاية في هذا النموذج العمل مع الممثل دونالد جلوفر والاستوديو الخاص به، Gilka، لإنشاء رسم توضيحي تم إنشاؤه بواسطة الذكاء الاصطناعي والذي سيظهر لأول مرة قريبًا.

في البداية، سيكون Veo متاحًا لمبدعين محددين فيديو اف اكس، أداة اختبار جديدة متاحة على labs.google، موقع مطبخ اختبار الذكاء الاصطناعي من Google. يمكن لمنشئي المحتوى الانضمام إلى قائمة انتظار VideoFX للوصول إلى ميزات Veo في الأسابيع المقبلة. تخطط Google لدمج بعض إمكانيات Vio في YouTube Shorts والمنتجات الأخرى في المستقبل.

لا توجد معلومات حتى الآن عن المكان الذي حصلت فيه Google على بيانات التدريب الخاصة بـ Veo (إذا كان علينا أن نخمن، فقد يكون YouTube متورطًا). لكن جوجل تقول إنها تتبع نهجًا “مسؤولًا” مع Veo. وقالت الشركة: “مقاطع الفيديو التي أنشأتها شركة Veo تحمل علامة مائية”. معرف السنديتم أيضًا تمرير أداتنا الحديثة لوضع العلامات المائية وتحديد المحتوى الناتج عن الذكاء الاصطناعي من خلال مرشحات الأمان وعمليات التحقق من الحفظ للمساعدة في تقليل مخاطر الخصوصية وحقوق الطبع والنشر والتحيز.

LEAVE A REPLY

Please enter your comment!
Please enter your name here