أحدث مولد فيديو يعمل بالذكاء الاصطناعي من Runway يعيد الحياة إلى وحوش حلوى القطن العملاقة
تكبير / تقول لقطة شاشة من فيديو Runway Gen-3 alpha، “شخصية بشرية عملاقة، مصنوعة من حلوى القطن الزرقاء الرقيقة، تدوس على الأرض وتزأر نحو السماء، والسماء الزرقاء الصافية خلفها.”

أعلنت شركة Runway يوم الأحد عن نموذج جديد لجمع مقاطع الفيديو بتقنية الذكاء الاصطناعي الجنرال 3 ألفا إنه لا يزال قيد التطوير، ولكن يبدو أنه ينتج فيديو بنفس جودة Sora من OpenAI، والذي ظهر لأول مرة في وقت سابق من هذا العام (ولم يتم إصداره بعد). يمكنه إنشاء فيديو مبتكر عالي الوضوح من المحفزات النصية التي تتراوح من البشر الواقعيين إلى الوحوش السريالية التي تهاجم الريف.

على عكس المدرج السابق أفضل نموذج اعتبارًا من يونيو 2023، سيكون الجيل الثالث ألفا قادرًا على إنتاج مقاطع فيديو مدتها ثانيتان فقط، ويقال إنه قادر على إنتاج مقاطع فيديو مدتها 10 ثوانٍ للأشخاص والأماكن والأشياء مع الاتساق والتماسك الذي يتفوق بسهولة على الجيل الثالث. 2. على الرغم من أن 10 ثوانٍ تعتبر قصيرة مقارنة بدقيقة الفيديو الكاملة لـ Sora، ضع في اعتبارك أن الشركة تعمل بميزانية حوسبة أصغر بكثير مقارنةً بـ OpenAI الممولة بسخاء – ولديها في الواقع تاريخ في توفير إمكانات إنشاء الفيديو لمستخدمي الأعمال.

لا يقوم Gen-3 Alpha بإنشاء صوت باستخدام مقاطع الفيديو، ومن المرجح أن يعتمد على أجيال متماسكة مؤقتًا (أولئك الذين يشغلون دورًا ثابتًا بمرور الوقت). مواد تدريبية مماثلة عالية الجودة. لكن كان من الصعب تجاهل تطور المصداقية البصرية للمدرج خلال العام الماضي.

فيديو الذكاء الاصطناعي قيد الإحماء

لقد كان أسبوعان مزدحمين بمجموعة فيديو الذكاء الاصطناعي في مجتمع أبحاث الذكاء الاصطناعي، بما في ذلك تقديم النموذج الصيني. تشبث، تم تطويره بواسطة شركة Guisho Technology ومقرها بكين (تسمى أحيانًا “Gwaii”). يمكن لـ Cling إنتاج دقيقتين من الفيديو عالي الدقة 1080 بكسل بمعدل 30 إطارًا في الثانية التفاصيل والتماسك إنه يطابق سورا.

READ  ترسل نينتندو مخالفات حقوق الطبع والنشر إلى قناة موسيقى YouTube

موجه Gen-3 Alpha: “انعكاس دقيق لامرأة في نافذة قطار فائق السرعة في مدينة يابانية.”

بعد وقت قصير من ظهور Cling لأول مرة، بدأ الناس في الإبداع على وسائل التواصل الاجتماعي فيديوهات سريالية للذكاء الاصطناعي يستخدم لوما الذكاء الاصطناعي آلة لوما دريم. كانت مقاطع الفيديو هذه مبتكرة ومختلفة ولكنها شائعة عدم الوحدة; لقد اختبرنا جهاز Dream Machine ولم نكن معجبين بأي شيء رأيناه.

وفي الوقت نفسه، وجدت شركة Runway التي يقع مقرها في مدينة نيويورك، والتي تأسست عام 2018، وهي إحدى الشركات الرائدة في تحويل النص إلى فيديو، نفسها مؤخرًا في الميمات، حيث وجدت أن تقنية Gen-2 الخاصة بها ضعيفة القوة مقارنة بنماذج تجميع الفيديو الأحدث. ربما يكون هذا هو الدافع وراء الإعلان عن Gen-3 Alpha.

موجه ألفا من الجيل الثالث: “رائد فضاء يركض في زقاق في ريو دي جانيرو.”

لقد كان إنشاء بشر واقعيين دائمًا أمرًا صعبًا بالنسبة لنماذج مجموعات الفيديو، لذا يُظهر برنامج Runway على وجه الخصوص قدرة مطوري Gen-3 Alpha على إنشاء شخصيات بشرية “شفافة” مع مجموعة واسعة من الإجراءات والإيماءات والعواطف. ومع ذلك، من الشركة تم إعطاء أمثلة ليست معبرة بشكل خاص – فمعظم الناس ينظرون ببطء ويغمزون – لكنهم يبدون واقعيين.

تشمل الأمثلة البشرية امرأة في قطار، ورائد فضاء وهو يركض في الشارع، ورجل يضيء وجهه بوهج جهاز تلفزيون، وامرأة تقود سيارة، وامرأة تجري.

موجه Gen-3 Alpha: “لقطة مقربة لامرأة شابة متأملة تقود السيارة، وغابة خضراء غير واضحة يمكن رؤيتها من خلال نافذة السيارة الممطرة.”

تشتمل مقاطع الفيديو التوضيحية التي تم إنشاؤها على المزيد من أمثلة مجموعات الفيديو السريالية، بما في ذلك مخلوق عملاق يمشي في مدينة متهدمة، ورجل مصنوع من الصخور يمشي عبر غابة، ووحش حلوى القطن العملاق الذي يظهر أدناه. صفحة.

READ  يصف WhatsApp ميزة المجتمعات القادمة والتحديثات الرئيسية الأخرى

موجه Gen-3 Alpha: “شخصية بشرية عملاقة، مصنوعة من حلوى القطن الزرقاء الرقيقة، تدوس على الأرض وتزأر نحو السماء، والسماء الزرقاء الصافية خلفها.”

سيعمل Gen-3 على تشغيل مجموعة متنوعة من أدوات تحرير Runway AI (واحدة من أبرز ادعاءات الشركة بالشهرة). فرشاة متعددة الحركة, ضوابط الكاميرا المتقدمةو وضع المدير. يمكنه إنشاء مقاطع فيديو من محفزات نصية أو صورية.

يقول Runway إن Gen-3 Alpha هو أول النماذج التي يتم تدريبها على البنية التحتية الجديدة المصممة للتدريب على نماذج متعددة واسعة النطاق، مما يتخذ خطوة نحو تطوير ما تسميه “نماذج عالمية عامة“، هي أنظمة ذكاء اصطناعي افتراضية تقوم بإنشاء تمثيلات داخلية للبيئات واستخدامها لمحاكاة الأحداث المستقبلية داخل تلك البيئات.

LEAVE A REPLY

Please enter your comment!
Please enter your name here