يتحدث زوكربيرج عن أحدث رؤية فيديو لـ Meta مع الذكاء الاصطناعي مع الرئيس التنفيذي لشركة Nvidia Jensen Huang

حققت Meta نجاحًا واضحًا في العام الماضي مع Segment Anything، وهو نموذج للتعلم الآلي يمكنه تحديد وتحديد أي شيء في الصورة بسرعة وموثوقية. الجزء الثاني، الذي قدمه الرئيس التنفيذي مارك زوكربيرج على خشبة المسرح يوم الاثنين في SIGGRAPH، يأخذ هذا النموذج إلى مجال الفيديو، موضحًا مدى سرعة تحرك هذا المجال.

التجزئة هو المصطلح الفني عندما ينظر النموذج المرئي إلى صورة ما ويختار الأجزاء: “هذا كلب، هذه شجرة خلف الكلب” على أمل، وليس “هذه شجرة تنمو من كلب”. لقد كان الأمر مستمرًا منذ عقود، لكنه أصبح مؤخرًا أفضل وأسرع، مما يجعل القسم خطوة كبيرة للأمام في أي شيء.

القسم أي شيء 2 (SA2) إنها متابعة طبيعية تنطبق على كل من الفيديو والصور الثابتة؛ على الرغم من أنه يمكنك تشغيل العينة الأولى بشكل منفصل على كل إطار من الفيديو، إلا أن سير العمل ليس فعالاً للغاية.

وقال زوكربيرج في محادثة مع الرئيس التنفيذي لشركة Nvidia Jensen Huang: “يستخدم العلماء هذه الأشياء لدراسة أشياء مثل الشعاب المرجانية والموائل الطبيعية. لكن القيام بذلك عبر الفيديو وتحديد ما تريده، هو أمر رائع حقًا”.

تعد معالجة الفيديو، بالطبع، أكثر تطلبًا من الناحية الحسابية، وهي شهادة على التقدم الذي حققته الصناعة في الأداء حيث يمكن تشغيل SA2 دون ذوبان مركز البيانات. بالطبع، لا يزال هذا نموذجًا كبيرًا يتطلب أجهزة جادة للعمل، ولكن الجزء السريع والمرن كان مستحيلًا عمليًا حتى قبل عام.

حقوق الصورة: ميتا

هذا النموذج، النموذج الأول، مفتوح ومجاني الاستخدام، والنسخة المستضافة لا تحتوي على كلمة، وهو ما تقدمه أحيانًا شركات الذكاء الاصطناعي هذه. ولكن هناك عرض تجريبي مجاني.

وبطبيعة الحال، يحتاج مثل هذا النموذج إلى قدر كبير من البيانات للتدريب عليه، وتنشر Meta أيضًا قاعدة بيانات كبيرة مشروحة تضم 50000 مقطع فيديو أنشأتها لهذا الغرض. في الورقة التي تصف SA2، تم أيضًا استخدام قاعدة بيانات أخرى تضم أكثر من 100.000 مقطع فيديو “متاح محليًا” للتدريب ولم يتم نشرها للعامة – لقد طلبت من Meta المزيد من المعلومات حول ماهيتها ولماذا لم يتم نشرها للعامة. . (تخميننا هو أنه مشتق من الملفات الشخصية العامة على Instagram وFacebook.)

READ  يقدم Dbrand بعض الأسطح لجعل هاتفك يبدو وكأنه لا شيء
أمثلة على بيانات التدريب المسمى.
حقوق الصورة: ميتا

لقد كانت Meta رائدة في مجال الذكاء الاصطناعي “المفتوح” لبضع سنوات، على الرغم من أنها في الواقع (كما قال زوكربيرج في المقابلة) كانت تفعل ذلك لفترة طويلة باستخدام أدوات مثل PyTorch. ولكن في الآونة الأخيرة، أصبحت LLaMa، وSegment Anything، وبعض النماذج التي تم إصدارها مجانًا بمثابة حاجز يمكن الوصول إليه نسبيًا لأداء الذكاء الاصطناعي في تلك المجالات، على الرغم من أن “انفتاحها” مثير للنقاش.

يقول زوكربيرج إن كونهم منفتحين لا ينبع تمامًا من طيبة قلوبهم في ميتا، لكن هذا لا يعني أن نواياهم غير نقية:

“إنه ليس مثل برنامج يمكنك إنشاؤه، فأنت بحاجة إلى نظام بيئي حوله. ولن يعمل بشكل جيد تقريبًا إذا لم نفتح مصدره، أليس كذلك؟ نحن لا نفعل ذلك لأننا أشخاص محبون للغير، على الرغم من أنني أعتقد أنه مفيد للنظام البيئي – إنه الشيء الذي نبنيه لأننا نعتقد أنه سيكون رائعًا.

وفي كلتا الحالتين، سيتم بالتأكيد استخدامه بشكل جيد. تحقق من جيثب هنا.

LEAVE A REPLY

Please enter your comment!
Please enter your name here