تقول Google إن Gemini AI يجعل الروبوتات الخاصة بها أكثر ذكاءً

تقوم Google بتدريب الروبوتات الخاصة بها باستخدام Gemini AI حتى تصبح أفضل في التنقل وإكمال المهام. وأوضح فريق DeepMind Robotics ورقة بحثية جديدة يتيح استخدام Gemini 1.5 Pro لنافذة سياق أطول – والتي تحدد مقدار المعلومات التي يمكن لنموذج الذكاء الاصطناعي معالجتها – للمستخدمين التفاعل بسهولة مع روبوتات RT-2 باستخدام تعليمات اللغة الطبيعية.

وهو يعمل عن طريق التقاط جولة بالفيديو لمنطقة معينة، مثل المنزل أو المكتب، حيث يستخدم الباحثون Gemini 1.5 Pro لجعل الروبوت “يشاهد” الفيديو للتعرف على البيئة. يمكن للروبوت استخدام المخرجات اللفظية و/أو الصورية لتنفيذ الأوامر بناءً على ما يلاحظه، مثل الإشارة إلى الهاتف والسؤال: “أين يمكنني شحن هذا؟” مثل توجيه المستخدمين إلى منفذ طاقة بعد السؤال. تدعي شركة DeepMind أن الروبوت الذي يعمل بالطاقة Gemini حقق معدل نجاح بنسبة 90 بالمائة في أكثر من 50 تعليمات مستخدم مقدمة في منطقة تشغيل تزيد مساحتها عن 9000 قدم مربع.

ووجد الباحثون “أدلة أولية” على أن Gemini 1.5 Pro يمكنه التخطيط لكيفية إنجاز المهام بما يتجاوز التنقل في أجهزة الروبوت الخاصة به. على سبيل المثال، عندما يسأل مستخدم لديه الكثير من علب الكولا على الطاولة الروبوت إذا كان بإمكانه الحصول على مشروبه المفضل، يعرف جيميني أن الروبوت يجب أن يذهب إلى الثلاجة، ويتحقق من وجود كوكا كولا، ثم يعود. يجب على المستخدم الإبلاغ عن النتيجة.” وتقول DeepMind إنها تخطط لمزيد من التحقيق في هذه النتائج.

إن لقطات الفيديو التي قدمتها جوجل مثيرة للإعجاب، على الرغم من أن الورقة البحثية تقول إنها تخفي أن الروبوت يستغرق ما بين 10 إلى 30 ثانية لتنفيذ هذه التعليمات بعد قبول كل طلب. قد يستغرق الأمر بعض الوقت قبل أن نتشارك منازلنا مع روبوتات متقدمة لرسم خرائط البيئة، ولكن على الأقل يمكنهم العثور على مفاتيحنا أو محافظنا المفقودة.

READ  بعض التقنيات المثيرة للاهتمام من معرض CES 2024

LEAVE A REPLY

Please enter your comment!
Please enter your name here