الذكاء الاصطناعي المرئي

نماذج Google Gemini Robotics تُشغّل روبوتات أكثر ذكاءً

استكشف كيف تعمل Google Gemini Robotics على تعزيز الروبوتات المدعومة بالذكاء الاصطناعي بذكاء متعدد الوسائط، مما يعزز القدرة على التكيف، والبراعة، والتفاعل البشري السلس.

أبأبيرامي فينا

4 min readApril 4, 2025

نماذج Google Gemini Robotics تُشغّل روبوتات أكثر ذكاءً

لعقود من الزمن، لطالما كانت الروبوتات رمزاً للمستقبل، حيث تظهر في مختبرات الأبحاث، وأفلام الخيال العلمي، وعروض النماذج الأولية المتطورة في الصناعة. والآن، بفضل التقدم الأخير في الذكاء الاصطناعي (AI)، بدأت هذه النماذج الأولية تتجاوز البيئات الخاضعة للرقابة لتنتقل إلى تطبيقات واقعية.

على وجه التحديد، مع Gemini Robotics، تقترب Google خطوة أخرى من التكنولوجيا اللازمة لبناء روبوتات أكثر ذكاءً. تم إطلاق نموذج Gemini Robotics ونموذجه المصاحب Gemini Robotics-ER (الاستدلال المتجسد) في 12 مارس 2025، وهما أحدث ابتكارات Google DeepMind.

لقد تم بناؤها على Gemini 2.0، وهو نموذج لغوي كبير (LLM) متعدد الوسائط يمكنه معالجة وتوليد أنواع مختلفة من البيانات، بما في ذلك النصوص والصور والصوت والفيديو، مما يسهل تفاعلات أكثر تنوعاً وطبيعية. تجلب هذه النماذج قدرات Gemini 2.0 متعددة الوسائط إلى العالم المادي، مما يتيح بناء روبوتات أكثر براعة وتفاعلية وذكاءً.

على سبيل المثال، وخلافاً للروبوتات التقليدية التي تتبع تعليمات ثابتة، يمكن للروبوتات المدمجة مع نماذج Gemini Robotics معالجة الرؤية واللغة. وهذا يجعل من الممكن لها اتخاذ قرارات في الوقت الفعلي والتكيف مع البيئات المتغيرة.

في هذا المقال، سوف نستكشف Gemini Robotics وGemini Robotics-ER، وكيفية عمل هذه النماذج، وميزاتها الرئيسية وتطبيقاتها. لنبدأ!

Gemini Robotics تساعد الروبوتات على أداء مهام متعددة بكفاءة

الشكل 1. Gemini Robotics تساعد الروبوتات على أداء مهام متعددة بكفاءة.

Link to this sectionنقدم لكم Google Gemini Robotics#

Gemini Robotics من Google هو نموذج ذكاء اصطناعي متقدم مصمم لمنح الروبوتات القدرة على الإدراك والاستدلال والتفاعل في العالم المادي. كنموذج رؤية-لغة-عمل (VLA)، فهو يسمح للروبوتات بمعالجة التعليمات، وتفسير بيئتها، وتنفيذ مهام معقدة بدقة عالية precision.

وفي الوقت نفسه، يعمل نموذج Gemini Robotics-ER على تحسين قدرة الروبوت على فهم العلاقات المكانية لكيفية وضع الأشياء، وكيفية تحركها، وكيفية تفاعلها. وهذا يساعد الروبوتات على توقع الإجراءات وتعديل حركاتها وفقاً لذلك.

على سبيل المثال، فكر في مهمة يحتاج فيها الروبوت إلى لف سلك حول سماعة رأس. يساعده Gemini Robotics-ER على فهم المشهد، والتعرف على شكل السلك ومرونته، وتحديد هيكل سماعة الرأس، والتنبؤ بكيفية انحناء السلك أثناء تحركه. بعد ذلك، يترجم Gemini Robotics هذا الفهم إلى إجراء، منسقاً كلتا اليدين لمعالجة السلك بسلاسة، وتعديل قبضته لتجنب التشابك، وضمان لف آمن.

من خلال الجمع بين الإدراك والعمل، ينشئ Gemini Robotics وGemini Robotics-ER نظاماً ذكياً يسمح للروبوتات بأداء مهام دقيقة بكفاءة في بيئات ديناميكية.

نظرة عامة على عائلة نماذج Gemini Robotics

الشكل 2. نظرة عامة على عائلة نماذج Gemini Robotics.

Link to this sectionالذكاء الاصطناعي في الروبوتات: استكشاف كيفية عمل Gemini Robotics#

بعد ذلك، دعونا نلقي نظرة فاحصة على كل نموذج لفهم كيفية عمل Gemini Robotics وGemini Robotics-ER معاً لتحقيق التوازن بين المرونة والإجراءات السريعة.

من ناحية، يستفيد Gemini Robotics-ER من آليتين رئيسيتين: توليد التعليمات البرمجية دون تدريب مسبق (zero-shot) والتعلم السياقي باستخدام أمثلة قليلة (few-shot ICL). مع توليد التعليمات البرمجية دون تدريب مسبق، يمكن للنموذج إنشاء تعليمات برمجية للتحكم في الروبوت بناءً على تعليمات المهام والصور والبيانات في الوقت الفعلي دون الحاجة إلى تدريب إضافي.

وبالمثل، مع التعلم باستخدام أمثلة قليلة، يتكيف النموذج مع المهام الجديدة من خلال التعلم من بضعة أمثلة فقط، مما يقلل الحاجة إلى تدريب مكثف. معاً، تتيح هذه الأساليب للروبوت أداء مهام معقدة بسرعة والتكيف مع التحديات الجديدة بأقل جهد.

من ناحية أخرى، تم تصميم Gemini Robotics للسرعة والكفاءة. وهو يستخدم نظاماً هجيناً يتكون من بنية أساسية سحابية ووحدة فك ترميز الإجراءات على الجهاز. تعالج البنية الأساسية السحابية المعلومات بسرعة، مع زمن انتقال من الاستعلام إلى الاستجابة أقل من 160 مللي ثانية.

ثم تساعد وحدة فك الترميز الموجودة على الجهاز في ترجمة هذه البيانات إلى إجراءات في الوقت الفعلي. يحقق هذا النظام المدمج وقت استجابة إجمالي يبلغ حوالي 250 مللي ثانية، مع سرعة تحكم تبلغ 50 إجراءً في الثانية.

كيف تدعم Gemini Robotics التحكم في الروبوت في الوقت الفعلي

الشكل 3. فهم كيفية دعم Gemini Robotics للتحكم في الروبوت في الوقت الفعلي.

Link to this sectionالقدرات الرئيسية لـ Gemini Robotics#

إليك لمحة سريعة عن الميزات الرئيسية لـ Gemini Robotics:

العمومية: يمكنه التكيف مع التغيرات في الإضاءة والخلفيات والأشياء مع البقاء دقيقاً. كما أنه يفهم الأوامر المعاد صياغتها أو متعددة اللغات ويمكنه تعديل الحركات لظروف مختلفة.
التفاعلية: يمكن لهذا النموذج معالجة مجموعة واسعة من أوامر اللغة الطبيعية والاستجابة بشكل حدسي. كما أنه يعدل إجراءاته بناءً على التغيرات في الوقت الفعلي في البيئة، مما يجعله مثالياً لـ التعاون بين الإنسان والروبوت.
البراعة: يمكن للروبوت المدعوم بهذا النموذج أداء مهام معقدة ودقيقة، مثل طي الأوريجامي أو التعامل مع الأشياء الحساسة. سواء كانت عملية خطوة بخطوة أو إجراءات سريعة، يمكن للنموذج المساعدة في تنفيذها بكفاءة.
تجسيدات متعددة: يعمل عبر منصات روبوتية مختلفة، مثل أنظمة الأذرع المزدوجة والروبوتات الشبيهة بالبشر، مع القليل من الضبط الدقيق. ويتكيف بسرعة مع المهام الجديدة مع الحفاظ على أداء عالٍ.

Google Gemini Robotics تعمل عبر منصات روبوتية متنوعة

الشكل 4. Google Gemini Robotics يعمل عبر منصات روبوتية مختلفة.

Link to this sectionالقدرات الرئيسية لـ Gemini Robotics-ER#

إليك نظرة على بعض الميزات الرئيسية لـ Gemini Robotics-ER التي تساعد الروبوتات على فهم العالم والتفاعل معه:

كشف الأشياء وتتبعها: يمكن استخدامه لتحديد وتتبع الأشياء في مساحات ثنائية وثلاثية الأبعاد. من خلال استخدام استعلامات اللغة الطبيعية، فإنه يساعد الروبوتات في العثور على الأشياء والتنبؤ بمواقعها، سواء بناءً على النوع أو الموقع أو الوظيفة.
التأشير: تتيح هذه الميزة للنموذج تحديد أشياء أو أجزاء معينة داخل صورة باستخدام إحداثيات دقيقة. ويمكن استخدامه لمساعدة الروبوتات في تحديد مواقع الأشياء الكاملة، أو أجزاء من الأشياء، أو حتى المساحات الفارغة.
التنبؤ بالإمساك: يمكن استخدام Gemini Robotics-ER لتحديد أفضل طريقة للإمساك بالأشياء بناءً على شكلها ووظيفتها. فهو يتنبأ بمكان الإمساك، سواء كان موزة أو مقبض كوب، مما يمكّن الروبوتات من التعامل مع العناصر بعناية.
استدلال المسار: يمكن استخدام النموذج لتخطيط مسارات الحركة من خلال التنبؤ بتسلسلات الإجراءات. على سبيل المثال، يمكنه توجيه يد الروبوت نحو أداة أو تحديد نقاط مسار لمهمة محددة، مما يساعد الروبوت على إكمال المهام بكفاءة.
التوافق بين وجهات النظر المتعددة: تساعد هذه الميزة النموذج على فهم الهياكل ثلاثية الأبعاد من خلال مقارنة كيفية ظهور الأشياء من زوايا مختلفة. يمكن استخدامها لتعزيز الاستدلال المكاني، مما يسمح للروبوتات بالتفاعل بشكل أفضل مع الأشياء في البيئات الديناميكية.

Gemini Robotics-ER تتعامل مع مجموعة متنوعة من المهام

الشكل 5. يمكن لـ Gemini Robotics-ER التعامل مع مجموعة متنوعة من المهام.

Link to this sectionتطبيقات نماذج Google Gemini Robotics#

الآن وبعد أن ناقشنا القدرات الرئيسية لـ Gemini Robotics وGemini Robotics-ER، دعونا نتعمق في تطبيقاتهما في العالم الحقيقي عبر مختلف الصناعات.

Link to this sectionيمكن استخدام Google Gemini Robotics في التصنيع#

عندما يتعلق الأمر بـ التصنيع، فإن الدقة والسرعة أمران مهمان، ولكن القدرة على التكيف هي ما يجعل كل شيء يعمل بسلاسة. على سبيل المثال، يمكن لروبوت صناعي مدعوم بـ Gemini تجميع نظام بكرة من خلال تحديد المكونات الصحيحة، ووضعها بشكل صحيح، والتعامل مع شريط مطاطي مرن بقوة دقيقة.

يمكنه تمديد الشريط، وتدويره حول البكرات، وتثبيته دون كسر أو سوء محاذاة. إذا تغير الإعداد أو اختلفت المهمة، يمكن للروبوت التكيف دون الحاجة إلى إعادة برمجة مكثفة. تقلل هذه الأتمتة الذكية من الأخطاء، وتحسن الكفاءة، وتحافظ على سير عمليات التصنيع بسلاسة.

روبوت صناعي ذو ذراعين يركب حزاماً مطاطياً على نظام بكرة

الشكل 6. يقوم روبوت صناعي ذو ذراعين بتركيب شريط مطاطي بدقة على نظام بكرة.

Link to this sectionالمنازل الذكية الممكنة بواسطة Gemini Robotics#

يمكن للجداول الزمنية المزدحمة أن تجعل مواكبة الأعمال المنزلية أمراً صعباً. يمكن للروبوتات الذكية التدخل للتعامل مع مهام مثل التنظيف، وفرز البقالة، وحتى المساعدة في تحضير الوجبات، مما يجعل الحياة اليومية أسهل.

قد يبدو هذا كروبوت يحزم حقيبة غداء، حيث يختار ويضع المواد الغذائية بعناية في الداخل مع تعديل قبضته لحماية العناصر الهشة مثل الفاكهة أو العلب. حتى إذا تغير الترتيب، يمكن للروبوت التكيف بمفرده، مما يخفف من الأعمال اليومية بأقل قدر من الإشراف.

روبوت بشري الشكل يحزم حقيبة غداء بعناية

الشكل 7. روبوت شبيه بالبشر يحزم حقيبة غداء بعناية.

Link to this sectionإيجابيات وسلبيات الاستفادة من Gemini Robotics#

تعمل Gemini Robotics على توسيع ما يمكن للروبوتات القيام به، من التصنيع الدقيق إلى المساعدة في المنزل الذكي. فيما يلي بعض المزايا الرئيسية لاستخدام Gemini Robotics عبر تطبيقات مختلفة:

الحد الأدنى من متطلبات التدريب: على عكس الروبوتات التقليدية، يمكن للروبوتات المدفوعة بـ Gemini Robotics التعلم من بضعة عروض توضيحية، مما يقلل من تكاليف التدريب ويجعلها أسهل في النشر.
تعزيز السلامة: في البيئات الخطرة، يمكن للروبوتات المدمجة مع Gemini Robotics أداء مهام خطيرة، مما يقلل من خطر الإصابة للعمال البشريين.
ميزات قابلة للتخصيص: تعني مرونة Gemini Robotics أنه يمكن تصميمها لتلبية الاحتياجات المحددة للصناعات المختلفة أو الشركات الفردية، مما يسمح بتطبيقات متخصصة وحلول فريدة.

بينما تقدم Gemini Robotics العديد من المزايا، من المهم أيضاً معالجة القيود التالية:

تحديات العلاقات المكانية: قد تواجه هذه النماذج صعوبة في تتبع العلاقات المكانية عبر تسلسلات الفيديو الطويلة، مما يؤثر على قدرتها على تتبع الأشياء وفهمها بمرور الوقت.
نقص الدقة العددية: قد لا تكون تنبؤات النموذج، مثل النقاط ومربعات الإحاطة (bounding boxes)، دقيقة بما يكفي للمهام التي تتطلب تحكماً دقيقاً، مثل المهام الروبوتية الحساسة.
المهام المعقدة: قد تواجه Gemini Robotics صعوبة في التعامل مع المهام المعقدة التي تحتاج إلى استدلال متعدد الخطوات وحركات دقيقة، خاصة في المواقف الجديدة أو غير المألوفة.

Link to this sectionمستقبل الذكاء الاصطناعي في الروبوتات#

مع استمرار تقدم الذكاء الاصطناعي، تقود نماذج مثل Gemini Robotics وGemini Robotics-ER مستقبل الروبوتات. من المرجح أن تركز التحسينات المستقبلية على تعزيز الاستدلال متعدد الخطوات، مما يتيح للروبوتات تقسيم المهام إلى خطوات منطقية لمزيد من الدقة.

مجال رئيسي آخر للتطوير تخطط Google DeepMind للعمل عليه هو التدريب القائم على المحاكاة. من خلال التعلم في بيئات افتراضية قبل النشر في العالم الحقيقي، يمكن للروبوتات تحسين اتخاذ القرار وحركاتها، مما يقلل الأخطاء في التطبيقات العملية.

مع تطور هذه التقنيات، يمكنها تمهيد الطريق لمستقبل تكون فيه الروبوتات أكثر استقلالية، وقابلية للتكيف، وقادرة على العمل بسلاسة جنباً إلى جنب مع البشر في الحياة اليومية.

Link to this sectionأبرز النقاط#

تعد Gemini Robotics خطوة كبيرة إلى الأمام في الأتمتة المدفوعة بالذكاء الاصطناعي، حيث تربط الذكاء الرقمي بالمهام الفيزيائية في العالم الحقيقي. من خلال الجمع بين الرؤية واللغة والتعلم القائم على الإجراءات، يمكن لهذه الروبوتات التعامل مع المهام المعقدة بدقة وقدرة على التكيف.

مع استمرار الروبوتات في أن تصبح أكثر ذكاءً، من المرجح أن تلعب دوراً أكبر في الحياة اليومية، مما يغير طريقة عمل البشر والآلات معاً. هذا التقدم يقربنا من عالم ذكي وأكثر اتصالاً حيث تعزز الأتمتة المدفوعة بالذكاء الاصطناعي كلاً من الصناعات والمهام اليومية.

كن جزءاً من مجتمعنا المتنامي! قم بزيارة مستودع GitHub الخاص بنا للتعمق أكثر في الذكاء الاصطناعي. هل تتطلع لبدء مشاريعك الخاصة في الرؤية الحاسوبية؟ ألقِ نظرة على خيارات الترخيص لدينا. اعرف المزيد عن الذكاء الاصطناعي في التصنيع والرؤية بالذكاء الاصطناعي في صناعة السيارات على صفحات الحلول الخاصة بنا!

Explore solutions

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

نماذج Google Gemini Robotics تُشغّل روبوتات أكثر ذكاءً

Link to this sectionنقدم لكم Google Gemini Robotics#

Link to this sectionالذكاء الاصطناعي في الروبوتات: استكشاف كيفية عمل Gemini Robotics#

Link to this sectionالقدرات الرئيسية لـ Gemini Robotics#

Link to this sectionالقدرات الرئيسية لـ Gemini Robotics-ER#

Link to this sectionتطبيقات نماذج Google Gemini Robotics#

Link to this sectionيمكن استخدام Google Gemini Robotics في التصنيع#

Link to this sectionالمنازل الذكية الممكنة بواسطة Gemini Robotics#

Link to this sectionإيجابيات وسلبيات الاستفادة من Gemini Robotics#

Link to this sectionمستقبل الذكاء الاصطناعي في الروبوتات#

Link to this sectionأبرز النقاط#

Explore solutions

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

الذكاء الاصطناعي في الروبوتات

الذكاء الاصطناعي في الخدمات اللوجستية

الذكاء الاصطناعي في التجزئة

الذكاء الاصطناعي في الرعاية الصحية

الذكاء الاصطناعي في التصنيع

الذكاء الاصطناعي في مجال السيارات

الذكاء الاصطناعي في الزراعة

لنبنِ مستقبل الذكاء الاصطناعي معاً!