Google Genie 3 من Google Genie 3 يجعل عالمك ثلاثي الأبعاد ينبض بالحياة بفضل الذكاء الاصطناعي

أبيرامي فينا

4 دقائق للقراءة

15 أغسطس 2025

يقوم نموذج عالم الذكاء الاصطناعي Genie 3 من DeepMind بتحويل المطالبات النصية أو الصور إلى بيئات ثلاثية الأبعاد. يمثل هذا التقدم خطوة أخرى نحو الذكاء الشبيه بالذكاء البشري.

في الخامس من أغسطس 2025، أصدرت Google DeepMind في 5 أغسطس 2025 أحدث إصدار من نموذج Genie، المعروف باسم Genie 3. وهو نموذج جديد للذكاء الاصطناعي يمكنه تحويل المطالبات النصية للمستخدم إلى بيئات تفاعلية ديناميكية. 

تتيح هذه البيئات، أو عوالم الذكاء الاصطناعي، للمستخدم إمكانية التنقل والتفاعل معها في الوقت الفعلي، كما هو الحال في ألعاب الفيديو. يمكن للمستخدمين أيضًا توسيع البيئة أو تعديلها من خلال توفير مطالبات نصية إضافية، مما يتيح إجراء تغييرات سريعة دون إعادة تشغيل المحاكاة. 

ما يجعل نموذج Genie Google الأخير مؤثراً بشكل خاص هو أنه يمكن استخدامه لتدريب وكلاء الذكاء الاصطناعي. ويتضمن ذلك تعليم وكلاء الذكاء الاصطناعي اتخاذ القرارات أو أداء المهام باستخدام البيانات والتغذية الراجعة. وباستخدام بيئة محاكاة ثلاثية الأبعاد بدلاً من العالم الحقيقي، يمكن للباحثين تجنب العديد من التحديات والتكاليف والمخاطر التي ينطوي عليها التدريب في العالم الحقيقي.

يمكن ل Google Genie 3 أيضاً محاكاة سيناريوهات معقدة، مثل اختبار قيادة سيارة ذاتية القيادة في الطقس القاسي أو بدلة ذات أجنحة تحلق في التضاريس الجبلية. 

في هذه المقالة، سنستكشف Google Genie 3 وإمكانياته. لنبدأ!

الشكل 1. إطار من محاكاة "جيني 3" يُظهر انزلاق البدلة المجنحة.(المصدر)

نبذة تاريخية موجزة عن نماذج Google Genie

قبل أن نغوص في نماذج Genie من Google DeepMind، دعونا نفهم بشكل أفضل ما هي نماذج العالم. 

نماذج العالم هي أنظمة ذكاء اصطناعي تتعلم قواعد العالم الحقيقي مثل الفيزياء والحركة والعلاقات المكانية من النصوص والصور ومقاطع الفيديو ومجموعات بيانات الحركة. وهذا يسمح لها بإنشاء مشاهد واقعية والتنبؤ بكيفية تطورها. نماذج الجني هي أمثلة على هذه الأنظمة.

فيما يلي لمحة سريعة عن نماذج Google Genie السابقة التي مهدت الطريق لـ Genie 3:

  • Genie 1: كان Genie 1، الذي غالبًا ما يشار إليه ببساطة باسم Google Genie، أول نموذج لعالم الذكاء الاصطناعي من Google DeepMind قادر على إنشاء بيئات افتراضية تفاعلية. يمكن للمستخدمين وصف عالم ما بنصوص أو صور أو صور أو حتى رسومات تخطيطية، وكان بإمكان "جيني" توليدها، مما يتيح لهم التحكم في الإجراءات داخل المشهد. تم تصميمه لمعالجة بيانات الفيديو بمرور الوقت، والتنبؤ بالإطار التالي، وترجمة مدخلات المستخدم إلى إجراءات داخل العالم.
  • Genie 2: استنادًا إلى قدرات Google Genie، يمكن لـ Genie 2 إنشاء مجموعة واسعة من العوالم ثلاثية الأبعاد التفاعلية المفصلة. وباعتباره نموذجًا للعالم، فقد كان يحاكي البيئات الافتراضية ويستجيب بشكل واقعي لأفعال مثل القفز أو السباحة أو تحريك الأشياء. وقد تم تدريبه على مجموعة هائلة من مقاطع الفيديو، وتميزت بتفاعلات واقعية مع الأجسام وحركات الشخصيات النابضة بالحياة.

ما هو Genie 3؟ نموذج جوجل الجديد للذكاء الاصطناعي

بناءً على نماذج Genie السابقة، يعد Genie 3 هو الأحدث والأكثر تقدماً في السلسلة. وهو يعتمد بشكل خاص على Genie 2، الذي يمكنه توليد بيئات افتراضية جديدة، و Veo 3، أحدث نماذج توليد الفيديو من Google DeepMind. يُظهر Veo 3 فهماً عميقاً للفيزياء وكيفية تفاعل الأجسام في العالم الحقيقي.

في حين يستخدم Veo 3 محرك فيزياء مشفّر، فإن Google Genie 3 يعلّم نفسه كيف تعمل الفيزياء باستخدام طريقة تُعرف باسم التعلّم الذاتي الخاضع للإشراف. وهي تقنية تعلُّم الذكاء الاصطناعي حيث يتعلم نموذج الذكاء الاصطناعي الأنماط والعلاقات من البيانات غير المُسمَّاة من خلال توليد إشارات التعلُّم الخاصة به. 

تُعد قدرة Google Genie 3 على التعلُّم الذاتي الخاضع للإشراف الذاتي أمرًا بالغ الأهمية لتدريب أنظمة الذكاء الاصطناعي، مثل وكلاء الذكاء الاصطناعي أو روبوتات الذكاء الاصطناعي، على التعامل مع المهام المختلفة. في الواقع، يرى الباحثون في Google DeepMind أن Genie 3 خطوة مهمة نحو إنشاء الذكاء الاصطناعي العام (AGI)

الشكل 2. مثال على استخدام Google Genie 3 لمحاكاة التحكم في مركبة روبوتية.(المصدر)

الذكاء الاصطناعي للذكاء الاصطناعي هو شكل نظري للذكاء الاصطناعي يمكنه فهم وتعلم أي مهمة أو موضوع وتطبيق تلك المعرفة في مواقف مختلفة، مثل الإنسان. وخلافاً لنماذج الذكاء الاصطناعي الحالية، التي تم تصميمها لمهام محددة وتكافح من أجل نقل مهاراتها إلى مشاكل جديدة، فإن الذكاء الاصطناعي المُعدّل ذكاءً اصطناعياً قادراً على التكيف والتعلم في مجموعة واسعة من السياقات.

الميزات الرئيسية لـ Google Genie 3 المتعلقة ببناء عالم الذكاء الاصطناعي

فيما يلي بعض الميزات الرئيسية التي يدعمها Genie 3:

  • تحويل النص إلى عالم ثلاثي الأبعاد: يمكنه تحويل مطالبة نصية بسيطة (على سبيل المثال، "روبوت يسير في الشارع") إلى بيئة ثلاثية الأبعاد قابلة للتشغيل مع عناصر تحكم أساسية في الحركة.
  • أحداث العالم القابلة للاستدعاء: يمكن للمستخدمين تغيير البيئة بشكل ديناميكي عن طريق كتابة أوامر جديدة (على سبيل المثال، إضافة المطر إلى الشارع).
  • ذاكرة بصرية: يستطيع جيني 3 أن يتذكر الأشياء المتروكة في البيئة المحيطة ويتيح لك إعادة زيارتها لاحقاً، وتستمر لمدة دقيقة واحدة تقريباً.
الشكل 3. يمكن لـ Google Genie 3 توليد مخرجات تدوم لفترة أطول من تلك التي ينتجها Genie 2.(المصدر).

من التعليم إلى الألعاب: تطبيقات Google DeepMind's Genie 3 من Google DeepMind

يمكن ل Google Genie 3 أن يجعل التعلُّم والبحث والتدريب أكثر جاذبية وجاذبية. على سبيل المثال، في الفصول الدراسية، يمكن أن تجعل التاريخ أو العلوم أو الجغرافيا تنبض بالحياة من خلال السماح للطلاب باستكشاف المدن القديمة أو السفر عبر الفضاء. وبالمثل، بالنسبة لمطوّري الذكاء الاصطناعي، فإنه يوفر عوالم افتراضية واقعية لممارسة الاستراتيجيات والتغلب على التحديات وتحسين مهارات اتخاذ القرار.

كما يمكن للعلماء استخدامها لإنشاء عمليات محاكاة مضبوطة لاختبار الأفكار أو دراسة النظم البيئية أو مراقبة سلوك الأجسام. وهناك تطبيق آخر مثير للاهتمام في تطوير ألعاب الفيديو. حيث يمكن لمطوري الألعاب تحويل المطالبات النصية إلى عوالم ألعاب مفصلة، مما يسرع من عملية التطوير ويقلل من الحاجة إلى فرق كبيرة.

الشكل 4. يمكن تصميم ألعاب ممتعة وملونة وتفاعلية باستخدام Genie 3.(المصدر).

حدود جوجل جيني 3 كنموذج عالمي

على الرغم من أن Google Genie 3 يقدم العديد من الميزات والفوائد، إلا أنه من المهم أيضًا مراعاة عيوبه. 

فيما يلي بعض القيود التي يجب وضعها في الاعتبار:

  • نطاق عمل محدود: على الرغم من أنه يمكنك تشغيل العديد من الأحداث في العالم الافتراضي، إلا أنه لا يمكن للوكيل تنفيذ جميع هذه الأحداث بنفسه. لا تزال الإجراءات التي يمكن للوكيل تنفيذها مباشرةً محدودة.
  • التفاعل مع وكلاء آخرين: لا يزال إنشاء تفاعلات واقعية بين عدة وكلاء مستقلين في نفس البيئة عملاً قيد التنفيذ.
  • دقة العالم الحقيقي: لا يستطيع Google Genie 3 حتى الآن إعادة إنشاء مواقع في العالم الحقيقي بدقة جغرافية مثالية.

الوجبات الرئيسية

يمثل Google Genie 3 تقدماً كبيراً في إنشاء عوالم واقعية وتفاعلية ثلاثية الأبعاد باستخدام الذكاء الاصطناعي. فهو قادر على بث الحياة في الأفكار من خلال مطالبات نصية بسيطة، ومحاكاة الفيزياء، وحتى تدريب أنظمة الذكاء الاصطناعي في أماكن افتراضية آمنة. 

وعلى الرغم من أنه لا يزال له حدود، إلا أنه يفتح العديد من الاحتمالات للبحث والألعاب وتطوير الذكاء الاصطناعي. كما أنها خطوة حاسمة نحو أنظمة الذكاء الاصطناعي للذكاء الاصطناعي التي يمكنها التفكير والتعلم مثل البشر.

اطلع على مستودع GitHub الخاص بنا لاكتشاف المزيد عن الذكاء الاصطناعي. انضم إلى مجتمعنا النشط واكتشف ابتكارات في قطاعات مثل الذكاء الاصطناعي في قطاع البيع بالتجزئة والذكاء الاصطناعي البصري في التصنيع. لبدء استخدام الرؤية الحاسوبية اليوم، اطلع على خيارات الترخيص لدينا.

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل التعلم الآلي

ابدأ مجاناً
تم نسخ الرابط إلى الحافظة