Yolo فيجن شنتشن
شنتشن
انضم الآن

Google Genie 3 من Google Genie 3 يجعل عالمك ثلاثي الأبعاد ينبض بالحياة بفضل الذكاء الاصطناعي

أبيرامي فينا

4 دقائق قراءة

15 أغسطس، 2025

يقوم نموذج العالم ثلاثي الأبعاد للذكاء الاصطناعي Genie 3 من DeepMind بتحويل مطالبات النصوص أو الصور إلى بيئات ثلاثية الأبعاد. يمثل هذا التقدم خطوة أخرى نحو الذكاء الشبيه بالبشر.

في الخامس من أغسطس 2025، أصدرت Google DeepMind في 5 أغسطس 2025 أحدث إصدار من نموذج Genie، المعروف باسم Genie 3. وهو نموذج جديد للذكاء الاصطناعي يمكنه تحويل المطالبات النصية للمستخدم إلى بيئات تفاعلية ديناميكية. 

تتيح هذه البيئات، أو عوالم الذكاء الاصطناعي، للمستخدم التنقل والتفاعل معها في الوقت الفعلي، تمامًا كما هو الحال في لعبة الفيديو. يمكن للمستخدمين أيضًا توسيع البيئة أو تعديلها من خلال تقديم مطالبات نصية إضافية، مما يتيح إجراء تغييرات فورية دون إعادة تشغيل المحاكاة. 

ما يجعل نموذج Genie Google الأخير مؤثراً بشكل خاص هو أنه يمكن استخدامه لتدريب وكلاء الذكاء الاصطناعي. يتضمن ذلك تعليم وكلاء الذكاء الاصطناعي اتخاذ القرارات أو أداء المهام باستخدام البيانات والتغذية الراجعة. وباستخدام بيئة محاكاة ثلاثية الأبعاد بدلاً من العالم الحقيقي، يمكن للباحثين تجنب العديد من التحديات والتكاليف والمخاطر التي ينطوي عليها التدريب في العالم الحقيقي.

يمكن ل Google Genie 3 أيضاً محاكاة سيناريوهات معقدة، مثل اختبار قيادة سيارة ذاتية القيادة في الطقس القاسي أو بدلة ذات أجنحة تحلق في التضاريس الجبلية. 

في هذه المقالة، سنستكشف Google Genie 3 وإمكانياته. لنبدأ!

الشكل 1. لقطة من محاكاة Genie 3 تظهر طيرانًا بالبدلة المجنحة. (المصدر)

نبذة تاريخية موجزة عن نماذج GoogleGenie

قبل أن نغوص في نماذج Genie من Google DeepMind، دعونا نفهم بشكل أفضل ما هي نماذج العالم. 

نماذج العالم هي أنظمة ذكاء اصطناعي تتعلم قواعد العالم الحقيقي مثل الفيزياء والحركة والعلاقات المكانية من النصوص والصور ومقاطع الفيديو ومجموعات بيانات الحركة. يتيح لهم ذلك إنشاء مشاهد واقعية والتنبؤ بكيفية تطورها. نماذج Genie هي أمثلة على هذه الأنظمة.

فيما يلي لمحة سريعة عن نماذج Google Genie السابقة التي مهدت الطريق لـ Genie 3:

  • Genie 1: كان Genie 1، الذي غالبًا ما يشار إليه ببساطة باسم Google Genie، أول نموذج لعالم الذكاء الاصطناعي من Google DeepMind قادر على إنشاء بيئات افتراضية تفاعلية. يمكن للمستخدمين وصف عالم ما بنصوص أو صور أو صور أو حتى رسومات تخطيطية، وكان بإمكان "جيني" توليدها، مما يتيح لهم التحكم في الإجراءات داخل المشهد. تم تصميمه لمعالجة بيانات الفيديو بمرور الوقت، والتنبؤ بالإطار التالي، وترجمة مدخلات المستخدم إلى إجراءات داخل العالم.
  • Genie 2: استنادًا إلى قدرات Google Genie، يمكن لـ Genie 2 إنشاء مجموعة واسعة من العوالم ثلاثية الأبعاد التفاعلية المفصلة. وباعتباره نموذجًا للعالم، فقد كان يحاكي البيئات الافتراضية ويستجيب بشكل واقعي لأفعال مثل القفز أو السباحة أو تحريك الأشياء. وقد تم تدريبه على مجموعة هائلة من مقاطع الفيديو، وتميزت بتفاعلات واقعية مع الأجسام وحركات الشخصيات النابضة بالحياة.

ما هو Genie 3؟ نموذج Googleالجديد للذكاء الاصطناعي

بناءً على نماذج Genie السابقة، يعد Genie 3 هو الأحدث والأكثر تقدماً في السلسلة. وهو يعتمد بشكل خاص على Genie 2، الذي يمكنه توليد بيئات افتراضية جديدة، و Veo 3، أحدث نماذج توليد الفيديو من Google DeepMind. يُظهر Veo 3 فهماً عميقاً للفيزياء وكيفية تفاعل الأجسام في العالم الحقيقي.

في حين يستخدم Veo 3 محرك فيزياء مشفّر، فإن Google Genie 3 يعلّم نفسه كيف تعمل الفيزياء باستخدام طريقة تُعرف باسم التعلّم الذاتي الخاضع للإشراف. وهي تقنية تعلُّم الذكاء الاصطناعي حيث يتعلم نموذج الذكاء الاصطناعي الأنماط والعلاقات من البيانات غير المُسمَّاة من خلال توليد إشارات التعلُّم الخاصة به. 

تُعد قدرة Google Genie 3 على التعلُّم الذاتي الخاضع للإشراف الذاتي أمرًا بالغ الأهمية لتدريب أنظمة الذكاء الاصطناعي، مثل وكلاء الذكاء الاصطناعي أو روبوتات الذكاء الاصطناعي، على التعامل مع المهام المختلفة. في الواقع، يرى الباحثون في Google DeepMind أن Genie 3 خطوة مهمة نحو إنشاء الذكاء الاصطناعي العام (AGI)

الشكل 2. مثال على استخدام Google Genie 3 لمحاكاة التحكم في مركبة روبوتية.(المصدر)

الذكاء الاصطناعي العام (AGI) هو شكل نظري من الذكاء الاصطناعي يمكنه فهم وتعلم أي مهمة أو موضوع وتطبيق هذه المعرفة في مختلف المواقف، تمامًا مثل الإنسان. على عكس نماذج الذكاء الاصطناعي الحالية، والتي تم تصميمها لمهام محددة وتواجه صعوبة في نقل مهاراتها إلى مشاكل جديدة، سيكون الذكاء الاصطناعي العام (AGI) قادرًا على التكيف والتعلم في مجموعة واسعة من السياقات.

الميزات الرئيسية لـ Google Genie 3 المتعلقة ببناء عالم الذكاء الاصطناعي

فيما يلي بعض الميزات الرئيسية التي يدعمها Genie 3:

  • إنشاء عالم ثلاثي الأبعاد من النص: يمكنه تحويل مطالبة نصية بسيطة (مثل "روبوت يسير في الشارع") إلى بيئة ثلاثية الأبعاد قابلة للعب مع عناصر تحكم أساسية في الحركة.
  • أحداث العالم القابلة للتوجيه: يمكن للمستخدمين تغيير البيئة ديناميكيًا عن طريق كتابة أوامر جديدة (على سبيل المثال، إضافة مطر إلى الشارع).
  • الذاكرة البصرية: يمكن لـ Genie 3 تذكر الكائنات المتروكة في البيئة والسماح لك بإعادة زيارتها لاحقًا، لمدة دقيقة واحدة تقريبًا.
  • إخراج فيديو سلس ومتسق: يمكنه الحفاظ على إخراج فيديو يبلغ 24 إطارًا في الثانية (fps) بدقة 720 بكسل، مع تفاعل أطول مقارنةً بـ Genie 2.
الشكل 3. يمكن لـ Google Genie 3 توليد مخرجات تدوم لفترة أطول من تلك التي ينتجها Genie 2.(المصدر).

من التعليم إلى الألعاب: تطبيقات Google DeepMind's Genie 3 من Google DeepMind

يمكن ل Google Genie 3 أن يجعل التعلُّم والبحث والتدريب أكثر جاذبية وجاذبية. على سبيل المثال، في الفصول الدراسية، يمكن أن تجعل التاريخ أو العلوم أو الجغرافيا تنبض بالحياة من خلال السماح للطلاب باستكشاف المدن القديمة أو السفر عبر الفضاء. وبالمثل، بالنسبة لمطوّري الذكاء الاصطناعي، فإنه يوفر عوالم افتراضية واقعية لممارسة الاستراتيجيات والتغلب على التحديات وتحسين مهارات اتخاذ القرار.

يمكن للعلماء أيضًا استخدامه لإنشاء عمليات محاكاة مُحكمة لاختبار الأفكار أو دراسة النظم البيئية أو مراقبة سلوك الكائنات. هناك تطبيق آخر مثير للاهتمام وهو في تطوير ألعاب الفيديو. يمكن لمطوري الألعاب تحويل مطالبات نصية إلى عوالم ألعاب مفصلة، مما يسرع التطوير ويقلل الحاجة إلى فرق كبيرة.

الشكل 4. يمكن تصميم ألعاب ممتعة وملونة وتفاعلية باستخدام Genie 3. (المصدر)

حدود Google جيني 3 كنموذج عالمي

على الرغم من أن Google Genie 3 يقدم العديد من الميزات والفوائد، إلا أنه من المهم أيضًا مراعاة عيوبه. 

فيما يلي بعض القيود التي يجب أخذها في الاعتبار:

  • نطاق عمل محدود: على الرغم من أنه يمكنك تشغيل العديد من الأحداث في العالم الافتراضي، إلا أنه لا يتم تنفيذها جميعًا بواسطة الوكيل نفسه. لا تزال الإجراءات التي يمكن للوكيل تنفيذها مباشرة محدودة.
  • التفاعل مع الوكلاء الآخرين: لا يزال إنشاء تفاعلات واقعية بين العديد من الوكلاء المستقلين في نفس البيئة قيد التقدم.
  • دقة العالم الحقيقي: لا يستطيع Google Genie 3 حتى الآن إعادة إنشاء مواقع في العالم الحقيقي بدقة جغرافية مثالية.

النقاط الرئيسية

يمثل Google Genie 3 تقدمًا كبيرًا في إنشاء عوالم واقعية وتفاعلية ثلاثية الأبعاد باستخدام الذكاء الاصطناعي. فهو قادر على بث الحياة في الأفكار من خلال مطالبات نصية بسيطة، ومحاكاة الفيزياء، وحتى تدريب أنظمة الذكاء الاصطناعي في أماكن افتراضية آمنة. 

على الرغم من أن له حدودًا، إلا أنه يفتح العديد من الاحتمالات للبحث والألعاب وتطوير الذكاء الاصطناعي. كما أنها خطوة حاسمة نحو أنظمة الذكاء الاصطناعي العام (AGI) التي يمكنها التفكير والتعلم بشكل أقرب إلى البشر.

تحقق من مستودع GitHub الخاص بنا لاكتشاف المزيد حول الذكاء الاصطناعي. انضم إلى مجتمعنا النشط واكتشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في البيع بالتجزئة و الرؤية الاصطناعية في التصنيع. للبدء في الرؤية الحاسوبية اليوم، تحقق من خيارات الترخيص الخاصة بنا.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا