بالنقر فوق “قبول جميع ملفات تعريف الارتباط”، فإنك توافق على تخزين ملفات تعريف الارتباط على جهازك لتحسين التنقل في الموقع وتحليل استخدام الموقع والمساعدة في جهودنا التسويقية. مزيد من المعلومات
إعدادات ملفات تعريف الارتباط
بالنقر فوق “قبول جميع ملفات تعريف الارتباط”، فإنك توافق على تخزين ملفات تعريف الارتباط على جهازك لتحسين التنقل في الموقع وتحليل استخدام الموقع والمساعدة في جهودنا التسويقية. مزيد من المعلومات
يقوم نموذج العالم ثلاثي الأبعاد للذكاء الاصطناعي Genie 3 من DeepMind بتحويل مطالبات النصوص أو الصور إلى بيئات ثلاثية الأبعاد. يمثل هذا التقدم خطوة أخرى نحو الذكاء الشبيه بالبشر.
في 5 أغسطس 2025، أصدرت Google DeepMind أحدث إصدار من نموذج Genie، المعروف باسم Genie 3. وهو نموذج ذكاء اصطناعي جديد يمكنه تحويل مطالبات المستخدم النصية إلى بيئات ديناميكية وتفاعلية.
تتيح هذه البيئات، أو عوالم الذكاء الاصطناعي، للمستخدم التنقل والتفاعل معها في الوقت الفعلي، تمامًا كما هو الحال في لعبة الفيديو. يمكن للمستخدمين أيضًا توسيع البيئة أو تعديلها من خلال تقديم مطالبات نصية إضافية، مما يتيح إجراء تغييرات فورية دون إعادة تشغيل المحاكاة.
ما يجعل أحدث نموذج Genie Google مؤثرًا بشكل خاص هو أنه يمكن استخدامه لتدريب وكلاء الذكاء الاصطناعي. يتضمن ذلك تعليم وكلاء الذكاء الاصطناعي لاتخاذ القرارات أو أداء المهام باستخدام البيانات والتغذية الراجعة. باستخدام بيئة ثلاثية الأبعاد محاكاة بدلاً من العالم الحقيقي، يمكن للباحثين تجنب العديد من التحديات والتكاليف والمخاطر المرتبطة بالتدريب في العالم الحقيقي.
يمكن لـ Google Genie 3 أيضًا محاكاة سيناريوهات معقدة، مثل اختبار سيارة ذاتية القيادة تقود في طقس عاصف أو بدلة مجنحة تنزلق عبر تضاريس جبلية.
في هذه المقالة، سوف نستكشف Google Genie 3 وقدراته. هيا بنا نبدأ!
الشكل 1. لقطة من محاكاة Genie 3 تظهر طيرانًا بالبدلة المجنحة. (المصدر)
نبذة مختصرة عن تاريخ نماذج Genie من Google
قبل أن نتعمق في نماذج Genie من Google DeepMind، دعنا نحصل على فهم أفضل لماهية نماذج العالم.
نماذج العالم هي أنظمة ذكاء اصطناعي تتعلم قواعد العالم الحقيقي مثل الفيزياء والحركة والعلاقات المكانية من النصوص والصور ومقاطع الفيديو ومجموعات بيانات الحركة. يتيح لهم ذلك إنشاء مشاهد واقعية والتنبؤ بكيفية تطورها. نماذج Genie هي أمثلة على هذه الأنظمة.
إليك لمحة سريعة عن نماذج Google Genie السابقة التي مهدت الطريق لـ Genie 3:
جيني 1: كان جيني 1، الذي يشار إليه غالبًا ببساطة باسم Google Genie، أول نموذج عالمي للذكاء الاصطناعي من Google DeepMind قادرًا على إنشاء بيئات افتراضية تفاعلية. يمكن للمستخدمين وصف عالم بالنص أو الصور أو حتى الرسومات، وسيقوم جيني بإنشائه، مما يسمح لهم بالتحكم في الإجراءات داخل المشهد. تم تصميمه لمعالجة بيانات الفيديو بمرور الوقت، والتنبؤ بالإطار التالي، وترجمة مدخلات المستخدم إلى إجراءات داخل العالم.
جيني 2: بالاعتماد على قدرات Google Genie، يمكن لـ Genie 2 إنشاء مجموعة واسعة من العوالم ثلاثية الأبعاد التفصيلية والتفاعلية. كنموذج عالمي، قام بمحاكاة البيئات الافتراضية واستجاب بشكل واقعي للإجراءات مثل القفز أو السباحة أو تحريك الأشياء. تم تدريبه على مجموعة ضخمة من مقاطع الفيديو، ويتميز بتفاعلات واقعية للكائنات وحركات شخصية نابضة بالحياة.
ما هو Genie 3؟ نموذج الذكاء الاصطناعي الجديد من Google
بالاعتماد على نماذج Genie السابقة، يعتبر Genie 3 هو الأحدث والأكثر تقدمًا في السلسلة. وهو يعتمد بشكل خاص على Genie 2، الذي يمكنه إنشاء بيئات افتراضية جديدة، و Veo 3، أحدث نموذج لتوليد الفيديو من Google DeepMind. يُظهر Veo 3 فهمًا عميقًا للفيزياء وكيفية تفاعل الكائنات في العالم الحقيقي.
بينما تستخدم Veo 3 محركًا فيزيائيًا مرمزًا، فإن Google Genie 3 تعلم نفسها كيف تعمل الفيزياء باستخدام طريقة تُعرف باسم التعلم بالإشراف الذاتي. إنها تقنية تعلم الذكاء الاصطناعي حيث يتعلم نموذج الذكاء الاصطناعي الأنماط والعلاقات من البيانات غير المسماة عن طريق إنشاء إشارات التعلم الخاصة به.
تعد قدرة التعلم بالإشراف الذاتي في Google Genie 3 أمرًا بالغ الأهمية لتدريب أنظمة الذكاء الاصطناعي، مثل وكلاء الذكاء الاصطناعي أو روبوتات الذكاء الاصطناعي، للتعامل مع المهام المختلفة. في الواقع، يرى الباحثون في Google DeepMind أن Genie 3 يمثل خطوة مهمة نحو إنشاء ذكاء اصطناعي عام (AGI).
الشكل 2. مثال على استخدام Google Genie 3 لمحاكاة التحكم في مركبة روبوتية جوالة. (المصدر)
الذكاء الاصطناعي العام (AGI) هو شكل نظري من الذكاء الاصطناعي يمكنه فهم وتعلم أي مهمة أو موضوع وتطبيق هذه المعرفة في مختلف المواقف، تمامًا مثل الإنسان. على عكس نماذج الذكاء الاصطناعي الحالية، والتي تم تصميمها لمهام محددة وتواجه صعوبة في نقل مهاراتها إلى مشاكل جديدة، سيكون الذكاء الاصطناعي العام (AGI) قادرًا على التكيف والتعلم في مجموعة واسعة من السياقات.
الميزات الرئيسية لـ Google Genie 3 المتعلقة ببناء عالم الذكاء الاصطناعي
فيما يلي بعض الميزات الرئيسية التي يدعمها Genie 3:
إنشاء عالم ثلاثي الأبعاد من النص: يمكنه تحويل مطالبة نصية بسيطة (مثل "روبوت يسير في الشارع") إلى بيئة ثلاثية الأبعاد قابلة للعب مع عناصر تحكم أساسية في الحركة.
أحداث العالم القابلة للتوجيه: يمكن للمستخدمين تغيير البيئة ديناميكيًا عن طريق كتابة أوامر جديدة (على سبيل المثال، إضافة مطر إلى الشارع).
الذاكرة البصرية: يمكن لـ Genie 3 تذكر الكائنات المتروكة في البيئة والسماح لك بإعادة زيارتها لاحقًا، لمدة دقيقة واحدة تقريبًا.
إخراج فيديو سلس ومتسق: يمكنه الحفاظ على إخراج فيديو يبلغ 24 إطارًا في الثانية (fps) بدقة 720 بكسل، مع تفاعل أطول مقارنةً بـ Genie 2.
الشكل 3. يمكن لـ Google Genie 3 إنشاء مخرجات تدوم لفترة أطول من تلك التي ينتجها Genie 2. (المصدر)
من التعليم إلى الألعاب: تطبيقات Genie 3 من Google DeepMind
يمكن لـ Google Genie 3 أن يجعل التعلم والبحث والتدريب أكثر غامرة وجاذبية. على سبيل المثال، في الفصول الدراسية، يمكن أن يضفي الحيوية على التاريخ أو العلوم أو الجغرافيا من خلال السماح للطلاب باستكشاف المدن القديمة أو السفر عبر الفضاء. وبالمثل، بالنسبة لمطوري الذكاء الاصطناعي، فإنه يوفر عوالم افتراضية واقعية لممارسة الاستراتيجيات والتغلب على التحديات وتحسين مهارات اتخاذ القرار.
يمكن للعلماء أيضًا استخدامه لإنشاء عمليات محاكاة مُحكمة لاختبار الأفكار أو دراسة النظم البيئية أو مراقبة سلوك الكائنات. هناك تطبيق آخر مثير للاهتمام وهو في تطوير ألعاب الفيديو. يمكن لمطوري الألعاب تحويل مطالبات نصية إلى عوالم ألعاب مفصلة، مما يسرع التطوير ويقلل الحاجة إلى فرق كبيرة.
الشكل 4. يمكن تصميم ألعاب ممتعة وملونة وتفاعلية باستخدام Genie 3. (المصدر)
محددات Google Genie 3 كنموذج عالمي
في حين أن Google Genie 3 يقدم العديد من الميزات والفوائد، فمن المهم أيضًا مراعاة عيوبه.
فيما يلي بعض القيود التي يجب أخذها في الاعتبار:
نطاق عمل محدود: على الرغم من أنه يمكنك تشغيل العديد من الأحداث في العالم الافتراضي، إلا أنه لا يتم تنفيذها جميعًا بواسطة الوكيل نفسه. لا تزال الإجراءات التي يمكن للوكيل تنفيذها مباشرة محدودة.
التفاعل مع الوكلاء الآخرين: لا يزال إنشاء تفاعلات واقعية بين العديد من الوكلاء المستقلين في نفس البيئة قيد التقدم.
دقة العالم الحقيقي: لا يمكن لـ Google Genie 3 حتى الآن إعادة إنشاء مواقع العالم الحقيقي بدقة جغرافية مثالية.
النقاط الرئيسية
يمثل Google Genie 3 تقدمًا كبيرًا في إنشاء عوالم ثلاثية الأبعاد واقعية وتفاعلية باستخدام الذكاء الاصطناعي. يمكنه إضفاء الحيوية على الأفكار من مطالبات نصية بسيطة، ومحاكاة الفيزياء، وحتى تدريب أنظمة الذكاء الاصطناعي في مساحات افتراضية آمنة.
على الرغم من أن له حدودًا، إلا أنه يفتح العديد من الاحتمالات للبحث والألعاب وتطوير الذكاء الاصطناعي. كما أنها خطوة حاسمة نحو أنظمة الذكاء الاصطناعي العام (AGI) التي يمكنها التفكير والتعلم بشكل أقرب إلى البشر.