تعرف على YOLO26: جيل جديد من ذكاء الرؤية الاصطناعي.
Ultralytics
العودة إلى قاموس مصطلحات Ultralytics

Text-to-Video

استكشف الذكاء الاصطناعي التوليدي للنص إلى فيديو. تعلم كيف تولد النماذج محتوى ديناميكياً من النص واستخدم Ultralytics YOLO26 لتحليل وتتبع الفيديو المُنشأ.

يعد تحويل النص إلى فيديو فرعاً متقدماً من الذكاء الاصطناعي التوليدي الذي يركز على تكوين محتوى فيديو ديناميكي مباشرة من الأوصاف النصية. من خلال تفسير مطالبات اللغة الطبيعية، تُنشئ هذه الأنظمة سلسلة متماسكة من الصور التي تتطور بمرور الوقت، مما يسد الفجوة بفعالية بين توليد تحويل النص إلى صورة الساكن ومقاطع الفيديو الكاملة. تعتمد هذه التقنية على بنيات تعلم عميق (DL) معقدة لفهم ليس فقط الدلالات البصرية للكائنات والمشاهد—أي كيف تبدو الأشياء—بل أيضاً ديناميكياتها الزمنية—أي كيف تتحرك الأشياء وتتفاعل مادياً داخل مساحة ثلاثية الأبعاد. مع تزايد الطلب على الوسائط الغنية، يبرز تحويل النص إلى فيديو كأداة محورية للمبدعين، مما يؤدي إلى أتمتة العملية كثيفة العمالة للرسوم المتحركة وإنتاج الفيديو.

Link to this sectionآليات توليد الفيديو#

تتضمن عملية تحويل النص إلى فيديو تآزراً بين معالجة اللغات الطبيعية (NLP) وتكوين الرؤية الحاسوبية. تبدأ العملية عادةً بمشفر نصي، يعتمد غالباً على بنية Transformer، والذي يحول مطالبة المستخدم إلى تضمينات عالية الأبعاد. توجه هذه التضمينات نموذجاً توليدياً، مثل نموذج الانتشار أو شبكة الخصومة التوليدية (GAN)، لإنتاج إطارات بصرية.

يتمثل أحد التحديات الحاسمة في هذه العملية في الحفاظ على الاتساق الزمني. على عكس توليد صورة واحدة، يجب على النموذج التأكد من أن الكائنات لا تومض، أو تتغير بشكل غير مقصود، أو تختفي بين الإطارات. لتحقيق ذلك، يتم تدريب النماذج على مجموعات بيانات ضخمة من أزواج الفيديو والنصوص، لتعلم كيفية انتقال البكسلات بمرور الوقت. تُستخدم تقنيات مثل استكمال الإطارات بشكل متكرر لتنعيم الحركة وزيادة معدل الإطارات، وغالباً ما يتطلب ذلك قوة حوسبة كبيرة من وحدات GPU عالية الأداء.

Link to this sectionتطبيقات العالم الحقيقي#

تعمل تقنية تحويل النص إلى فيديو على إحداث تحول في الصناعات من خلال تمكين التصور السريع وإنشاء المحتوى. من بين أبرز حالتي استخدام:

  • التسويق والإعلان: تستخدم العلامات التجارية تحويل النص إلى فيديو لإنشاء عروض منتجات عالية الجودة أو محتوى لوسائل التواصل الاجتماعي من نصوص بسيطة. على سبيل المثال، يمكن للمسوق إنتاج فيديو لـ "سيارة رياضية تقود عبر مدينة متهالكة في أجواء سايبربانك" لاختبار مفهوم بصري دون تنظيم تصوير مادي مكلف. تتيح هذه القدرة إنشاء بيانات اصطناعية متنوعة يمكن استخدامها أيضاً لتدريب نماذج ذكاء اصطناعي أخرى.
  • تصور الفيلم المسبق: يستخدم المخرجون ومصممو الألعاب أدوات مثل Google's DeepMind Veo لـ رسم القصص المصورة. بدلاً من رسم لوحات ثابتة، يمكن للمبدعين إنشاء مقاطع فيديو أولية لتصور زوايا الكاميرا والإضاءة والإيقاع على الفور. هذا يسرع خط إنتاج الإبداع، مما يسمح بالتكرار السريع للسرديات المعقدة قبل الالتزام بالإنتاج النهائي.

Link to this sectionالتمييز بين التوليد والتحليل#

من الضروري التمييز بين توليد الفيديو وتحليل الفيديو. ينشئ تحويل النص إلى فيديو بكسلات جديدة من الصفر بناءً على مطالبة. في المقابل، يتضمن فهم الفيديو معالجة اللقطات الموجودة لاستخراج رؤى، مثل كشف الكائنات أو التعرف على الإجراءات.

بينما يعتمد تحويل النص إلى فيديو على نماذج توليدية، يعتمد تحليل الفيديو على نماذج تمييزية مثل النموذج المتطور YOLO26. يوضح مقتطف الكود أدناه الأخير—تحميل ملف فيديو (قد يكون مولداً بالذكاء الاصطناعي) وتحليله لتتبع الكائنات، مما يسلط الضوء على الفرق في سير العمل.

from ultralytics import YOLO

# Load the official YOLO26 model for analysis (not generation)
model = YOLO("yolo26n.pt")

# Process a video file to track objects across frames
# Ideally, this distinguishes real objects from generated artifacts
results = model.track(source="path/to/generated_video.mp4", show=True)

Link to this sectionالمفاهيم والتحديات ذات الصلة#

لفهم نطاق تحويل النص إلى فيديو بشكل كامل، من المفيد مقارنته بالمصطلحات ذات الصلة في مشهد الذكاء الاصطناعي:

  • تحويل النص إلى صورة: هذا يولد لقطة ثابتة. يضيف تحويل النص إلى فيديو بُعد الوقت، مما يتطلب من النموذج الحفاظ على تماسك الموضوع أثناء تحركه.
  • التعلم متعدد الوسائط: تحويل النص إلى فيديو متعدد الوسائط بطبيعته، حيث يترجم البيانات النصية إلى وسائط بصرية. هذا يشبه تحويل النص إلى كلام، الذي يترجم النص إلى موجات صوتية.
  • الرؤية الحاسوبية (CV): تشير عموماً إلى قدرة الآلة على "رؤية" الصور وفهمها. تحويل النص إلى فيديو هو العكس: الآلة "تتخيل" وتنشئ محتوى بصرياً.

على الرغم من التقدم السريع، لا تزال التحديات قائمة، بما في ذلك تكاليف الحوسبة العالية واحتمالية حدوث هلوسات حيث يتحدى الفيديو قوانين الفيزياء. هناك أيضاً مخاوف كبيرة تتعلق بـ أخلاقيات الذكاء الاصطناعي وانتشار التزييف العميق. ومع ذلك، مع تطور نماذج مثل Meta Movie Gen، يمكننا توقع دقة أعلى وتكامل أفضل في سير العمل المهني الذي تتم إدارته عبر منصة Ultralytics.

Explore solutions

Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الروبوتات

شغّل آلات أكثر ذكاءً باستخدام نماذج Ultralytics YOLO. يدفع الذكاء الاصطناعي للرؤية في الروبوتات الملاحة الذاتية، والإدراك، وتتبع الكائنات، والتحكم في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الخدمات اللوجستية

بسّط العمليات اللوجستية باستخدام نماذج Ultralytics YOLO. تُمكّن الرؤية بالذكاء الاصطناعي فحص الطرود، والفرز، وتتبع المركبات، ومراقبة السلامة في المستودعات في الوقت الفعلي.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التجزئة

أعد تصور تجارة التجزئة مع نماذج Ultralytics YOLO. تعزز الرؤية بالذكاء الاصطناعي تتبع المخزون، ومراقبة الأرفف، وإدارة الطوابير، ورؤى أكثر ذكاءً للعملاء.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في الرعاية الصحية

قم ببناء حلول الرعاية الصحية مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري في الرعاية الصحية على تعزيز سرعة التصوير الطبي، والتشخيص الأكثر ذكاءً، ومراقبة المرضى.

اعرف المزيد
Real-time AI that works with your team

الذكاء الاصطناعي في التصنيع

حسّن عمليات التصنيع باستخدام نماذج Ultralytics YOLO. تقود الرؤية بالذكاء الاصطناعي مراقبة الجودة، واكتشاف العيوب، والامتثال لمعدات الوقاية الشخصية (PPE)، وأتمتة خطوط التجميع.

اعرف المزيد
Real-time AI that works with your operation

الذكاء الاصطناعي في مجال السيارات

طبق رؤية الحاسوب في مجال السيارات مع نماذج Ultralytics YOLO. يعمل الذكاء الاصطناعي البصري على تعزيز السلامة على الطرق، ومساعدة السائق، وأتمتة المركبات من أجل طرق أكثر ذكاءً.

اعرف المزيد
Real-time AI tailored to your operation

الذكاء الاصطناعي في الزراعة

ادمج الذكاء الاصطناعي البصري في الزراعة الذكية باستخدام نماذج Ultralytics YOLO. عزز مراقبة المحاصيل، وتتبع الماشية، والزراعة الدقيقة للحصول على إنتاجية أعلى وأكثر ذكاءً.

اعرف المزيد

لنبنِ مستقبل الذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل تعلم الآلة