يولو فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

نماذج الانتشار

اكتشف كيف تُحدث نماذج الانتشار ثورة في الذكاء الاصطناعي التوليدي من خلال إنشاء صور ومقاطع فيديو وبيانات واقعية بتفاصيل واستقرار لا مثيل لهما.

نماذج الانتشار هي فئة من النماذج التوليدية التي أصبحت حجر الزاوية في الذكاء الاصطناعي التوليدي الحديث. وهي مصممة لإنشاء بيانات جديدة، مثل الصور أو الأصوات، المشابهة للبيانات التي تم تدريبها عليها. الفكرة الأساسية مستوحاة من الديناميكا الحرارية. يتعلم النموذج عكس عملية إضافة الضوضاء تدريجيًا إلى الصورة حتى تصبح ثابتة تمامًا. من خلال تعلم عملية "إزالة الضوضاء" هذه، يمكن للنموذج أن يبدأ بضوضاء عشوائية وتحسينها تدريجيًا إلى عينة متماسكة وعالية الجودة. عملية التحسين التدريجي هذه هي المفتاح لقدرتها على إنشاء مخرجات واقعية وعالية التفاصيل.

كيف تعمل نماذج الانتشار؟

تتضمن العملية الكامنة وراء نماذج الانتشار مرحلتين رئيسيتين:

  1. العملية الأمامية (الانتشار): في هذه المرحلة، يتم تقليل وضوح الصورة الواضحة بشكل منهجي عن طريق إضافة كمية صغيرة من الضوضاء الغاوسية على مدى خطوات عديدة. يستمر هذا حتى لا يمكن تمييز الصورة عن الضوضاء النقية. هذه العملية الأمامية ثابتة ولا تتضمن أي تعلم؛ إنها ببساطة توفر هدفًا للنموذج ليتعلم عكسه.
  2. العملية العكسية (إزالة التشويش): هنا يحدث التعلم. يتم تدريب شبكة عصبية لأخذ صورة مشوشة من العملية الأمامية والتنبؤ بالتشويش الذي تمت إضافته في الخطوة السابقة. من خلال طرح هذا التشويش المتوقع بشكل متكرر، يمكن للنموذج أن يبدأ بصورة عشوائية تمامًا (تشويش خالص) وتحويلها تدريجيًا إلى صورة نظيفة وواضحة. عملية إزالة التشويش المتعلمة هذه هي التي تسمح للنموذج بإنشاء بيانات جديدة من البداية. وضعت الورقة التأسيسية "نماذج انتشار احتمالية إزالة التشويش" الكثير من الأساس لهذا النهج.

نماذج الانتشار مقابل النماذج التوليدية الأخرى

تختلف نماذج الانتشار اختلافًا كبيرًا عن الأساليب التوليدية الشائعة الأخرى مثل الشبكات الخصومية التوليدية (GANs).

  • استقرار التدريب: تتمتع نماذج الانتشار (Diffusion models) عادةً بعملية تدريب أكثر استقرارًا مقارنة بشبكات الخصومة التوليدية (GANs). تتضمن شبكات الخصومة التوليدية (GANs) لعبة خصومة معقدة بين مولد ومميز، والتي قد يكون من الصعب في بعض الأحيان تحقيق التوازن بينها وقد تفشل في التقارب.
  • جودة العينة وتنوعها: في حين أن كلاهما يمكن أن ينتج نتائج عالية الجودة، غالبًا ما تتفوق نماذج الانتشار في إنشاء صور متنوعة وواقعية للغاية، وأحيانًا تتفوق على الشبكات التوليدية الخصومية (GANs) في بعض المعايير. ومع ذلك، قد تأتي هذه الجودة على حساب ارتفاع زمن الوصول للاستدلال.
  • سرعة الاستدلال: تقليديًا، تكون نماذج الانتشار أبطأ في إنشاء العينات لأنها تتطلب العديد من خطوات إزالة الضوضاء التكرارية. في المقابل، يمكن لـ GANs إنشاء عينة في تمريرة واحدة للأمام. ومع ذلك، فإن البحث النشط والتقنيات مثل تقطير المعرفة تعمل على تضييق فجوة السرعة هذه بسرعة.

تطبيقات واقعية

تعمل نماذج الانتشار على تشغيل موجة جديدة من الإبداع والابتكار في مختلف المجالات:

  • إنشاء صور عالية الدقة: هذا هو التطبيق الأكثر شهرة. يمكن للنماذج التي طورتها شركات مثل Stability AI و OpenAI إنشاء صور واقعية وفنية بشكل مذهل من مطالبات نصية بسيطة. تشمل الأمثلة البارزة Stable Diffusion و DALL-E 3 و Midjourney و Imagen من Google. لقد حولت هذه الأدوات الفن الرقمي وإنشاء المحتوى.
  • تحرير الصور والترميم: إنها ليست فقط لإنشاء صور من الصفر. يمكن لنماذج الانتشار تعديل الصور الموجودة بذكاء بناءً على التعليمات، مثل إضافة أو إزالة الكائنات أو تغيير الأنماط الفنية أو ملء الأجزاء المفقودة من الصورة (الترميم). تستفيد أدوات مثل Adobe Firefly من هذه الإمكانات.
  • تركيب الصوت والفيديو: يتم تطبيق مبادئ الانتشار أيضًا على أنواع البيانات الأخرى. يمكن لنماذج مثل AudioLDM إنشاء كلام وموسيقى ومؤثرات صوتية واقعية، بينما تدفع نماذج مثل Sora من OpenAI حدود إنشاء النص إلى الفيديو.
  • زيادة البيانات: في رؤية الكمبيوتر، يمكن استخدام نماذج الانتشار لإنشاء بيانات تدريب اصطناعية. هذا مفيد بشكل خاص لتحسين قوة النماذج مثل Ultralytics YOLO لمهام مثل اكتشاف الكائنات أو تجزئة الصور، خاصة عندما تكون بيانات العالم الحقيقي نادرة.

الأدوات والتطوير

يتضمن تطوير واستخدام نماذج الانتشار عادةً أطر تعلم الآلة مثل PyTorch و TensorFlow. لتسهيل التطوير، توفر مكتبات مثل مكتبة Hugging Face Diffusers نماذج وأدوات مُدرَّبة مسبقًا. في حين أن هذه الأدوات تركز على النموذج التوليدي نفسه، يمكن لمنصات مثل Ultralytics HUB المساعدة في إدارة سير العمل الأوسع، بما في ذلك إدارة مجموعة البيانات ونشرها، مما يكمل تطوير حلول الذكاء الاصطناعي الشاملة. مع ازدياد انتشار هذه النماذج، من الضروري مراعاة أخلاقيات الذكاء الاصطناعي ومعالجة تحديات مثل التحيز الخوارزمي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة