مسرد المصطلحات

نماذج الانتشار

اكتشف كيف تُحدث نماذج الانتشار ثورة في الذكاء الاصطناعي التوليدي من خلال إنشاء صور ومقاطع فيديو وبيانات واقعية بتفاصيل وثبات لا مثيل لهما.

نماذج الانتشار هي فئة من النماذج التوليدية التي أصبحت حجر الزاوية في الذكاء الاصطناعي التوليدي الحديث. وهي مصممة لإنشاء بيانات جديدة، مثل الصور أو الأصوات، مشابهة للبيانات التي تم تدريبها عليها. الفكرة الأساسية مستوحاة من الديناميكا الحرارية. يتعلم النموذج عكس عملية إضافة الضوضاء تدريجياً إلى صورة ما حتى تصبح ثابتة تماماً. من خلال تعلم عملية "إزالة الضوضاء" هذه، يمكن للنموذج أن يبدأ بضوضاء عشوائية ويصقلها تدريجيًا إلى عينة متماسكة وعالية الجودة. تُعد عملية التنقية التدريجية هذه مفتاحاً لقدرتها على توليد مخرجات واقعية ومفصلة للغاية.

كيف تعمل نماذج الانتشار؟

تتضمن العملية الكامنة وراء نماذج الانتشار مرحلتين رئيسيتين:

  1. العملية الأمامية (الانتشار): في هذه المرحلة، يتم تشويه الصورة الواضحة بشكل منهجي عن طريق إضافة كمية صغيرة من الضوضاء الغاوسية على عدة خطوات. يستمر ذلك حتى لا يمكن تمييز الصورة عن الضوضاء النقية. هذه العملية الأمامية ثابتة ولا تتضمن أي تعلم؛ فهي ببساطة توفر هدفًا للنموذج ليتعلم النموذج عكسه.
  2. العملية العكسية (إزالة الضوضاء): هذا هو المكان الذي يحدث فيه التعلم. يتم تدريب الشبكة العصبية على أخذ صورة مشوشة من العملية الأمامية والتنبؤ بالضوضاء التي تمت إضافتها في الخطوة السابقة. من خلال طرح هذه الضوضاء المتوقعة بشكل متكرر، يمكن للنموذج أن يبدأ بصورة عشوائية تمامًا (ضوضاء نقية) وتحويلها تدريجيًا إلى صورة نظيفة وواضحة. عملية إزالة التشويش المكتسبة هذه هي ما يسمح للنموذج بتوليد بيانات جديدة من الصفر. وقد أرست الورقة البحثية التأسيسية"نماذج تقليل التشويش الاحتمالية المنتشرة،" الكثير من الأسس لهذا النهج.

نماذج الانتشار مقابل النماذج التوليدية الأخرى

تختلف نماذج الانتشار اختلافًا كبيرًا عن النُهج التوليدية الشائعة الأخرى مثل شبكات الخصومة التوليدية (GANs).

  • استقرار التدريب: تتمتع نماذج الانتشار عادةً بعملية تدريب أكثر استقرارًا مقارنةً بشبكات GAN. تنطوي شبكات GAN على لعبة خصومة معقدة بين المولد والمميز، والتي قد يكون من الصعب أحيانًا تحقيق التوازن بينها وقد تفشل في التقارب.
  • جودة العينة وتنوعها: في حين أن كلاهما يمكن أن ينتج نتائج عالية الجودة، إلا أن نماذج الانتشار غالبًا ما تتفوق في توليد صور شديدة التنوع وواقعية للغاية، وأحيانًا تتفوق على شبكات التخزين العامة في بعض المعايير. ومع ذلك، يمكن أن تأتي هذه الجودة على حساب وقت استجابة أعلى في الاستدلال.
  • سرعة الاستدلال: عادةً ما تكون نماذج الانتشار أبطأ في توليد العينات لأنها تتطلب العديد من خطوات إزالة التشويش التكرارية. في المقابل، يمكن لشبكات GANs توليد عينة في مسار أمامي واحد. ومع ذلك، تعمل الأبحاث والتقنيات النشطة مثل تقطير المعرفة على سد هذه الفجوة في السرعة بسرعة.

التطبيقات الواقعية

تعمل نماذج الانتشار على تعزيز موجة جديدة من الإبداع والابتكار في مختلف المجالات:

  • توليد صور عالية الدقة: هذا هو التطبيق الأكثر شهرة. يمكن للنماذج التي طورتها شركات مثل Stability AI و OpenAI إنشاء صور واقعية وفنية بشكل مذهل من مطالبات نصية بسيطة. ومن أبرز الأمثلة البارزة على ذلك Stable Diffusion، و DALL-E 3، و Midjourney، و Imagen من Google. لقد أحدثت هذه الأدوات تحولاً في الفن الرقمي وإنشاء المحتوى.
  • تحرير الصور ورسمها: ليست فقط لإنشاء الصور من الصفر. يمكن لنماذج النشر تعديل الصور الموجودة بذكاء بناءً على التعليمات، مثل إضافة عناصر أو إزالتها أو تغيير الأنماط الفنية أو ملء الأجزاء المفقودة من الصورة (الرسم غير المباشر). تستفيد أدوات مثل Adobe Firefly من هذه الإمكانيات.
  • توليف الصوت والفيديو: يتم تطبيق مبادئ الانتشار أيضًا على أنواع البيانات الأخرى. يمكن لنماذج مثل AudioLDM توليد كلام وموسيقى ومؤثرات صوتية واقعية، بينما نماذج مثل Sora من OpenAI تتخطى حدود توليد النصوص إلى فيديو.
  • تعزيز البيانات: في الرؤية الحاسوبية، يمكن استخدام نماذج الانتشار لتوليد بيانات تدريب اصطناعية. وهذا مفيد بشكل خاص لتحسين متانة النماذج مثل Ultralytics YOLO لمهام مثل اكتشاف الأجسام أو تجزئة الصور، خاصةً عندما تكون بيانات العالم الحقيقي نادرة.

الأدوات والتطوير

يتضمن تطوير نماذج الانتشار واستخدامها عادةً أطر عمل للتعلم الآلي مثل PyTorch و TensorFlow. ولتسهيل عملية التطوير، تقدم مكتبات مثل مكتبة Hugging Face Diffusers نماذج وأدوات مدربة مسبقًا. وبينما تركز هذه الأدوات على النموذج التوليدي نفسه، يمكن أن تساعد منصات مثل Ultralytics HUB في إدارة سير العمل الأوسع، بما في ذلك إدارة مجموعة البيانات ونشرها، مما يكمل تطوير حلول الذكاء الاصطناعي الشاملة. مع انتشار هذه النماذج على نطاق واسع، من الضروري مراعاة أخلاقيات الذكاء الاصطناعي ومعالجة التحديات مثل التحيز الخوارزمي.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون ونمو مع المبتكرين العالميين

انضم الآن
تم نسخ الرابط إلى الحافظة