Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

شبكة توليدية خصومية (GAN)

اكتشف كيف تقوم الشبكات التنافسية التوليدية (GAN) بإنشاء بيانات اصطناعية واقعية. تعلم كيفية تدريب Ultralytics باستخدام مجموعات بيانات محسّنة بواسطة GAN من أجل الذكاء الاصطناعي البصري.

الشبكات التنافسية التوليدية (GANs) هي إطار عمل متطور في مجال الذكاء الاصطناعي (AI) مصمم لتوليد حالات بيانات جديدة تشبه بيانات التدريب الخاصة بك. تم تقديمها في ورقة بحثية رائدة من قبل إيان جودفيلو وزملاؤه في عام 2014، تعمل GANs على مبدأ فريد من نوعه يتمثل في التنافس بين شبكتين عصبيتين متميزتين . أصبحت هذه البنية حجر الزاوية في الذكاء الاصطناعي التوليدي الحديث، مما يتيح إنشاء صور واقعية، وتحسين الفيديو، وتوليف مجموعات بيانات تدريب متنوعة لمهام التعلم الآلي المعقدة .

الهندسة المضادة

تتضمن الآلية الأساسية لشبكة GAN نموذجين يتم تدريبهما في وقت واحد في لعبة محصلتها صفر، وغالبًا ما توصف باستخدام تشبيه المزور والمحقق.

  • المولد: تعمل هذه الشبكة كـ "مزور". فهي تأخذ ضوضاء عشوائية (متجه كامن) كمدخلات وتحاول إنتاج بيانات - مثل صورة - تبدو أصلية. هدفها الأساسي هو خداع التمييز ليصدق أن الناتج المولد حقيقي. هذه العملية أساسية لإنشاء بيانات اصطناعية عالية الجودة .
  • التمييز: تعمل هذه الشبكة كـ "محقق"، وتقوم بتقييم المدخلات للتمييز بين العينات الفعلية من بيانات التدريب والعينات المزيفة التي أنتجها المولد. وهي تعمل كمصنف ثنائي قياسي، وتنتج احتمالية أن تكون المدخلات حقيقية.

أثناء عملية التدريب، يقلل المولد من احتمالية قيام المميز بإنشاء تصنيف صحيح ، بينما يزيد المميز من احتمالية حدوث ذلك. تستمر هذه الحلقة التنافسية حتى يصل النظام إلى توازن ناش، وهي حالة ينتج فيها المولد بيانات واقعية لدرجة أن المميز لم يعد قادراً على تمييزها عن الأمثلة الواقعية.

تطبيقات واقعية في مجال الذكاء الاصطناعي للرؤية

تجاوزت شبكات GAN النظرية الأكاديمية لحل المشكلات العملية في مختلف الصناعات، لا سيما في مجال الرؤية الحاسوبية.

  1. زيادة البيانات لتدريب النماذج: في السيناريوهات التي تكون فيها البيانات نادرة أو حساسة من حيث الخصوصية، مثل تحليل الصور الطبية، تُستخدم شبكات GAN لتوليد أمثلة اصطناعية واقعية. على سبيل المثال، يتيح إنشاء فحوصات MRI اصطناعية للباحثين تدريب نماذج تشخيصية قوية دون المساس بخصوصية المرضى. هذه التقنية مهمة أيضًا للمركبات ذاتية القيادة، حيث يمكن لشبكات GAN محاكاة ظروف جوية نادرة أو سيناريوهات مرورية لتحسين السلامة.
  2. الدقة الفائقة وتحسين الصورة: تتميز شبكات GAN بفعالية عالية في الدقة الفائقة، وهي عملية تحسين الصور منخفضة الدقة إلى دقة عالية مع ابتكار تفاصيل معقولة. وتستخدم هذه التقنية على نطاق واسع في ترميم الأرشيفات التاريخية، وتحسين صور الأقمار الصناعية من أجل رسم الخرائط العالمية، وتحسين جودة بث الفيديو.
  3. نقل الأسلوب: يتيح هذا التطبيق تطبيق الأسلوب الجمالي لصورة ما على محتوى صورة أخرى. تتيح أدوات مثل CycleGAN إجراء تحويلات مثل تحويل الصور النهارية إلى مشاهد ليلية أو تحويل الرسومات إلى نماذج منتجات واقعية، مما يؤدي إلى تبسيط سير العمل في مجال الذكاء الاصطناعي في تجارة الأزياء بالتجزئة.

الفرق بين شبكات GAN ونماذج الانتشار

على الرغم من أن كلاهما تقنيات توليدية، من المهم التمييز بين شبكات GAN ونماذج الانتشار مثل تلك المستخدمة في Stable Diffusion.

  • سرعة الاستدلال: عادةً ما تولد شبكات GAN البيانات في مسار واحد للأمام، مما يجعلها أسرع بكثير في الاستدلال في الوقت الفعلي.
  • استقرار التدريب: تعمل نماذج الانتشار عن طريق إزالة الضوضاء من الصورة بشكل متكرر، مما يؤدي عمومًا إلى تدريب أكثر استقرارًا وتغطية أعلى للوضع (التنوع). في المقابل، يمكن أن تعاني شبكات GAN من "انهيار الوضع"، حيث ينتج المولد مجموعة محدودة من المخرجات، على الرغم من أن تقنيات مثل Wasserstein GANs (WGAN) تساعد في التخفيف من ذلك.

دمج البيانات التي تم إنشاؤها بواسطة GAN مع YOLO

من الحالات الاستخدامية القوية لشبكات GAN إنشاء مجموعات بيانات اصطناعية لتدريب نماذج الكشف عن الكائنات مثل YOLO26. إذا لم تكن لديك صور كافية من العالم الحقيقي لعيب أو كائن معين ، يمكن لشبكة GAN إنشاء آلاف الاختلافات المصنفة. يمكنك بعد ذلك إدارة مجموعات البيانات هذه وتدريب نموذجك باستخدام Ultralytics .

يوضح المثال التالي كيفية تحميل نموذج YOLO26 للتدريب على مجموعة بيانات، والتي يمكن أن تتضمن بسلاسة صورًا اصطناعية تم إنشاؤها بواسطة GAN لتعزيز الأداء:

from ultralytics import YOLO

# Load the YOLO26 model (Latest stable Ultralytics model)
model = YOLO("yolo26n.pt")

# Train the model on a dataset configuration file
# The dataset path defined in 'coco8.yaml' can contain both real and GAN-generated images
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# Verify the model performance on validation data
metrics = model.val()

التحديات والاعتبارات

على الرغم من قدراتها، يتطلب تدريب شبكات GAN ضبطًا دقيقًا للمعلمات الفائقة. قد تحدث مشكلات مثل مشكلة التدرج المتلاشي إذا تعلم التمييز بسرعة كبيرة، دون تقديم ملاحظات مفيدة للمولد. علاوة على ذلك، مع زيادة قدرة شبكات GAN على إنشاء محتوى مزيف، تركز الصناعة بشكل متزايد على أخلاقيات الذكاء الاصطناعي وتطوير طرق detect المحتوى detect .

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن