Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

زيادة البيانات

عزز نماذج تعلم الآلة الخاصة بك باستخدام زيادة البيانات. اكتشف تقنيات لزيادة الدقة وتقليل التجاوز وتحسين المتانة.

تعد زيادة البيانات أسلوبًا استراتيجيًا في التعلم الآلي (ML) تُستخدم في لتوسيع حجم وتنوع البيانات بشكل مصطنع من مجموعة بيانات التدريب دون الحاجة إلى جمع بيانات خام جديدة. من خلال تطبيق تحويلات مختلفة على عينات البيانات الموجودة، يمكن للمطورين إنشاء إصدارات واقعية من الصور أو النصوص أو الصوت. هذه العملية ضرورية لتقليل الإفراط في التركيبوهي مشكلة شائعة حيث يحفظ النموذج أمثلة التدريب بدلاً من تعلم أنماط قابلة للتعميم. في نهاية المطاف، تؤدي الزيادة الفعالة إلى زيادة دقة أعلى ويضمن أن النموذج يعمل بقوة عند تعرضه لبيانات غير مرئية في بيئات العالم الحقيقي.

التقنيات والأساليب الأساسية

في مجال الرؤية الحاسوبية (CV)، تتضمن الزيادة معالجة الصور المدخلة لمحاكاة ظروف مختلفة. تساعد هذه التحويلات أن يصبح النموذج ثابتًا للتغيرات في الاتجاه والإضاءة والحجم.

  • التحويلات الهندسية: هذه تعدل التخطيط المكاني للصورة. تتضمن العمليات الشائعة التدوير العشوائي، والتقليب الأفقي، والقص، والقياس. على سبيل المثال، استخدام التحويلات الهندسيةOpenCV يسمح للنموذج بالتعرّف على الجسم بغض النظر عما إذا كان مقلوبًا أو مائلًا.
  • التحويلات الضوئية: هذه تضبط قيم البكسل لتغيير المظهر المرئي دون تغيير الشكل الهندسي. ضبط السطوع، والتباين، والتباين، والتشبع، وإضافة ضوضاء غاوسي يساعد النموذج على التعامل مع ظروف الإضاءة المتغيرة.
  • المزج المتقدم: الخلط الحديث كشف الكائنات الحديثة الأطر الحديثة غالبًا ما تستخدم تقنيات معقدة مثل Mosaic و MixUp و CutMix. تدمج هذه الأساليب صورًا متعددة في واحدة، مما يشجع النموذج على تعلم العلاقات السياقية. يمكنك استكشاف كيفية تنفيذ ذلك عبر من خلال تكاملUltralytics Albumentations.

تطبيقات واقعية

لا غنى عن زيادة البيانات في الصناعات التي تندر فيها البيانات عالية الجودة أو يكون الحصول عليها مكلفًا.

  1. التصوير الطبي: في تحليل الصور الطبية، تحد قوانين الخصوصية وندرة حالات معينة من أحجام مجموعات البيانات. من خلال زيادة فحوصات الأشعة السينية أو التصوير بالرنين المغناطيسي مع بالتناوب والتشوهات المرنة، يمكن للباحثين تدريب نماذج قوية ل الكشف عن الأوراممما يضمن قدرة الذكاء الاصطناعي على تحديد الحالات الشاذة بغض النظر عن وضع المريض أو معايرة الجهاز.
  2. القيادة الذاتية: يجب أن تتنقل السيارات ذاتية القيادة في بيئات لا يمكن التنبؤ بها. من المستحيل جمع بيانات لكل حالة طقس محتملة أمر مستحيل. يستخدم المهندسون تقنية التعزيز لمحاكاة المطر أو الضباب أو الإضاءة المنخفضة على لقطات اليوم الصافي. هذا يهيئ المركبات ذاتية القيادة للتفاعل بأمان بأمان في الأحوال الجوية السيئة، مما يحسن بشكل كبير معايير السلامة التي وصفتها منظمات مثل NHTSA.

تطبيق التعزيز في Ultralytics YOLO

إن ultralytics تبسط المكتبة تطبيق التعزيزات مباشرةً داخل مكتبة تدريب النموذج خط الأنابيب. يمكنك ضبط المعلمات الفائقة للتحكم في شدة التحويلات واحتمالية حدوثها.

from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model with custom data augmentation parameters
# These arguments modify the training data on-the-fly
model.train(
    data="coco8.yaml",
    epochs=5,
    degrees=30.0,  # Apply random rotations between -30 and +30 degrees
    fliplr=0.5,  # 50% probability of flipping images horizontally
    mosaic=1.0,  # Use Mosaic augmentation (combining 4 images)
    mixup=0.1,  # Apply MixUp augmentation with 10% probability
)

التمييز بين المفاهيم ذات الصلة

من المهم التفريق بين زيادة البيانات واستراتيجيات البيانات المماثلة:

  • مقابل البيانات الاصطناعية: بينما تعدل التعزيز بيانات العالم الحقيقي الموجودة, البيانات الاصطناعية الاصطناعية بالكامل من الصفر باستخدام المحاكاة الحاسوبية أو الذكاء الاصطناعي التوليدي. تضيف التعزيزات تنوعًا إلى ما لديك؛ بينما تخلق البيانات الاصطناعية ما ليس لديك.
  • مقابل المعالجة المسبقة للبيانات: المعالجة المسبقة للبيانات تتضمن تنظيف البيانات وتنسيقها (على سبيل المثال، تغيير الحجم، والتطبيع) لجعلها مناسبة للنموذج. تحدث عملية التعزيز بعد المعالجة المسبقة وتركز على توسيع تنوع مجموعة البيانات بدلاً من تنسيقها.
  • مقابل التعلّم التحوّلي: التعلّم التحويلي يستفيد من المعرفة من نموذج مُدرَّب مسبقًا (على سبيل المثال، تم تدريبه على ImageNet) لحل مهمة جديدة. على الرغم من استخدامهما معًا في كثير من الأحيان، إلا أن تعلّم النقل يتعلق بأوزان النموذج، بينما تتعلق الزيادة بالبيانات المدخلة.

للتعمق أكثر في مكتبات التعزيز الحديثة، يمكن الاطلاع على وثائق البومنتات قائمة شاملة من التحويلات المتاحة المتوافقة مع PyTorch و YOLO11.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن