اكتشف كيف تعمل زيادة البيانات على تحسين متانة النموذج وتقليل الإفراط في الملاءمة. تعرف على التقنيات الرئيسية لتحسين أداء Ultralytics للرؤية الحاسوبية.
زيادة البيانات هي تقنية مهمة في التعلم الآلي والرؤية الحاسوبية تُستخدم لزيادة حجم وتنوع مجموعة بيانات التدريب بشكل مصطنع عن طريق إنشاء نسخ معدلة من البيانات الموجودة. بدلاً من جمع و تصنيف بيانات جديدة تمامًا - وهو ما قد يستغرق وقتًا طويلاً ويكون مكلفًا - يطبق التوسيع تحويلات مختلفة على العينات الأصلية. تساعد هذه التعديلات نماذج التعلم الآلي على تعلم التعرف على الأنماط بشكل أكثر قوة، مما يضمن أداءها الجيد حتى عند مواجهة اختلافات في بيئات العالم الحقيقي. من خلال تعريض النماذج لمجموعة واسعة من السيناريوهات أثناء التدريب، يمكن للمطورين تقليل التكيف المفرط وتحسين التعميم بشكل فعال.
في مجال الرؤية الحاسوبية، غالبًا ما تواجه النماذج صعوبة عند عرض صور تختلف قليلاً عن بيانات التدريب الخاصة بها. يمكن أن تؤدي الاختلافات في الإضاءة أو الاتجاه أو فوضى الخلفية إلى إرباك النموذج الذي لم يرَ تنوعًا كافيًا. يعالج تكبير البيانات هذا الأمر عن طريق محاكاة هذه الاختلافات برمجيًا. على سبيل المثال، يمكن تدوير صورة قطة أو قلبها أو تشويشها قليلاً لتعليم النموذج أن الموضوع يظل "قطة" بغض النظر عن هذه التغييرات.
هذه العملية جزء لا يتجزأ من نجاح البنى الحديثة مثل Ultralytics ، التي تعتمد على مجموعات بيانات غنية ومتنوعة لتحقيق دقة عالية في مهام مثل الكشف عن الأشياء وتقسيم الصور. من خلال توليف أمثلة تدريب جديدة ، تسمح الزيادة للنماذج بتعلم السمات الثابتة — وهي الخصائص التي لا تتغير على الرغم من التغييرات في المدخلات.
يشمل توسيع البيانات مجموعة واسعة من تقنيات التحويل، بدءًا من التعديلات الهندسية البسيطة وصولًا إلى الأساليب التوليدية المعقدة:
يمتد التأثير العملي لزيادة البيانات إلى العديد من الصناعات التي تواجه تحديًا يتمثل في ندرة البيانات أو تقلبها الشديد .
في تطوير المركبات ذاتية القيادة، يكاد يكون من المستحيل جمع بيانات عن كل حالة جوية أو سيناريو إضاءة ممكن. يستخدم المهندسون زيادة البيانات لمحاكاة المطر والضباب والثلج والوهج على صور الطقس الصافي. وهذا يضمن أن نظام الإدراك يمكنه detect وإشارات المرور والمركبات الأخرى بشكل موثوق بغض النظر عن العوامل البيئية، مما يعزز السلامة والموثوقية.
غالبًا ما يعاني تحليل الصور الطبية من محدودية مجموعات البيانات بسبب مخاوف تتعلق بالخصوصية وندرة بعض الحالات. تتيح عملية التوسيع للباحثين توسيع مجموعات البيانات الصغيرة من الأشعة السينية أو فحوصات التصوير بالرنين المغناطيسي من خلال تطبيق تشوهات مرنة أو دورانات أو تغيرات في الشدة. ويساعد ذلك في تدريب نماذج تشخيصية قوية قادرة على تحديد الأورام أو الكسور بحساسية عالية، حتى عندما تختلف وضعية المريض أو جودة الفحص.
من المهم التمييز بين زيادة البيانات والبيانات الاصطناعية. في حين أن كلاهما يهدف إلى زيادة حجم مجموعة البيانات، فإن البيانات الاصطناعية يتم إنشاؤها بشكل مصطنع من الصفر (غالبًا باستخدام محركات العرض ثلاثي الأبعاد أو المحاكاة)، بينما تعمل زيادة البيانات على تعديل البيانات الحقيقية الموجودة. بالإضافة إلى ذلك، تتضمن المعالجة المسبقة للبيانات تنظيف البيانات وتنسيقها (على سبيل المثال، تغيير الحجم، والتطبيع) لجعلها مناسبة للنموذج، ولكن على عكس الزيادة، فإنها لا تؤدي بالضرورة إلى زيادة عدد عينات التدريب.
تدمج الأطر الحديثة التعزيز مباشرة في مسار التدريب. يوضح المثال أدناه كيفية
تطبيق التعزيزات مثل التقليب والتحجيم أثناء تدريب نموذج YOLO26 باستخدام
ultralytics الحزمة.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)
من خلال ضبط هذه المعلمات الفائقة، يمكن للمطورين تكييف استراتيجية التعزيز وفقًا للاحتياجات المحددة لمجموعة البيانات والتطبيق الخاصة بهم ، والاستفادة من مرونة Ultralytics لتطوير نماذج فعالة.