Data Augmentation
استكشف كيف يحسن تعزيز البيانات (data augmentation) متانة النموذج ويقلل الإفراط في التجهيز. تعلم تقنيات رئيسية لتعزيز أداء Ultralytics YOLO26 لرؤية الكمبيوتر.
تعد تقنية تعزيز البيانات أسلوباً بالغ الأهمية في تعلم الآلة والرؤية الحاسوبية، وتُستخدم لزيادة حجم وتنوع مجموعة بيانات التدريب بشكل اصطناعي من خلال إنشاء نسخ معدلة من البيانات الموجودة. وبدلاً من جمع وتصنيف بيانات جديدة تماماً - وهو أمر قد يكون مكلفاً ويستغرق وقتاً طويلاً - يقوم التعزيز بتطبيق تحويلات متنوعة على العينات الأصلية. تساعد هذه التعديلات نماذج تعلم الآلة على تعلم الأنماط بشكل أكثر قوة، مما يضمن أداءً جيداً حتى عند مواجهة تباينات في بيئات العالم الحقيقي. ومن خلال تعريض النماذج لمجموعة أوسع من السيناريوهات أثناء التدريب، يمكن للمطورين تقليل الإفراط في التخصيص بفعالية وتحسين التعميم.
Link to this sectionالأهمية في الذكاء الاصطناعي الحديث#
في مجال الرؤية الحاسوبية، غالباً ما تواجه النماذج صعوبة عند عرض صور تختلف قليلاً عن بيانات التدريب الخاصة بها. يمكن أن تؤدي التباينات في الإضاءة أو الاتجاه أو تداخل الخلفية إلى إرباك نموذج لم يرَ تنوعاً كافياً. يعالج تعزيز البيانات هذا الأمر من خلال محاكاة هذه التباينات برمجياً. على سبيل المثال، قد يتم تدوير صورة قطة أو قلبها أو جعلها ضبابية قليلاً لتعليم النموذج أن الموضوع يظل "قطة" بغض النظر عن هذه التغييرات.
تعد هذه العملية جزءاً لا يتجزأ من نجاح المعماريات الحديثة مثل Ultralytics YOLO26، التي تعتمد على مجموعات بيانات غنية ومتنوعة لتحقيق دقة عالية في مهام مثل اكتشاف الكائنات وتجزئة الصور. ومن خلال توليف أمثلة تدريب جديدة، يتيح التعزيز للنماذج تعلم سمات ثابتة - وهي الخصائص التي لا تتغير رغم التعديلات في المدخلات.
Link to this sectionالتقنيات والأساليب الشائعة#
يشتمل تعزيز البيانات على مجموعة واسعة من تقنيات التحويل، بدءاً من التعديلات الهندسية البسيطة وصولاً إلى الأساليب التوليدية المعقدة:
- التحويلات الهندسية: تشمل عمليات مثل التدوير، والتحجيم، والقلب، والقص، والترجمة (الإزاحة) للصور. تمثل هذه التغييرات في زاوية رؤية الكاميرا أو موضع الكائن.
- تعديلات مساحة اللون: يساعد تعديل السطوع والتباين والتشبع ودرجة اللون النماذج على التعامل مع ظروف الإضاءة المختلفة أو مستشعرات الكاميرا.
- حقن الضوضاء: يمكن أن تؤدي إضافة ضوضاء عشوائية (مثل ضوضاء غاوس) إلى جعل النماذج أكثر مرونة في التعامل مع بيانات الإدخال المحببة أو منخفضة الجودة.
- دمج الصور: تجمع تقنيات مثل MixUp أو Mosaic (الشائعة في تدريب YOLO) صوراً متعددة في عينة تدريب واحدة، مما يجبر النموذج على تعلم السياق وعلاقات الكائنات بشكل أكثر فعالية.
- الأساليب التوليدية: تستخدم الأساليب المتقدمة الذكاء الاصطناعي التوليدي أو نماذج الانتشار لإنشاء عينات تدريب اصطناعية جديدة تماماً تحاكي خصائص مجموعة البيانات الأصلية.
Link to this sectionتطبيقات العالم الحقيقي#
يمتد التأثير العملي لتعزيز البيانات ليشمل العديد من الصناعات التي يمثل فيها ندرة البيانات أو التباين العالي تحدياً.
Link to this sectionالقيادة الذاتية#
في تطوير المركبات ذاتية القيادة، يعد جمع البيانات لكل حالة طقس ممكنة أو سيناريو إضاءة أمراً شبه مستحيل. يستخدم المهندسون تعزيز البيانات لمحاكاة المطر أو الضباب أو الثلج أو الوهج على صور الطقس الصافي. يضمن هذا أن نظام الإدراك يمكنه اكتشاف المشاة وإشارات المرور والمركبات الأخرى بشكل موثوق بغض النظر عن العوامل البيئية، مما يعزز السلامة والموثوقية.
Link to this sectionالتصوير الطبي#
غالباً ما يعاني تحليل الصور الطبية من محدودية مجموعات البيانات بسبب مخاوف الخصوصية وندرة بعض الحالات. يتيح التعزيز للباحثين توسيع مجموعات البيانات الصغيرة للأشعة السينية أو فحوصات الرنين المغناطيسي من خلال تطبيق تشوهات مرنة أو تدويرات أو تحولات في الكثافة. يساعد هذا في تدريب نماذج تشخيصية قوية قادرة على تحديد الأورام أو الكسور بحساسية عالية، حتى عندما يختلف وضع المريض أو جودة الفحص.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
من المهم التمييز بين تعزيز البيانات والبيانات الاصطناعية. بينما يهدف كلاهما إلى زيادة حجم مجموعة البيانات، يتم إنشاء البيانات الاصطناعية بشكل اصطناعي من الصفر (غالباً باستخدام محركات التصيير ثلاثي الأبعاد أو المحاكاة)، في حين يقوم تعزيز البيانات بتعديل البيانات الحقيقية الموجودة. بالإضافة إلى ذلك، يتضمن معالجة البيانات الأولية تنظيف البيانات وتنسيقها (مثل تغيير الحجم والتطبيع) لجعلها مناسبة للنموذج، ولكن على عكس التعزيز، فإنه لا يزيد بالضرورة من عدد عينات التدريب.
Link to this sectionتنفيذ التعزيز باستخدام Ultralytics#
تدمج الأطر الحديثة التعزيز مباشرة في خط أنابيب التدريب. يوضح المثال أدناه كيفية تطبيق تعزيزات مثل القلب والتحجيم أثناء تدريب نموذج YOLO26 باستخدام حزمة ultralytics.
from ultralytics import YOLO
# Load the YOLO26 model
model = YOLO("yolo26n.pt")
# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)من خلال ضبط هذه المعاملات الفائقة، يمكن للمطورين تصميم استراتيجية التعزيز لتناسب الاحتياجات المحددة لمجموعة بياناتهم وتطبيقاتهم، والاستفادة من مرونة Ultralytics Platform لتطوير النماذج بكفاءة.






