CutMix
اكتشف كيف تمنع تقنية تعزيز البيانات CutMix الإفراط في التخصيص. تعلم كيفية تطبيقها بسهولة لتدريب نماذج Ultralytics YOLO26 قوية.
تعد تقنية CutMix تقنية متقدمة لـ تعزيز البيانات تُستخدم لتدريب نماذج رؤية حاسوبية قوية من خلال قص جزء مستطيل من صورة ولصقه على صورة مستهدفة. وعلى عكس تقنيات التعزيز الأبسط التي تعدل السطوع أو الدوران، تغير CutMix التكوين الأساسي لعينة التدريب. عند استبدال البكسلات، يتم خلط تسميات الحقيقة الأرضية المقابلة أيضًا بشكل متناسب مع مساحة الجزء المقصوص. يساعد هذا الشبكات العصبية الاصطناعية على تعلم تحديد الكائنات من مشاهد جزئية، مما يجبر النموذج على الاعتماد على ميزات متعددة بدلاً من التركيز فقط على الأجزاء الأكثر تمييزًا في الكائن. تم تقديم هذه التقنية لأول مرة في ورقة بحثية أكاديمية عام 2019، وأصبحت عملية قياسية في أطر عمل التعلم العميق لمنع فرط التخصيص وتحسين التعميم عبر مجموعات البيانات الكبيرة.
Link to this sectionكيفية عمل التقنية#
أثناء تدريب النموذج، تحدد الخوارزمية عشوائيًا إحداثيات مركز وحجم مربع لاستخراج منطقة من صورة ثانوية. يتم بعد ذلك تراكب هذا الجزء مباشرة على صورة أساسية ضمن الدفعة النشطة. إذا كانت الصورة الأساسية تحتوي على كلب وكانت الثانوية تحتوي على قطة، فستحتوي الصورة النهائية على جزء من القطة يحل محل جزء من الكلب. يتم تحديث تسميات التصنيف باستخدام الاستكمال الخطي بناءً على مساحة الجزء الدقيقة - على سبيل المثال، الحصول على تسمية بنسبة 0.7 كلب و0.3 قطة. في مهام اكتشاف الكائنات، يتم الحفاظ على مربعات الإحاطة التي تحتفظ بنسبة مئوية معينة على الأقل (غالبًا 10%) من مساحتها الأصلية داخل المنطقة الملصقة. يتم دعم هذه التقنية محليًا كمعامل تدريب cutmix في Ultralytics YOLO، مما يسمح للممارسين بتحديد احتمالية هذا التحويل بسهولة.
Link to this sectionالتمييز بين MixUp وCutout#
ترتبط CutMix ارتباطًا وثيقًا بتقنيتين أخريين بارزتين لتعزيز البيانات، لكنها تعالج قيودهما المحددة:
- تعزيز MixUp: يمزج MixUp صورتين عالميًا عن طريق حساب متوسط مرجح لقيم البكسلات الخاصة بهما. على الرغم من فعاليته، فإنه غالبًا ما يؤدي إلى صور وهمية غير طبيعية وشبه شفافة يمكن أن تربك النماذج عن طريق تعطيل الارتباط المكاني المحلي. في المقابل، تحافظ CutMix على كثافة البكسلات الأصلية داخل المناطق المقصوصة، وهو ما قام الباحثون بتحسينه بشكل أكبر في مناهج مثل Attentive CutMix.
- تعزيز Cutout: تسقط تقنية Cutout المعلومات عن طريق إخفاء منطقة مستطيلة عشوائية ببكسلات سوداء أو بمتوسط مجموعة البيانات. بينما تشجع النموذج على النظر إلى الكائن بأكمله، فإنها تهدر موترات تدريب قيمة. تستبدل CutMix تلك المساحة المفقودة بأجزاء معلوماتية من تصنيف الصور من صور أخرى، مما يزيد من كفاءة التعلم الإجمالية.
Link to this sectionتطبيقات العالم الحقيقي#
من خلال تدريب النماذج على التعرف على الكائنات المحجوبة بشدة، تعزز CutMix أداء التعلم الآلي بشكل كبير عبر صناعات متنوعة.
- الذكاء الاصطناعي للسيارات والقيادة الذاتية: في السيارات ذاتية القيادة، تعلم النظام تحديد المشاة أو المركبات حتى عندما يكونون محجوبين جزئيًا بواسطة لافتات الشوارع، مما يعزز السلامة في البيئات المزدحمة.
- التشخيص الطبي وتجزئة الأعضاء: في الرعاية الصحية، تُستخدم هذه الطريقة على نطاق واسع لـ تجزئة الأعضاء والأورام، مما يسمح للنماذج بالتعرف على حدود الأنسجة المعقدة حتى عندما تتداخل الهياكل التشريحية.
- الاستشعار عن بعد لصور الأقمار الصناعية: تحافظ هذه الاستراتيجية على الفئات الكثيفة والمتداخلة مثل المباني والغطاء النباتي من المناظر الجوية. يتم إجراء أبحاث نشطة على اختلافات متقدمة لتحسين التعرف على الفئات طويلة الذيل على البيانات غير المتوازنة بشكل كبير.
Link to this sectionالتنفيذ العملي#
دمج هذا التعزيز في خط أنابيب الذكاء الاصطناعي أمر مباشر. تدعمه معظم المكتبات عالية المستوى محليًا، مثل PyTorch Transforms و Keras Preprocessing Layers.
عند تدريب نموذج مثل YOLO26، يتطلب تهيئة هذا التعزيز تعديل معامل واحد فقط. وهذا يتعامل تلقائيًا مع كل من تقطيع الصور ومنطق قص مربعات الإحاطة المعقد.
from ultralytics import YOLO
# Initialize the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with CutMix enabled at a 50% probability
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, cutmix=0.5)بالنسبة للفرق التي تدير مهام سير عمل الرؤية واسعة النطاق، تبسط منصة Ultralytics هذا الأمر من خلال السماح للمستخدمين بضبط أفضل ممارسات تعزيز البيانات مباشرة من واجهة سحابية، مما يسهل المسار من التعليق التوضيحي إلى نشر النموذج.






