تعد زيادة البيانات تقنية مهمة في التعلم الآلي (ML) تُستخدم لتوسيع حجم وتنوع مجموعة بيانات التدريب بشكل مصطنع. يتم تحقيق ذلك من خلال إنشاء نسخ معدلة من نقاط البيانات الموجودة أو توليد أمثلة اصطناعية جديدة بناءً عليها. يتمثل الهدف الأساسي في تحسين الأداء وقدرات التعميم ومتانة نماذج تعلّم الآلة، خاصةً في مجالات مثل الرؤية الحاسوبية (CV) حيث يمكن أن يكون الحصول على مجموعات بيانات كبيرة ومتنوعة مكلفًا ويستغرق وقتًا طويلاً. من خلال تدريب نماذج مثل Ultralytics YOLO على البيانات المعززة، يمكن للمطورين مساعدتها على تعلم كيفية التعامل مع مجموعة واسعة من الاختلافات التي تواجهها في سيناريوهات العالم الحقيقي، مما يؤدي إلى دقة أفضل في البيانات غير المرئية.
كيفية عمل تعزيز البيانات
تتمثل الفكرة الأساسية وراء زيادة البيانات في تطبيق تحويلات مختلفة على عينات البيانات الأصلية لتوليد أمثلة تدريبية جديدة ومعقولة. يجب أن تعكس هذه التحويلات بشكل مثالي الاختلافات التي قد يواجهها النموذج أثناء الاستدلال. بالنسبة لبيانات الصور، وهو محور التركيز الأساسي في الرؤية الحاسوبية، تتضمن تقنيات التعزيز الشائعة ما يلي:
- التحويلات الهندسية: تغيير الخصائص المكانية للصورة، مثل التدوير، والتكبير (التكبير أو التصغير)، والترجمة (التحويل)، والقص، والقلب (أفقيًا أو رأسيًا).
- تحويلات مساحة اللون: تعديل خصائص الألوان، بما في ذلك تعديلات السطوع والتباين والتشبع وتدرج الألوان. تساعد هذه النماذج على أن تصبح أقل حساسية لظروف الإضاءة وتغيرات الكاميرا.
- إضافة الضوضاء: إدخال ضوضاء عشوائية (مثل ضوضاء غاوسي) لمحاكاة ضوضاء المستشعر أو جودة الصورة غير الكاملة.
- المسح العشوائي/الاقتطاع العشوائي: إخفاء مناطق مستطيلة عشوائية من الصورة لتشجيع النموذج على التركيز على أجزاء مختلفة من الأجسام وتحسين المتانة ضد الانسداد.
- مزج الصور: دمج صور متعددة أو أجزاء من صور متعددة. تقنيات مثل Mixup (الاستيفاء بين صورتين وتسمياتهما) و CutMix (لصق رقعة من صورة على أخرى) تجبر النموذج على التعلم من أمثلة أقل نظافة.
على الرغم من استخدامها بكثافة في السيرة الذاتية، إلا أن تقنيات التعزيز تُطبق أيضًا في مجالات أخرى. على سبيل المثال، في معالجة اللغات الطبيعية (NLP)، يمكن لأساليب مثل استبدال المرادفات، والترجمة العكسية (ترجمة النص إلى لغة أخرى والعكس)، والإدراج/الحذف العشوائي للكلمات أن تزيد من بيانات النص.
الأهمية والفوائد
تعد زيادة البيانات جزءًا أساسيًا من سير عمل تعلّم الآلة لعدة أسباب:
- تحسين تعميم النموذج: من خلال تعريض النموذج لمزيد من الأمثلة المتنوعة، تساعده الزيادة على تعلم الأنماط الأساسية بدلاً من حفظ أمثلة تدريب محددة، مما يؤدي إلى أداء أفضل على البيانات الجديدة.
- الحد من الإفراط في التركيب: يحدث الإفراط في التكييف عندما يكون أداء النموذج جيدًا على بيانات التدريب ولكن أداءه ضعيف على البيانات غير المرئية. تعمل عملية التعزيز كأسلوب تنظيم، مما يجعل من الصعب على النموذج أن يلائم مجموعة البيانات الأصلية المحدودة.
- زيادة المتانة: عادةً ما تكون النماذج التي تم تدريبها باستخدام البيانات المعززة أكثر مرونة في مواجهة التغيرات في المدخلات، مثل التغيرات في الإضاءة أو وجهة النظر أو المقياس أو الانسداد الجزئي.
- تقليل احتياجات جمع البيانات: يسمح للمطورين بتحقيق نتائج أفضل مع مجموعات بيانات أولية أصغر، مما يوفر الوقت والموارد المرتبطة بجمع البيانات ووضع العلامات. اعثر على المزيد من نصائح تدريب النماذج في وثائقنا.
التقنيات والأدوات
يتم تسهيل تنفيذ زيادة البيانات من خلال مكتبات وأطر عمل مختلفة. بالنسبة لمهام الرؤية الحاسوبية، تتضمن بعض الأدوات الشائعة ما يلي:
تتضمن نماذج Ultralytics العديد من تقنيات التعزيز المدمجة الفعالة أثناء التدريب. يمكن للمستخدمين إدارة مجموعات البيانات الخاصة بهم والاستفادة من هذه الميزات من خلال منصات مثل Ultralytics HUB.
التطبيقات الواقعية
يتم تطبيق زيادة البيانات على نطاق واسع في العديد من مجالات الذكاء الاصطناعي:
- الذكاء الاصطناعي في مجال الرعاية الصحية: في تحليل التصوير الطبي، مثل الكشف عن الأورام في عمليات المسح الضوئي، غالبًا ما تكون مجموعات البيانات محدودة بسبب مخاوف تتعلق بالخصوصية وندرة بعض الحالات. تعمل تقنيات التعزيز مثل التدوير والقياس وتعديلات السطوع على إنشاء أمثلة تدريبية متنوعة، مما يساعد النماذج على اكتشاف الحالات الشاذة بشكل موثوق على الرغم من الاختلافات في معدات التصوير أو وضع المريض. يؤدي ذلك إلى تحسين دقة تشخيص أنظمة تحليل الصور الطبية.
- الذكاء الاصطناعي للسيارات: يتطلب تطوير أنظمة قوية للكشف عن الأجسام للمركبات ذاتية القيادة بيانات تدريب تغطي سيناريوهات قيادة متنوعة. تحاكي التعزيزات ظروف الطقس المختلفة (على سبيل المثال، إضافة المطر أو الضباب الاصطناعي)، وتغيرات الإضاءة (نهاراً وليلاً وفجراً/غسق)، والانسدادات (على سبيل المثال، المشاة أو المركبات المخفية جزئياً)، مما يجعل أنظمة الإدراك أكثر موثوقية في بيئات العالم الحقيقي التي لا يمكن التنبؤ بها.
- الذكاء الاصطناعي في الزراعة: بالنسبة لمهام مثل الكشف عن أمراض المحاصيل أو عدّ الفاكهة، يمكن للذكاء الاصطناعي أن يحاكي الاختلافات في الإضاءة بسبب الطقس أو الوقت من اليوم، أو مراحل النمو المختلفة، أو زوايا الكاميرا من الطائرات بدون طيار أو الروبوتات الأرضية، مما يؤدي إلى حلول زراعية دقيقة أكثر قوة.
- الذكاء الاصطناعي في التصنيع: في مجال مراقبة الجودة، يمكن للذكاء الاصطناعي أن يخلق اختلافات في اتجاه المنتج والإضاءة والعيوب الطفيفة لتدريب النماذج من أجل اكتشاف الشذوذ بشكل أكثر موثوقية على خطوط الإنتاج.
تعزيز البيانات مقابل البيانات التركيبية
بينما يهدف كل من زيادة البيانات وتوليد البيانات التركيبية إلى تحسين مجموعات بيانات التدريب، إلا أنهما يختلفان اختلافًا جوهريًا:
- تعزيز البيانات: تعديل البيانات الحقيقية الموجودة من خلال التحويلات. وهي تزيد من التباين حول نقاط البيانات المرصودة ولكنها لا تقدم بشكل عام سيناريوهات جديدة تمامًا غير ممثلة في البيانات الأصلية.
- البيانات الاصطناعية: تنطوي على إنشاء بيانات اصطناعية جديدة تمامًا من الصفر، وغالبًا ما تستخدم المحاكاة أو الرسومات الحاسوبية أو النماذج التوليدية مثل شبكات الخصومة التوليدية (GANs) أو نماذج الانتشار. يمكن للبيانات الاصطناعية أن تمثل سيناريوهات نادرة أو يستحيل التقاطها في العالم الحقيقي، مما قد يسد الثغرات التي لا يمكن أن تعالجها الزيادة.
في الممارسة العملية، غالبًا ما تكون زيادة البيانات أسهل في التنفيذ وأرخص من الناحية الحسابية من توليد بيانات اصطناعية عالية الدقة. يمكن أن تكون كلتا التقنيتين ذات قيمة، وأحيانًا يتم استخدامهما معًا لإنشاء مجموعات بيانات تدريبية متنوعة وقوية للغاية لتطبيقات الذكاء الاصطناعي الصعبة.