تعرّف على كيفية استخدام Albumentations لعمليات الزيادة عند التدريب المخصص لـ Ultralytics YOLO11 لتحسين أداء النموذج ببيانات تدريب متنوعة.

تعرّف على كيفية استخدام Albumentations لعمليات الزيادة عند التدريب المخصص لـ Ultralytics YOLO11 لتحسين أداء النموذج ببيانات تدريب متنوعة.
عند بناء حل رؤية حاسوبية (computer vision)، يمكن أن يكون جمع مجموعة متنوعة من الصور لتدريب نماذج Vision AI جزءًا مهمًا من العملية. غالبًا ما يتطلب الكثير من الوقت والمال، وفي بعض الأحيان، لا تزال الصور التي يتم جمعها غير متنوعة بما يكفي لكي تتعلم النماذج بفعالية.
على سبيل المثال، يمكن تدريب نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 بشكل مخصص على مجموعات بيانات الصور لمختلف مهام الرؤية الحاسوبية المتعلقة بالتطبيقات المختلفة. البيانات المتنوعة هي المفتاح لأنها تساعد النموذج على التعميم بشكل أفضل، مما يسمح له بالتعرف على الكائنات والأنماط في مجموعة واسعة من سيناريوهات العالم الحقيقي.
إذا كنت تعاني من نقص في البيانات المتنوعة، يمكن أن تكون تقنيات زيادة بيانات الصورة حلاً رائعًا. يمكن أن تساعد طرق مثل التدوير والقلب وتعديل السطوع في زيادة تنوع مجموعة البيانات الخاصة بك، وتحسين قدرة النموذج على التعامل مع نطاق أوسع من الظروف.
لهذا السبب تدعم Ultralytics تكاملاً لزيادة بيانات الصور. باستخدام Albumentations، وهي أداة شائعة تقدم مجموعة من التحويلات، يمكنك إنشاء بيانات مرئية متنوعة. يبسط هذا التكامل عملية تدريب YOLO11 عن طريق زيادة صور التدريب تلقائيًا، مما يؤدي إلى تحسين أداء النموذج.
في هذه المقالة، سوف نستكشف كيف يمكنك استخدام تكامل Albumentations وفوائده وتأثيره على تدريب النموذج.
يمكن لنماذج رؤية الحاسوب (Computer vision models) أن تتعلم من مجموعة واسعة من الصور عالية الجودة للتعرف على الكائنات في بيئات مختلفة. يمكن أن يكون جمع مجموعات بيانات كبيرة من مصادر العالم الحقيقي بطيئًا ومكلفًا وغير فعال. لتبسيط هذه المهمة، يمكنك استخدام زيادة بيانات الصورة (image data augmentation) لإنشاء اختلافات جديدة للصور الحالية، مما يساعد النماذج على التعلم من سيناريوهات مختلفة دون جمع المزيد من البيانات.
على وجه التحديد، يمكنك الاستفادة من Albumentations، وهي مكتبة مفتوحة المصدر تم تقديمها لزيادة بيانات الصور بكفاءة في عام 2018. وهي تدعم مجموعة متنوعة من العمليات، من التغييرات الهندسية البسيطة مثل الدوران والقلب إلى التعديلات الأكثر تعقيدًا مثل السطوع والتباين وإضافة الضوضاء.
تشتهر Albumentations بأدائها العالي، مما يعني أنها يمكنها معالجة الصور بسرعة وكفاءة. نظرًا لأنه مبني على مكتبات محسّنة مثل OpenCV و NumPy، فإنه يتعامل مع مجموعات البيانات الكبيرة بأقل وقت معالجة، مما يجعله مثاليًا لزيادة البيانات بسرعة أثناء تدريب النموذج.
فيما يلي بعض الميزات الرئيسية الأخرى لـ Albumentations:
قد تتساءل: هناك طرق عديدة لتطبيق الزيادات على مجموعة البيانات، ويمكنك حتى إنشاء طريقتك الخاصة باستخدام أدوات مثل OpenCV. إذن، لماذا تختار التكامل الذي يدعم مكتبة مثل Albumentations؟
قد يستغرق إنشاء تحسينات للبيانات يدويًا باستخدام أدوات مثل OpenCV الكثير من الوقت ويتطلب بعض الخبرة. قد يكون من الصعب أيضًا ضبط التحويلات بدقة للحصول على أفضل النتائج. تكامل Albumentations يجعل هذه العملية أسهل. فهو يوفر العديد من التحويلات الجاهزة للاستخدام التي يمكن أن توفر لك الوقت والجهد عند إعداد مجموعة البيانات الخاصة بك.
سبب آخر لاختيار تكامل Albumentations هو أنه يعمل بسلاسة مع خط أنابيب تدريب النماذج الخاص بـ Ultralytics. إنه يجعل التدريب المخصص لـ YOLO11 أسهل بكثير، حيث يتم تطبيق الزيادات تلقائيًا أثناء التدريب. إنه يبسط العملية، حتى تتمكن من التركيز بشكل أكبر على تحسين النموذج الخاص بك بدلاً من التعامل مع إعداد البيانات.
ومن المثير للاهتمام، أن استخدام عمليات تكامل Albumentations لتدريب YOLO11 أكثر وضوحًا مما يبدو. بمجرد إعداد المكتبات الصحيحة، يطبق التكامل تلقائيًا عمليات زيادة بيانات الصور أثناء التدريب. فهو يساعد النموذج على التعلم من اختلافات الصور المختلفة باستخدام نفس مجموعة البيانات.
بعد ذلك، دعنا نستعرض كيفية تثبيت واستخدام تكامل Albumentations عند التدريب المخصص لـ YOLOv8.
قبل تطبيق الزيادات، يجب تثبيت كل من حزمة Ultralytics Python و Albumentations. تم تصميم التكامل بحيث يعمل كلا المكتبتين معًا بسلاسة بشكل افتراضي، لذلك لا داعي للقلق بشأن التكوينات المعقدة.
يمكن إكمال عملية التثبيت بأكملها في غضون دقيقتين فقط باستخدام أمر pip واحد، وهو أداة لإدارة الحزم لتثبيت مكتبات Python، كما هو موضح في الصورة أدناه.
بمجرد تثبيت Albumentations، يقوم وضع تدريب نموذج Ultralytics تلقائيًا بتطبيق عمليات زيادة وتحسين الصور أثناء التدريب. إذا لم يتم تثبيت Albumentations، فلن يتم تطبيق هذه التحسينات. لمزيد من التفاصيل، يمكنك الرجوع إلى وثائق Ultralytics الرسمية.
دعونا نحصل على فهم أفضل لما يحدث تحت غطاء تكامل Albumentations.
إليك نظرة فاحصة على عمليات الزيادة التي يتم تطبيقها أثناء تدريب YOLO11:
إذا كنت تقوم بتدريب YOLO11 مخصص لتطبيق معين، فيمكن أن يساعد تكامل Albumentations في تحسين أداء النموذج من خلال التكيف مع الظروف المختلفة. دعنا نناقش بعض التطبيقات الواقعية والتحديات التي يمكن أن يحلها هذا التكامل.
تساعد الرؤية بالذكاء الاصطناعي في مجال الرعاية الصحية الأطباء على تحليل الصور الطبية بدقة أكبر للمساعدة في التشخيص وتحسين رعاية المرضى. في الواقع، يستخدم حوالي خُمس مؤسسات الرعاية الصحية بالفعل حلول الذكاء الاصطناعي.
ومع ذلك، فإن إنشاء حلول رؤية الكمبيوتر هذه يأتي مع مجموعة التحديات الخاصة به. يمكن أن تختلف الفحوصات الطبية على نطاق واسع بين المستشفيات، متأثرة بعوامل مثل المعدات والإعدادات المختلفة، وحتى خبرة الفنيين. يمكن أن تؤثر الاختلافات في السطوع والتباين والتعرض على اتساق ودقة نماذج Vision AI، مما يجعل من الصعب عليها الأداء بشكل موثوق عبر البيئات المختلفة.
هذا هو المكان الذي يصبح فيه دمج أدوات مثل Albumentations ضروريًا. من خلال إنشاء إصدارات معززة متعددة من نفس الفحص، تمكن Albumentations النموذج من التعلم من مجموعة متنوعة من جودات الصور. يساعد هذا النموذج على أن يصبح أكثر قوة، مما يسمح له باكتشاف الأمراض بدقة عبر الصور عالية ومنخفضة الجودة.
تطبيق آخر مثير للاهتمام للرؤية الحاسوبية المدعومة بالذكاء الاصطناعي هو في الأمن والمراقبة. يمكن للكشف عن الأجسام في الوقت الفعلي أن يساعد فرق الأمن على تحديد التهديدات المحتملة بسرعة.
أحد الاهتمامات الأساسية المتعلقة بهذا التطبيق هو أن كاميرات المراقبة تلتقط لقطات في ظل ظروف إضاءة مختلفة على مدار اليوم، ويمكن أن تؤثر هذه الظروف بشكل كبير على كيفية فهم النموذج لهذه الصور. يمكن لعوامل مثل البيئات ذات الإضاءة المنخفضة أو الوهج أو ضعف الرؤية أن تجعل من الصعب على نماذج الرؤية الحاسوبية اكتشاف الكائنات أو التعرف على التهديدات المحتملة باستمرار.
يساعد تكامل Albumentations من خلال تطبيق تحويلات لمحاكاة ظروف الإضاءة المختلفة. يتيح ذلك للنموذج تعلم اكتشاف الأجسام في البيئات ذات الإضاءة الساطعة والمنخفضة، مما يجعله أكثر موثوقية ويحسن أوقات الاستجابة في الظروف الصعبة.
يعد الانسكاب في ممر سوبر ماركت أو كلب يركض عبر متجر أو طفل يسقط عرضًا للمنتجات مجرد أمثلة قليلة للأحداث اليومية التي يمكن أن تكون حالات حافة لـ الذكاء الاصطناعي البصري في بيئات البيع بالتجزئة. يتم استخدام الرؤية الحاسوبية بشكل متزايد لتحسين تجربة العملاء من خلال تتبع سلوك المتسوقين ومراقبة حركة المرور وتحديد المنتجات على الرفوف. ومع ذلك، قد يكون من الصعب على أنظمة الذكاء الاصطناعي فهم هذه المواقف الواقعية ومعالجتها بدقة.
في حين أنه لا يمكن تمثيل كل سيناريو في مجموعة بيانات رؤية حاسوبية، إلا أن تكامل Albumentations يساعد عن طريق زيادة البيانات لتغطية العديد من المواقف المحتملة، مثل الإضاءة غير المتوقعة أو الزوايا غير العادية أو العوائق. يساعد هذا نماذج الرؤية الحاسوبية على التكيف مع الظروف المختلفة، مما يحسن قدرتها على التعامل مع الحالات الشاذة وتقديم تنبؤات دقيقة في بيئات البيع بالتجزئة الديناميكية.
قد يكون جمع بيانات متنوعة من العالم الحقيقي لتدريب النموذج أمرًا معقدًا، ولكن Albumentations يجعله أسهل من خلال إنشاء اختلافات في الصور تساعد النماذج على التكيف مع الظروف المختلفة.
يبسط تكامل Albumentations المدعوم من Ultralytics عملية تطبيق هذه التحسينات أثناء التدريب المخصص لـ YOLO11. ينتج عن ذلك جودة أفضل لمجموعة البيانات، مما يفيد مجموعة واسعة من الصناعات من خلال إنتاج نماذج Vision AI أكثر دقة وموثوقية.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع Vision AI الخاصة بك. هل أنت مهتم بالابتكارات مثل الذكاء الاصطناعي في التصنيع أو الرؤية الحاسوبية في القيادة الذاتية؟ قم بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد.