استخدام زيادات Albumentations لتنويع بياناتك
تعرف على كيفية استخدام Albumentations للزيادات عند تدريب Ultralytics YOLO11 المخصص لتحسين أداء النموذج ببيانات تدريب متنوعة.

عند بناء حل للرؤية الحاسوبية، يمكن أن يكون جمع مجموعة متنوعة من الصور لتدريب نماذج الذكاء الاصطناعي للرؤية جزءاً حاسماً من العملية. غالباً ما يتطلب ذلك الكثير من الوقت والمال، وأحياناً لا تكون الصور التي تم جمعها متنوعة بما يكفي ليتعلم النموذج بفعالية.
على سبيل المثال، يمكن تدريب نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 بشكل مخصص على مجموعات بيانات صور لمهام متنوعة للرؤية الحاسوبية تتعلق بتطبيقات مختلفة. تعد البيانات المتنوعة أمراً أساسياً لأنها تساعد النموذج على التعميم بشكل أفضل، مما يسمح له بالتعرف على الكائنات والأنماط في مجموعة واسعة من سيناريوهات العالم الحقيقي.
إذا كنت تعاني من نقص في البيانات المتنوعة، يمكن أن تكون تقنيات زيادة بيانات الصور (image data augmentation) حلاً رائعاً. يمكن أن تساعد أساليب مثل التدوير، والقلب، وتعديل السطوع في زيادة تنوع مجموعة بياناتك، مما يحسن قدرة النموذج على التعامل مع نطاق أوسع من الظروف.
ولهذا السبب يدعم Ultralytics تكاملاً لزيادة بيانات الصور. باستخدام Albumentations، وهي أداة شائعة توفر مجموعة من التحويلات، يمكنك إنشاء بيانات مرئية متنوعة. يعمل هذا التكامل على تبسيط عملية تدريب YOLO11 من خلال زيادة صور التدريب تلقائياً، مما يؤدي إلى تحسين أداء النموذج.
في هذه المقالة، سنستكشف كيفية استخدام تكامل Albumentations، وفوائده، وتأثيره على تدريب النموذج.
Link to this sectionما هو Albumentations؟#
يمكن لنماذج الرؤية الحاسوبية أن تتعلم من مجموعة واسعة من الصور عالية الجودة للتعرف على الكائنات في بيئات مختلفة. يمكن أن يكون جمع مجموعات بيانات كبيرة من مصادر واقعية بطيئاً ومكلفاً وغير فعال. لتبسيط هذه المهمة، يمكنك استخدام زيادة بيانات الصور لإنشاء تنويعات جديدة للصور الموجودة، مما يساعد النماذج على التعلم من سيناريوهات مختلفة دون الحاجة لجمع المزيد من البيانات.
على وجه التحديد، يمكنك الاستفادة من Albumentations، وهي مكتبة مفتوحة المصدر تم تقديمها لزيادة كفاءة بيانات الصور في عام 2018. وهي تدعم مجموعة متنوعة من العمليات، بدءاً من التغييرات الهندسية البسيطة مثل التدوير والقلب وصولاً إلى تعديلات أكثر تعقيداً مثل السطوع، والتباين، وإضافة الضوضاء.

الشكل 1. أمثلة على أنواع مختلفة من زيادات بيانات الصور.
Link to this sectionالميزات الرئيسية لـ Albumentations#
يشتهر Albumentations بأدائه العالي، مما يعني أنه قادر على معالجة الصور بسرعة وكفاءة. تم بناؤه على مكتبات محسنة مثل OpenCV وNumPy، وهو يتعامل مع مجموعات البيانات الكبيرة بأقل وقت معالجة، مما يجعله مثالياً لزيادة البيانات بسرعة أثناء تدريب النموذج.
إليك بعض الميزات الرئيسية الأخرى لـ Albumentations:
- مجموعة واسعة من التحويلات: يوفر Albumentations أكثر من 70 نوعاً من الزيادات. تساعد هذه التنويعات النماذج على تعلم اكتشاف الكائنات على الرغم من التغيرات في الإضاءة، أو الزوايا، أو الخلفيات.
- محسن للسرعة: يستخدم تقنيات تحسين متقدمة مثل SIMD (تعليمات فردية، بيانات متعددة)، والتي تعالج نقاط بيانات متعددة في وقت واحد لتسريع زيادة الصور والتعامل مع مجموعات البيانات الكبيرة بكفاءة.
- ثلاثة مستويات من الزيادات: يعزز البيانات بثلاث طرق. على سبيل المثال، تقوم زيادات مستوى البكسل بتعديل السطوع واللون دون تغيير الكائنات. في الوقت نفسه، تعدل زيادات المستوى المكاني موقع الكائن مع الحفاظ على التفاصيل الرئيسية، وتدمج زيادات مستوى المزج أجزاءً من صور مختلفة لإنشاء عينات جديدة.
Link to this sectionلماذا يجب عليك استخدام تكامل Albumentations؟#
قد تتساءل: هناك العديد من الطرق لتطبيق الزيادات على مجموعة البيانات، ويمكنك حتى إنشاء طريقتك الخاصة باستخدام أدوات مثل OpenCV. إذاً، لماذا تختار تكاملاً يدعم مكتبة مثل Albumentations؟
إن إنشاء الزيادات يدوياً باستخدام أدوات مثل OpenCV يمكن أن يستغرق الكثير من الوقت ويتطلب بعض الخبرة. قد يكون من الصعب أيضاً ضبط التحويلات بدقة للحصول على أفضل النتائج. يجعل تكامل Albumentations هذه العملية أسهل. فهو يوفر العديد من التحويلات الجاهزة للاستخدام التي يمكن أن توفر وقتك وجهدك عند تحضير مجموعة بياناتك.
سبب آخر لاختيار تكامل Albumentations هو أنه يعمل بسلاسة مع خط أنابيب تدريب نموذج Ultralytics. فهو يجعل تدريب YOLO11 بشكل مخصص أسهل بكثير، حيث يتم تطبيق الزيادات تلقائياً أثناء التدريب. إنه يبسط العملية، لذا يمكنك التركيز أكثر على تحسين نموذجك بدلاً من التعامل مع إعداد البيانات.
Link to this sectionالبدء مع تكامل Albumentations#
من المثير للاهتمام أن استخدام تكاملات Albumentations لتدريب YOLO11 أبسط مما قد يبدو. بمجرد إعداد المكتبات المناسبة، يقوم التكامل بتطبيق زيادات بيانات الصور تلقائياً أثناء التدريب. إنه يساعد النموذج على التعلم من تنويعات صور مختلفة باستخدام نفس مجموعة البيانات.
بعد ذلك، دعنا نستعرض كيفية تثبيت واستخدام تكامل Albumentations عند تدريب YOLO11 بشكل مخصص.
Link to this sectionتثبيت حزمة Python الخاصة بـ Ultralytics وAlbumentations#
قبل تطبيق الزيادات، يجب تثبيت كل من حزمة Python لـ Ultralytics وAlbumentations. تم تصميم التكامل بحيث تعمل كلتا المكتبتين معاً بسلاسة افتراضياً، لذا لا داعي للقلق بشأن التكوينات المعقدة.
يمكن إكمال عملية التثبيت بأكملها في غضون بضع دقائق فقط باستخدام أمر pip واحد، وهو أداة إدارة حزم لتثبيت مكتبات Python، كما هو موضح في الصورة أدناه.

الشكل 2. تثبيت Ultralytics وAlbumentations.
بمجرد تثبيت Albumentations، يقوم وضع تدريب نموذج Ultralytics بتطبيق زيادات الصور تلقائياً أثناء التدريب. إذا لم يتم تثبيت Albumentations، فلن يتم تطبيق هذه الزيادات. لمزيد من التفاصيل، يمكنك الرجوع إلى وثائق Ultralytics الرسمية.
Link to this sectionتدريب YOLO11 بمساعدة تكامل Albumentations#
دعنا نحصل على فهم أفضل لما يحدث تحت غطاء تكامل Albumentations.
إليك نظرة فاحصة على الزيادات التي يتم تطبيقها أثناء تدريب YOLO11:
- التمويه (Blur): يضيف هذا التحويل تمويهاً طفيفاً إلى الصورة. إنه يساعد النموذج على اكتشاف الكائنات حتى عندما تكون خارج نطاق التركيز.
- تمويه الوسيط (Median blur): يقلل من الضوضاء العشوائية مع الحفاظ على حواف الكائنات في الصورة. وهذا يجعل من الأسهل على النموذج اكتشاف الكائنات في البيئات المعقدة.
- التدرج الرمادي (Grayscale): من خلال تحويل الصورة إلى أسود وأبيض، يمكن أن تساعد هذه الزيادة النموذج على التركيز على الأشكال والقوام بدلاً من الألوان.
- CLAHE (موازنة المدرج التكراري التكيفي المحدود بالتباين): تعمل هذه الزيادة على تعزيز التباين في الصور، لا سيما في المناطق المظلمة جداً أو التي يصعب رؤيتها، مثل ظروف الإضاءة المنخفضة أو الضبابية. وهذا يجعل الكائنات في تلك المناطق أوضح وأسهل للنموذج للتعرف عليها.

الشكل 3. مثال على زيادة التدرج الرمادي المطبقة على صورة قطة.
Link to this sectionتطبيقات YOLO11 وتكامل Albumentations#
إذا كنت تدرب YOLO11 بشكل مخصص لتطبيق معين، يمكن أن يساعد تكامل Albumentations في تعزيز أداء النموذج من خلال التكيف مع ظروف مختلفة. دعنا نناقش بعض التطبيقات الواقعية والتحديات التي يمكن أن يحلها هذا التكامل.
Link to this sectionتحسين التصوير الطبي#
يساعد الذكاء الاصطناعي في الرعاية الصحية الأطباء على تحليل الصور الطبية بدقة أكبر للمساعدة في التشخيص وتحسين رعاية المرضى. في الواقع، حوالي خمس مؤسسات الرعاية الصحية تستخدم بالفعل حلول الذكاء الاصطناعي.
ومع ذلك، يأتي إنشاء حلول الرؤية الحاسوبية هذه مع مجموعة تحدياته الخاصة. يمكن أن تختلف المسوحات الطبية بشكل كبير بين المستشفيات، متأثرة بعوامل مثل المعدات المختلفة، والإعدادات، وحتى خبرة الفنيين. يمكن أن تؤثر الاختلافات في السطوع والتباين والتعرض على اتساق ودقة نماذج الذكاء الاصطناعي للرؤية، مما يجعل من الصعب عليها العمل بشكل موثوق عبر بيئات مختلفة.
وهنا يصبح تكامل أدوات مثل Albumentations ضرورياً. من خلال إنشاء إصدارات متعددة ومحسنة من نفس المسح، يمكن Albumentations النموذج من التعلم من مجموعة متنوعة من جودات الصور. يساعد هذا النموذج ليصبح أكثر قوة، مما يسمح له باكتشاف الأمراض بدقة عبر كل من الصور عالية ومنخفضة الجودة.

الشكل 4. صور أشعة سينية محسنة.
Link to this sectionتعزيز الأمن والمراقبة#
تطبيق آخر مثير للاهتمام للذكاء الاصطناعي للرؤية هو في الأمن والمراقبة. يمكن لاكتشاف الكائنات في الوقت الفعلي أن يساعد فرق الأمن على تحديد التهديدات المحتملة بسرعة.
من الشواغل الرئيسية المتعلقة بهذا التطبيق هو أن كاميرات الأمن تلتقط اللقطات تحت ظروف إضاءة مختلفة طوال اليوم، وهذه الظروف يمكن أن تؤثر بشكل كبير على كيفية فهم النموذج لمثل هذه الصور. يمكن لعوامل مثل بيئات الإضاءة المنخفضة، أو الوهج، أو ضعف الرؤية أن تجعل من الصعب على نماذج الرؤية الحاسوبية اكتشاف الكائنات أو التعرف على التهديدات المحتملة باستمرار.
يساعد تكامل Albumentations من خلال تطبيق تحويلات لمحاكاة ظروف الإضاءة المختلفة. وهذا يسمح للنموذج بالتعلم لاكتشاف الكائنات في كل من بيئات الإضاءة الساطعة والمنخفضة، مما يجعله أكثر موثوقية ويحسن أوقات الاستجابة في الظروف الصعبة.
Link to this sectionإعادة تعريف سير عمل البيع بالتجزئة وتجربة العملاء#
انسكاب في ممر سوبر ماركت، كلب يركض عبر متجر، أو طفل يقلب عرض منتج، ليست سوى أمثلة قليلة على الأحداث اليومية التي يمكن أن تكون حالات حافة (edge cases) لـ الذكاء الاصطناعي للرؤية في البيع بالتجزئة. تُستخدم الرؤية الحاسوبية بشكل متزايد لتحسين تجربة العملاء من خلال تتبع سلوك المتسوقين، ومراقبة حركة المشاة، وتحديد المنتجات على الأرفف. ومع ذلك، يمكن أن تكون هذه المواقف الواقعية صعبة على أنظمة الذكاء الاصطناعي لفهمها ومعالجتها بدقة.
على الرغم من أنه لا يمكن تمثيل كل سيناريو في مجموعة بيانات رؤية حاسوبية، يساعد تكامل Albumentations من خلال زيادة البيانات لتغطية العديد من المواقف المحتملة، مثل الإضاءة غير المتوقعة، أو الزوايا غير العادية، أو العوائق. يساعد هذا نماذج الرؤية الحاسوبية على التكيف مع ظروف مختلفة، مما يحسن قدرتها على التعامل مع حالات الحافة وإجراء تنبؤات دقيقة في بيئات البيع بالتجزئة الديناميكية.
Link to this sectionأبرز النقاط#
يمكن أن يكون جمع بيانات واقعية متنوعة لتدريب النماذج أمراً معقداً، لكن Albumentations يجعله أسهل من خلال إنشاء تنويعات للصور تساعد النماذج على التكيف مع ظروف مختلفة.
يعمل تكامل Albumentations المدعوم من Ultralytics على تبسيط عملية تطبيق هذه الزيادات أثناء تدريب YOLO11 بشكل مخصص. يؤدي هذا إلى جودة أفضل لمجموعة البيانات، مما يفيد مجموعة واسعة من الصناعات من خلال إنتاج نماذج ذكاء اصطناعي للرؤية أكثر دقة وموثوقية.
انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشاريعك في مجال الذكاء الاصطناعي للرؤية. هل أنت مهتم بابتكارات مثل الذكاء الاصطناعي في التصنيع أو الرؤية الحاسوبية في القيادة الذاتية؟ تفضل بزيارة صفحات حلولنا لاكتشاف المزيد.






