Yolo فيجن شنتشن
شنتشن
انضم الآن

استخدام تحسينات Albumentations لتنويع بياناتك

أبيرامي فينا

5 دقائق قراءة

17 فبراير 2025

تعرّف على كيفية استخدام Albumentations للتعزيزات عند تدريب Ultralytics YOLO11 المخصص لتحسين أداء النموذج مع بيانات التدريب المتنوعة.

عند بناء حل رؤية حاسوبية (computer vision)، يمكن أن يكون جمع مجموعة متنوعة من الصور لتدريب نماذج Vision AI جزءًا مهمًا من العملية. غالبًا ما يتطلب الكثير من الوقت والمال، وفي بعض الأحيان، لا تزال الصور التي يتم جمعها غير متنوعة بما يكفي لكي تتعلم النماذج بفعالية.

على سبيل المثال، نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 يمكن تدريبها بشكل مخصص على مجموعات بيانات الصور لمختلف مهام الرؤية الحاسوبية المتعلقة بتطبيقات مختلفة. البيانات المتنوعة هي المفتاح لأنها تساعد النموذج على التعميم بشكل أفضل، مما يسمح له بالتعرف على الأشياء والأنماط في مجموعة واسعة من سيناريوهات العالم الحقيقي.

إذا كنت تعاني من نقص في البيانات المتنوعة، يمكن أن تكون تقنيات زيادة بيانات الصورة حلاً رائعًا. يمكن أن تساعد طرق مثل التدوير والقلب وتعديل السطوع في زيادة تنوع مجموعة البيانات الخاصة بك، وتحسين قدرة النموذج على التعامل مع نطاق أوسع من الظروف.

لهذا السبب تدعم Ultralytics تكاملاً لزيادة بيانات الصور. باستخدام Albumentations، وهي أداة شائعة تقدم مجموعة من التحويلات، يمكنك إنشاء بيانات مرئية متنوعة. يعمل هذا التكامل على تبسيط عملية تدريب YOLO11 من خلال زيادة صور التدريب تلقائيًا، مما يؤدي إلى تحسين أداء النموذج. 

في هذه المقالة، سوف نستكشف كيف يمكنك استخدام تكامل Albumentations وفوائده وتأثيره على تدريب النموذج.

ما هي Albumentations؟

يمكن لنماذج رؤية الحاسوب (Computer vision models) أن تتعلم من مجموعة واسعة من الصور عالية الجودة للتعرف على الكائنات في بيئات مختلفة. يمكن أن يكون جمع مجموعات بيانات كبيرة من مصادر العالم الحقيقي بطيئًا ومكلفًا وغير فعال. لتبسيط هذه المهمة، يمكنك استخدام زيادة بيانات الصورة (image data augmentation) لإنشاء اختلافات جديدة للصور الحالية، مما يساعد النماذج على التعلم من سيناريوهات مختلفة دون جمع المزيد من البيانات.

على وجه التحديد، يمكنك الاستفادة من Albumentations، وهي مكتبة مفتوحة المصدر تم تقديمها لزيادة بيانات الصور بكفاءة في عام 2018. وهي تدعم مجموعة متنوعة من العمليات، من التغييرات الهندسية البسيطة مثل الدوران والقلب إلى التعديلات الأكثر تعقيدًا مثل السطوع والتباين وإضافة الضوضاء.

__wf_reserved_inherit
الشكل 1. أمثلة على أنواع مختلفة من زيادة البيانات في الصور.

الميزات الرئيسية لـ Albumentations

يُعرف برنامج Albumentations بأدائه العالي، مما يعني أنه يمكنه معالجة الصور بسرعة وكفاءة. مبنية على مكتبات محسّنة مثل OpenCV و NumPy فهي تتعامل مع مجموعات البيانات الكبيرة بأقل وقت معالجة ممكن، مما يجعلها مثالية لزيادة البيانات بسرعة أثناء تدريب النموذج.

فيما يلي بعض الميزات الرئيسية الأخرى لـ Albumentations:

  • مجموعة واسعة من التحويلات: توفر Albumentations أكثر من 70 نوعًا من التحولات. تساعد هذه الاختلافات النماذج على تعلم detect الأجسام على الرغم من التغييرات في الإضاءة أو الزوايا أو الخلفيات.
  • مُحسَّن للسرعة: يستخدم تقنيات تحسين متقدمة مثل SIMD (تعليمات مفردة، بيانات متعددة)، والتي تعالج نقاط بيانات متعددة في وقت واحد لتسريع زيادة حجم الصورة والتعامل مع مجموعات البيانات الكبيرة بكفاءة.
  • ثلاثة مستويات من الزيادات: تعزز البيانات بثلاث طرق. على سبيل المثال، تقوم الزيادات على مستوى البكسل بضبط السطوع واللون دون تغيير الكائنات. وفي الوقت نفسه، تقوم الزيادات على المستوى المكاني بتعديل موضع الكائن مع الحفاظ على التفاصيل الرئيسية، وتقوم الزيادات على مستوى المزج بدمج أجزاء من صور مختلفة لإنشاء عينات جديدة.

لماذا يجب عليك استخدام تكامل Albumentations؟

قد تتساءل: هناك العديد من الطرق لتطبيق التعزيزات على مجموعة البيانات، ويمكنك حتى إنشاء أدواتك الخاصة باستخدام أدوات مثل OpenCV. إذن، لماذا تختار تكاملًا يدعم مكتبة مثل Albumentations؟

قد يستغرق إنشاء التعزيزات يدويًا باستخدام أدوات مثل OpenCV الكثير من الوقت ويتطلب بعض الخبرة. قد يكون من الصعب أيضًا ضبط التحويلات للحصول على أفضل النتائج. يجعل تكامل Albumentations هذه العملية أسهل. فهو يوفر العديد من التحويلات الجاهزة للاستخدام والتي يمكن أن توفر لك الوقت والجهد عند إعداد مجموعة البيانات الخاصة بك.

سبب آخر لاختيار تكامل Albumentations هو أنه يعمل بسلاسة مع خط أنابيبتدريب نموذج Ultralytics . إنه يجعل من الأسهل بكثير تدريب YOLO11 المخصص، حيث يتم تطبيق التعزيزات تلقائيًا أثناء التدريب. إنه يبسط العملية، بحيث يمكنك التركيز أكثر على تحسين نموذجك بدلاً من التعامل مع إعداد البيانات. 

البدء في استخدام تكامل Albumentations

ومن المثير للاهتمام أن استخدام عمليات تكامل Albumentations لتدريب YOLO11 أكثر وضوحاً مما قد يبدو. فبمجرد إعداد المكتبات الصحيحة، يطبق التكامل تلقائيًا عمليات تعزيز بيانات الصور أثناء التدريب. يساعد النموذج على التعلم من أشكال مختلفة من الصور باستخدام نفس مجموعة البيانات.

بعد ذلك، دعنا نتعرف على كيفية تثبيت تكامل Albumentations واستخدامه عند تدريب YOLO11 المخصص.

تثبيت حزمة Ultralytics Python و Albumentations

قبل تطبيق التعزيزات، يجب تثبيت كل من حزمةUltralytics Python و Albumentations. لقد تم بناء التكامل بحيث تعمل كلتا المكتبتين معًا بسلاسة افتراضيًا، لذا لا داعي للقلق بشأن التكوينات المعقدة.

يمكن إكمال عملية التثبيت بأكملها في بضع دقائق فقط باستخدام أمر pip واحد، وهو أداة إدارة حزم لتثبيت مكتبات Python كما هو موضح في الصورة أدناه. 

__wf_reserved_inherit
الشكل 2. تركيب Ultralytics وألبومنتاتيشن.

بمجرد تثبيت Albumentations، يطبق وضع تدريب نموذج Ultralytics تلقائيًا عمليات تعزيز الصور أثناء التدريب. إذا لم يتم تثبيت Albumentations، فلن يتم تطبيق هذه التعزيزات. لمزيد من التفاصيل، يمكنك الرجوع إلى وثائق Ultralytics الرسمية.

تدريب YOLO11 بمساعدة تكامل البومينتيشنز

دعونا نحصل على فهم أفضل لما يحدث تحت غطاء تكامل Albumentations. 

إليك نظرة عن كثب على التعزيزات التي يتم تطبيقها خلال تدريب YOLO11 :

  • الضبابية: يضيف هذا التحويل ضبابية طفيفة إلى الصورة. فهو يساعد النموذج على detect الأجسام حتى عندما تكون خارج نطاق التركيز.
  • الضبابية المتوسطة: يقلل من الضوضاء العشوائية مع الحفاظ على حواف الأجسام في الصورة. وهذا يسهّل على النموذج detect الأجسام في البيئات المعقدة.
  • تدرج الرمادي: من خلال تحويل الصورة إلى أبيض وأسود، يمكن أن يساعد هذا التحسين النموذج على التركيز على الأشكال والقوام بدلاً من الألوان.
  • CLAHE (معادلة المدرج التكراري التكيفي المحدود التباين): يعمل هذا التحسين على تعزيز التباين في الصور، خاصة في المناطق المظلمة جداً أو التي يصعب رؤيتها، كما هو الحال في ظروف الإضاءة المنخفضة أو الضبابية. هذا يجعل الكائنات في تلك المناطق أكثر وضوحاً وأسهل على النموذج لتحديدها.
__wf_reserved_inherit
الشكل 3. مثال على تطبيق زيادة تدرج الرمادي على صورة قطة.

تطبيقات YOLO11 وتكامل البومينتيشنز

إذا كنت تقوم بتدريب YOLO11 بشكل مخصص لتطبيق معين، يمكن أن يساعد تكامل البومنتات في تحسين أداء النموذج من خلال التكيف مع الظروف المختلفة. دعنا نناقش بعض التطبيقات الواقعية والتحديات التي يمكن لهذا التكامل حلها.

تحسين التصوير الطبي

تساعد الرؤية بالذكاء الاصطناعي في مجال الرعاية الصحية الأطباء على تحليل الصور الطبية بدقة أكبر للمساعدة في التشخيص وتحسين رعاية المرضى. في الواقع، يستخدم حوالي خُمس مؤسسات الرعاية الصحية بالفعل حلول الذكاء الاصطناعي. 

ومع ذلك، فإن إنشاء حلول رؤية الكمبيوتر هذه يأتي مع مجموعة التحديات الخاصة به. يمكن أن تختلف الفحوصات الطبية على نطاق واسع بين المستشفيات، متأثرة بعوامل مثل المعدات والإعدادات المختلفة، وحتى خبرة الفنيين. يمكن أن تؤثر الاختلافات في السطوع والتباين والتعرض على اتساق ودقة نماذج Vision AI، مما يجعل من الصعب عليها الأداء بشكل موثوق عبر البيئات المختلفة.

وهنا يصبح دمج أدوات مثل Albumentations ضرورياً. من خلال توليد إصدارات معززة متعددة من نفس الفحص، تُمكّن Albumentations النموذج من التعلم من مجموعة متنوعة من صفات الصور. وهذا يساعد النموذج على أن يصبح أكثر قوة، مما يسمح له detect الأمراض بدقة عبر الصور عالية الجودة ومنخفضة الجودة على حد سواء. 

__wf_reserved_inherit
الشكل 4. صور أشعة سينية مُعزَّزة.

تعزيز الأمن والمراقبة

تطبيق آخر مثير للاهتمام للرؤية الحاسوبية المدعومة بالذكاء الاصطناعي هو في الأمن والمراقبة. يمكن للكشف عن الأجسام في الوقت الفعلي أن يساعد فرق الأمن على تحديد التهديدات المحتملة بسرعة. 

يتمثل أحد الشواغل الرئيسية المتعلقة بهذا التطبيق في أن كاميرات المراقبة تلتقط لقطات تحت ظروف إضاءة مختلفة على مدار اليوم، ويمكن أن تؤثر هذه الظروف بشكل كبير على كيفية فهم النموذج لهذه الصور. يمكن لعوامل مثل البيئات ذات الإضاءة المنخفضة أو الوهج أو ضعف الرؤية أن تجعل من الصعب على نماذج الرؤية الحاسوبية detect الأجسام أو التعرف على التهديدات المحتملة باستمرار.

يساعد تكامل البومنتات من خلال تطبيق التحويلات لمحاكاة ظروف الإضاءة المختلفة. يتيح ذلك للنموذج تعلم detect الأجسام في كل من البيئات ذات الإضاءة الساطعة والمنخفضة على حد سواء، مما يجعله أكثر موثوقية ويحسن أوقات الاستجابة في الظروف الصعبة.

إعادة تعريف سير العمل في مجال البيع بالتجزئة وتجربة العملاء

يعد الانسكاب في ممر سوبر ماركت أو كلب يركض عبر متجر أو طفل يسقط عرضًا للمنتجات مجرد أمثلة قليلة للأحداث اليومية التي يمكن أن تكون حالات حافة لـ الذكاء الاصطناعي البصري في بيئات البيع بالتجزئة. يتم استخدام الرؤية الحاسوبية بشكل متزايد لتحسين تجربة العملاء من خلال تتبع سلوك المتسوقين ومراقبة حركة المرور وتحديد المنتجات على الرفوف. ومع ذلك، قد يكون من الصعب على أنظمة الذكاء الاصطناعي فهم هذه المواقف الواقعية ومعالجتها بدقة.

في حين أنه لا يمكن تمثيل كل سيناريو في مجموعة بيانات رؤية حاسوبية، إلا أن تكامل Albumentations يساعد عن طريق زيادة البيانات لتغطية العديد من المواقف المحتملة، مثل الإضاءة غير المتوقعة أو الزوايا غير العادية أو العوائق. يساعد هذا نماذج الرؤية الحاسوبية على التكيف مع الظروف المختلفة، مما يحسن قدرتها على التعامل مع الحالات الشاذة وتقديم تنبؤات دقيقة في بيئات البيع بالتجزئة الديناميكية.

النقاط الرئيسية

قد يكون جمع بيانات متنوعة من العالم الحقيقي لتدريب النموذج أمرًا معقدًا، ولكن Albumentations يجعله أسهل من خلال إنشاء اختلافات في الصور تساعد النماذج على التكيف مع الظروف المختلفة. 

يعمل تكامل Albumentations المدعوم من Ultralytics على تبسيط عملية تطبيق هذه التعزيزات أثناء تدريب YOLO11 المخصص. ويؤدي ذلك إلى تحسين جودة مجموعة البيانات، مما يعود بالنفع على مجموعة واسعة من الصناعات من خلال إنتاج نماذج ذكاء اصطناعي بصري أكثر دقة وموثوقية.

انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا لمعرفة المزيد حول الذكاء الاصطناعي، وتحقق من خيارات الترخيص الخاصة بنا لبدء مشاريع Vision AI الخاصة بك. هل أنت مهتم بالابتكارات مثل الذكاء الاصطناعي في التصنيع أو الرؤية الحاسوبية في القيادة الذاتية؟ قم بزيارة صفحات الحلول الخاصة بنا لاكتشاف المزيد. 

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا