Yolo فيجن شنتشن
شنتشن
انضم الآن

الدليل النهائي لزيادة البيانات في عام 2025

أبيرامي فينا

6 دقائق قراءة

14 فبراير 2025

اكتشف كيف يساعد تaugment البيانات المرئية نماذج Vision AI على التعلم بشكل أفضل، وتحسين الدقة، والأداء بفعالية أكبر في مواقف العالم الحقيقي.

نظرًا لازدهار الذكاء الاصطناعي، فإن ظواهر مثل الروبوتات التي تعمل في المصانع والسيارات ذاتية القيادة التي تسير في الشوارع تتصدر عناوين الأخبار في كثير من الأحيان. يغير الذكاء الاصطناعي الطريقة التي تتفاعل بها الآلات مع العالم، من تحسين التصوير الطبي إلى المساعدة في مراقبة الجودة على خطوط الإنتاج.

يأتي جزء كبير من هذا التقدم من الرؤية الحاسوبية، وهو فرع من فروع الذكاء الاصطناعي يتيح للآلات فهم الصور وتفسيرها. تماماً مثلما يتعلم البشر التعرف على الأشياء والأنماط بمرور الوقت، فإن نماذج الذكاء الاصطناعي للرؤية مثل Ultralytics YOLO11 تحتاج إلى التدريب على كميات كبيرة من بيانات الصور لتطوير فهمها البصري.

ومع ذلك، فإن جمع هذا الكم الهائل من البيانات المرئية ليس بالأمر السهل دائمًا. على الرغم من أن مجتمع الرؤية الحاسوبية قد أنشأ العديد من مجموعات البيانات الكبيرة، إلا أنها لا تزال قادرة على تفويت بعض الاختلافات - مثل الصور التي تحتوي على كائنات في الإضاءة المنخفضة، أو العناصر المخفية جزئيًا، أو الأشياء التي يتم عرضها من زوايا مختلفة. يمكن أن تكون هذه الاختلافات مربكة لنماذج الرؤية الحاسوبية التي تم تدريبها فقط على ظروف معينة.

زيادة البيانات للصور هي تقنية تحل هذه المشكلة عن طريق إدخال اختلافات جديدة في البيانات الموجودة. من خلال إجراء تغييرات على الصور، مثل تعديل الألوان أو التدوير أو تغيير المنظور، تصبح مجموعة البيانات أكثر تنوعًا، مما يساعد نماذج Vision AI على التعرف على الكائنات بشكل أفضل في مواقف العالم الحقيقي.

في هذه المقالة، سنستكشف كيف يعمل تaugment البيانات في الصور وتأثيره على تطبيقات الرؤية الحاسوبية.

ما هو تaugmentations البيانات في الصور؟

لنفترض أنك تحاول التعرف على صديق في حشد من الناس، لكنه يرتدي نظارات شمسية أو يقف في بقعة مظللة. حتى مع هذه التغييرات الطفيفة في المظهر، لا تزال تعرف من هو. من ناحية أخرى، قد يواجه نموذج Vision AI صعوبة في مثل هذه الاختلافات ما لم يتم تدريبه على التعرف على الكائنات في إعدادات مختلفة.

يعمل تaugment بيانات الصور على تحسين أداء نموذج رؤية الكمبيوتر عن طريق إضافة إصدارات معدلة من الصور الموجودة إلى بيانات التدريب، بدلاً من جمع آلاف الصور الجديدة. 

التغييرات في الصور مثل القلب والتدوير وتعديل السطوع أو إضافة تشوهات صغيرة تعرض نماذج الذكاء الاصطناعي البصري لمجموعة واسعة من الظروف. بدلاً من الاعتماد على مجموعات بيانات ضخمة، يمكن للنماذج أن تتعلم بكفاءة من مجموعات بيانات تدريب أصغر مع صور مُعززة. 

__wf_reserved_inherit
الشكل 1. أمثلة على صور مُعززة لسيارة.

أهمية زيادة البيانات في الرؤية الحاسوبية

فيما يلي بعض الأسباب الرئيسية التي تجعل الزيادة ضرورية لرؤية الكمبيوتر:

  • يقلل من متطلبات البيانات: يتطلب جمع مجموعات بيانات صور كبيرة وقتًا وموارد. يمكن استخدام الزيادة لتدريب النماذج بفعالية دون الحاجة إلى مجموعات بيانات ضخمة.
  • يمنع التجاوز: قد يقوم النموذج الذي تم تدريبه على عدد قليل جدًا من الأمثلة بحفظ التفاصيل بدلاً من التعرف على الأنماط العامة. يضمن إضافة التنوع من خلال الزيادة أن تتعلم نماذج الرؤية الذكية بطريقة تنطبق على البيانات الجديدة وغير المرئية.
  • يحاكي الصور غير الكاملة: غالبًا ما تكون الصور الموجودة في مجموعات البيانات مثالية جدًا، ولكن الصور الواقعية يمكن أن تكون ضبابية أو مشوشة أو مشوهة. إن زيادة الصور بالضوضاء أو الانسدادات أو الاختلافات الأخرى يجعلها أكثر واقعية.
  • يعزز قوة النموذج: يساعد التدريب باستخدام مجموعة متنوعة من الصور الذكاء الاصطناعي على التعامل مع التغييرات في العالم الحقيقي، مما يجعله أكثر موثوقية في البيئات وظروف الإضاءة والمواقف المختلفة.

متى يجب عليك استخدام زيادة بيانات الصورة؟

يعد تaugment بيانات الصور مفيدًا بشكل خاص عندما يحتاج نموذج رؤية الكمبيوتر إلى التعرف على الكائنات في مواقف مختلفة ولكن ليس لديه صور متنوعة كافية. 

على سبيل المثال، إذا كان الباحثون يدرّبون نموذج ذكاء اصطناعي للرؤية لتحديد الأنواع النادرة تحت الماء التي نادراً ما يتم تصويرها، فقد تكون مجموعة البيانات صغيرة أو تفتقر إلى التباين. من خلال زيادة الصور - تعديل الألوان لمحاكاة أعماق المياه المختلفة، أو إضافة ضوضاء لمحاكاة الظروف المظلمة، أو تغيير الأشكال قليلاً لمحاكاة الحركة الطبيعية - يمكن للنموذج أن يتعلم detect الأجسام تحت الماء بدقة أكبر.

فيما يلي بعض الحالات الأخرى التي يحدث فيها التوسيع فرقًا كبيرًا:

  • موازنة مجموعة البيانات: قد تظهر بعض الكائنات بشكل أقل تكرارًا في بيانات التدريب، مما يجعل نماذج Vision AI متحيزة. يساعد التوسيع في إنشاء المزيد من الأمثلة للكائنات النادرة حتى يتمكن النموذج من التعرف على جميع الفئات بشكل عادل.
  • التكيف مع الكاميرات المختلفة: يمكن أن تبدو الصور مختلفة اعتمادًا على الجهاز. يساعد التوسيع نماذج رؤية الذكاء الاصطناعي على الأداء الجيد على الصور بدقة وإضاءة وجودة مختلفة.
  • تصحيح أخطاء وضع العلامات الطفيفة: تساعد التحولات الطفيفة أو الاقتصاص أو التدوير نماذج الرؤية الحاسوبية على التعرف على الكائنات بشكل صحيح، حتى لو لم تكن العلامات الأصلية محاذية تمامًا.

كيف يعمل تaugment بيانات الصور؟

في الأيام الأولى لرؤية الكمبيوتر، تضمنت زيادة بيانات الصورة بشكل أساسي تقنيات معالجة الصور الأساسية مثل قلب الصور وتدويرها واقتصاصها لزيادة تنوع مجموعة البيانات. مع تحسن الذكاء الاصطناعي، تم تقديم طرق أكثر تقدمًا، مثل تعديل الألوان (تحويلات مساحة اللون)، أو زيادة حدة الصور أو تمويهها (مرشحات kernel)، ودمج صور متعددة معًا (خلط الصور) لتحسين التعلم.

يمكن أن تحدث الزيادة قبل وأثناء تدريب النموذج. قبل التدريب، يمكن إضافة صور معدلة إلى مجموعة البيانات لتوفير المزيد من التنوع. أثناء التدريب، يمكن تغيير الصور عشوائيًا في الوقت الفعلي، مما يساعد نماذج الرؤية الاصطناعية على التكيف مع الظروف المختلفة.

يتم إجراء هذه التغييرات باستخدام التحويلات الرياضية. على سبيل المثال، يؤدي التدوير إلى إمالة الصورة، ويؤدي الاقتصاص إلى إزالة أجزاء لمحاكاة مناظر مختلفة، وتغييرات السطوع تحاكي اختلافات الإضاءة. يعمل التعتيم على تنعيم الصور، ويجعل التوضيح التفاصيل أكثر وضوحًا، ويجمع مزج الصور بين أجزاء من صور مختلفة. يمكن لأطر عمل وأدوات الذكاء الاصطناعي للرؤية مثل OpenCV و TensorFlow و PyTorch أتمتة هذه العمليات، مما يجعل التعزيز سريعًا وفعالاً.

تقنيات أساسية لزيادة بيانات الصور

الآن بعد أن ناقشنا ماهية زيادة بيانات الصور، دعنا نلقي نظرة فاحصة على بعض التقنيات الأساسية لزيادة بيانات الصور المستخدمة لتحسين بيانات التدريب.

تعديل الاتجاه والموقع

غالباً ما تحتاج نماذج الرؤية الحاسوبية مثل YOLO11 إلى التعرف على الأجسام من زوايا ووجهات نظر مختلفة. للمساعدة في ذلك، يمكن قلب الصور أفقيًا أو رأسيًا بحيث يتعلم نموذج الذكاء الاصطناعي التعرف على الأجسام من وجهات نظر مختلفة. 

وبالمثل، فإن تدوير الصور يغير زاوية رؤيتها قليلاً، مما يسمح للنموذج بتحديد الكائنات من وجهات نظر متعددة. أيضًا، يساعد تحريك الصور في اتجاهات مختلفة (الترجمة) النماذج على التكيف مع التغييرات الموضعية الصغيرة. تضمن هذه التحويلات أن النماذج تعمم بشكل أفضل على ظروف العالم الحقيقي حيث يكون موضع الكائن في الصورة غير متوقع.

__wf_reserved_inherit
الشكل 2. طرق مختلفة لتعديل البيانات المتعلقة بالاتجاه والموقع.

تغيير الحجم والاقتصاص

فيما يتعلق بحلول الرؤية الحاسوبية في العالم الحقيقي، يمكن أن تظهر الأجسام في الصور على مسافات وأحجام مختلفة. يجب أن تكون نماذج الذكاء الاصطناعي للرؤية قوية بما يكفي detect بغض النظر عن هذه الاختلافات. 

لتحسين القدرة على التكيف، يمكن استخدام طرق الزيادة التالية:

  • تغيير الحجم: يعمل تغيير الحجم على تغيير حجم الصورة مع الحفاظ على نسبها، مما يسمح لنماذج الذكاء الاصطناعي detect الأجسام على مسافات مختلفة.
  • الاقتصاص: يؤدي هذا إلى إزالة الأجزاء غير الضرورية من الصورة، مما يساعد النموذج على التركيز على المجالات الرئيسية وتقليل عوامل تشتيت الخلفية.
  • القص: يؤدي إمالة الصورة قليلاً إلى محاكاة مظهر مائل أو ممتد، مما يساعد الذكاء الاصطناعي على التعرف على الأجسام من زوايا مختلفة.

تساعد هذه التعديلات نماذج الرؤية الحاسوبية على التعرف على الكائنات حتى إذا تغير حجمها أو شكلها قليلاً.

تعديلات المنظور والتشويه

يمكن أن تظهر الأجسام في الصور بشكل مختلف اعتمادًا على زاوية الكاميرا، مما يجعل التعرف عليها صعبًا بالنسبة لنماذج رؤية الحاسوب. لمساعدة النماذج على التعامل مع هذه الاختلافات، يمكن لتقنيات زيادة البيانات تعديل كيفية تقديم الأجسام في الصور. 

على سبيل المثال، يمكن لتحويلات المنظور تغيير زاوية الرؤية، مما يجعل الكائن يبدو كما لو كان يُرى من وضع مختلف. يتيح ذلك لنماذج رؤية الذكاء الاصطناعي التعرف على الكائنات حتى عندما تكون مائلة أو تم التقاطها من وجهة نظر غير عادية. 

مثال آخر هو التحويل المرن الذي يمدد أو يثني أو يشوه الصور لمحاكاة التشوهات الطبيعية بحيث تظهر الكائنات كما تظهر في الانعكاسات أو تحت الضغط. 

تعديلات الألوان والإضاءة

يمكن أن تؤثر ظروف الإضاءة واختلافات الألوان بشكل كبير على كيفية تفسير نماذج Vision AI للصور. نظرًا لأن الكائنات يمكن أن تظهر بشكل مختلف في ظل إعدادات إضاءة مختلفة، يمكن أن تساعد تقنيات الزيادة التالية في التعامل مع هذه المواقف:

  • تعديلات السطوع والتباين: تساعد محاكاة ظروف الإضاءة المختلفة نماذج Vision AI على التعرف على الكائنات في البيئات الساطعة والمظلمة على حد سواء.
  • تغيير الألوان بشكل عشوائي (Color jittering): يؤدي تغيير اللون ودرجة التشبع وتوازن الألوان بشكل عشوائي إلى جعل نماذج رؤية الكمبيوتر أكثر قدرة على التكيف مع الكاميرات وظروف الإضاءة المختلفة.
  • تحويل الصورة إلى تدرج الرمادي: يشجع تحويل الصور إلى الأبيض والأسود نماذج Vision AI على التركيز على الأشكال والملمس بدلاً من اللون.
__wf_reserved_inherit
الشكل 3. أمثلة على الزيادات المتعلقة بتغيرات الألوان.

تقنيات متقدمة لزيادة بيانات الصور

حتى الآن، استكشفنا فقط تقنيات الزيادة التي تعدل صورة واحدة. ومع ذلك، تتضمن بعض الطرق المتقدمة دمج صور متعددة لتحسين تعلم الذكاء الاصطناعي.

على سبيل المثال، يمزج برنامج MixUp بين صورتين معًا، مما يساعد نماذج الرؤية الحاسوبية على فهم العلاقات بين الكائنات وتحسين قدرتها على التعميم عبر سيناريوهات مختلفة. ويأخذ CutMix هذا الأمر خطوة إلى الأمام من خلال استبدال جزء من صورة بجزء من صورة أخرى، مما يمكّن النماذج من التعلم من سياقات متعددة داخل الصورة نفسها. وفي الوقت نفسه، يعمل CutOut بشكل مختلف عن طريق إزالة أجزاء عشوائية من الصورة، وتدريب نماذج الذكاء الاصطناعي البصري على التعرف على الأجسام حتى عندما تكون مخفية أو معطلة جزئياً.

__wf_reserved_inherit
الشكل 4. تقنيات متقدمة لزيادة بيانات الصور.

دور الذكاء الاصطناعي التوليدي في زيادة بيانات الصور

يكتسب الذكاء الاصطناعي التوليدي شعبية في العديد من الصناعات والتطبيقات اليومية. من المحتمل أنك صادفته فيما يتعلق بالصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي، أو مقاطع الفيديو المزيفة العميقة، أو التطبيقات التي تنشئ صورًا رمزية واقعية. ولكن بالإضافة إلى الإبداع والترفيه، يلعب الذكاء الاصطناعي التوليدي دورًا حاسمًا في تدريب نماذج رؤية الذكاء الاصطناعي من خلال إنشاء صور جديدة من الصور الموجودة.

بدلًا من مجرد قلب الصور أو تدويرها، يمكنها إنشاء اختلافات واقعية - تغيير تعابير الوجه، وأنماط الملابس، أو حتى محاكاة الظروف الجوية المختلفة. تساعد هذه الاختلافات نماذج رؤية الكمبيوتر على أن تصبح أكثر تكيفًا ودقة في سيناريوهات العالم الحقيقي المتنوعة. يمكن لنماذج الذكاء الاصطناعي التوليدية المتقدمة مثل الشبكات الخصومية التوليدية (GANs) و نماذج الانتشار أيضًا ملء التفاصيل المفقودة أو إنشاء صور اصطناعية عالية الجودة.

قيود زيادة البيانات في الصور

في حين أن زيادة البيانات تحسن مجموعات بيانات التدريب، إلا أن هناك أيضًا بعض القيود التي يجب أخذها في الاعتبار. فيما يلي بعض التحديات الرئيسية المتعلقة بزيادة بيانات الصور:

  • تنوع محدود للبيانات: تأتي الصور المعززة من البيانات الموجودة ولا يمكنها تقديم أنماط جديدة تمامًا أو وجهات نظر نادرة.
  • تشويه محتمل للبيانات: يمكن للتحويلات المفرطة أن تجعل الصور غير واقعية، مما قد يقلل من دقة النموذج في سيناريوهات العالم الحقيقي.
  • زيادة الحساب: يمكن أن يتطلب التوسيع في الوقت الفعلي الذي يحدث أثناء تدريب النموذج قدرًا كبيرًا من قوة المعالجة، مما يبطئ التدريب ويزيد من استخدام الذاكرة.
  • لا يزال عدم توازن الفئات قائمًا: لا يؤدي التوسيع إلى إنشاء عينات جديدة تمامًا، لذلك قد تستمر الفئات الممثلة تمثيلاً ناقصًا في التسبب في تعلم متحيز.

تطبيق واقعي لزيادة بيانات الصور

أحد التطبيقات المثيرة للاهتمام لزيادة بيانات الصور هو في السيارات ذاتية القيادة، حيث تكون القرارات التي تتخذها نماذج الرؤية الحاسوبية مثل YOLO11 في أجزاء من الثانية حاسمة. يجب أن يكون النموذج قادراً على detect الطرق والأشخاص والأشياء الأخرى بدقة.

مع ذلك، يمكن أن تكون الظروف الواقعية التي تواجهها السيارة ذاتية القيادة غير متوقعة. يمكن أن يؤدي الطقس السيئ وضبابية الحركة والإشارات المخفية إلى تعقيد حلول رؤية الذكاء الاصطناعي في هذا القطاع. غالبًا ما لا يكفي تدريب نماذج رؤية الكمبيوتر باستخدام صور واقعية فقط. يجب أن تكون مجموعات بيانات الصور الخاصة بنماذج السيارات ذاتية القيادة متنوعة حتى يتمكن النموذج من تعلم كيفية التعامل مع المواقف غير المتوقعة.

يعالج تaugment بيانات الصور هذا عن طريق محاكاة الضباب وتعديل السطوع وتشويه الأشكال. تساعد هذه التغييرات النماذج على التعرف على الكائنات في ظروف مختلفة. ونتيجة لذلك، تصبح النماذج أكثر ذكاءً وموثوقية. 

من خلال التدريب المعزز، تتكيف حلول رؤية الذكاء الاصطناعي في السيارات ذاتية القيادة بشكل أفضل وتتخذ قرارات أكثر أمانًا. تعني النتائج الأكثر دقة عددًا أقل من الحوادث وتحسين الملاحة. 

__wf_reserved_inherit
الشكل 5. مثال على زيادة بيانات الصور فيما يتعلق بالسيارات ذاتية القيادة.

السيارات ذاتية القيادة هي مجرد مثال واحد. في الواقع، يعد تaugment البيانات المرئية أمرًا بالغ الأهمية في مجموعة واسعة من القطاعات، من التصوير الطبي إلى تحليلات البيع بالتجزئة. أي تطبيق يعتمد على الرؤية الحاسوبية يمكن أن يستفيد من تaugment البيانات المرئية.

النقاط الرئيسية

تحتاج أنظمة الذكاء الاصطناعي للرؤية إلى أن تكون قادرة على التعرف على الأشياء في ظروف مختلفة، ولكن قد يكون من الصعب جمع عدد لا نهائي من الصور الواقعية للتدريب. تعمل زيادة بيانات الصور على حل هذه المشكلة من خلال إنشاء أشكال مختلفة من الصور الموجودة، مما يساعد النماذج على التعلم بشكل أسرع وأداء أفضل في مواقف العالم الحقيقي. كما أنه يحسّن الدقة، مما يضمن قدرة نماذج الذكاء الاصطناعي للرؤية مثل YOLO11 على التعامل مع الإضاءة والزوايا والبيئات المختلفة.

بالنسبة للشركات والمطورين، فإن زيادة بيانات الصور توفر الوقت والجهد مع جعل نماذج رؤية الكمبيوتر أكثر موثوقية. من الرعاية الصحية إلى السيارات ذاتية القيادة، تعتمد عليها العديد من الصناعات. مع استمرار تطور Vision AI، ستظل الزيادة جزءًا أساسيًا من بناء نماذج أكثر ذكاءً وقابلة للتكيف للمستقبل.

انضموا إلى مجتمعنا وقوموا بزيارة مستودع GitHub الخاص بنا لمشاهدة الذكاء الاصطناعي وهو يعمل. استكشفوا خيارات الترخيص الخاصة بنا واكتشفوا المزيد حول الذكاء الاصطناعي في الزراعة و رؤية الكمبيوتر في التصنيع على صفحات الحلول الخاصة بنا.

لنبنِ مستقبل
الذكاء الاصطناعي معًا!

ابدأ رحلتك مع مستقبل تعلم الآلة

ابدأ مجانًا