تحسين متانة نماذج الذكاء الاصطناعي بزيادة البيانات
اكتشف كيف تساعد إضافة اختلافات واقعية إلى بيانات التدريب من خلال زيادة البيانات في تحسين متانة نماذج الذكاء الاصطناعي والأداء في العالم الحقيقي.

يُعد الاختبار جزءًا حاسمًا في بناء أي حل تقني. فهو يوضح للفرق كيفية عمل النظام فعليًا قبل إطلاقه ويسمح لهم بإصلاح المشكلات مبكرًا. وينطبق هذا على العديد من المجالات، بما في ذلك الذكاء الاصطناعي، حيث يُتوقع من النماذج التعامل مع ظروف واقعية غير متوقعة بمجرد نشرها.
على سبيل المثال، الرؤية الحاسوبية هي فرع من فروع الذكاء الاصطناعي يعلم الآلات فهم الصور ومقاطع الفيديو. تدعم نماذج الرؤية الحاسوبية مثل Ultralytics YOLO26 مهام مثل اكتشاف الكائنات، وتجزئة المثيلات، وتصنيف الصور.
يمكن استخدامها في العديد من الصناعات لتطبيقات مثل مراقبة المرضى، وتحليل حركة المرور، والدفع الآلي، وفحص الجودة في التصنيع. ومع ذلك، حتى مع النماذج المتقدمة وبيانات التدريب عالية الجودة، لا تزال حلول رؤية الذكاء الاصطناعي قد تواجه صعوبات بمجرد مواجهتها لمتغيرات العالم الحقيقي مثل تغير الإضاءة، أو الحركة، أو الكائنات المحجوبة جزئيًا.
يحدث هذا لأن النماذج تتعلم من الأمثلة التي تُقدم لها أثناء التدريب. وإذا لم ترَ ظروفًا مثل الوهج، أو ضبابية الحركة، أو الرؤية الجزئية من قبل، فمن غير المرجح أن تتعرف على الكائنات بشكل صحيح في تلك السيناريوهات.
إحدى طرق تحسين متانة النموذج هي من خلال زيادة البيانات. بدلاً من جمع كميات كبيرة من البيانات الجديدة، يمكن للمهندسين إجراء تغييرات صغيرة وهادفة على الصور الموجودة، مثل ضبط الإضاءة، أو القص، أو دمج الصور. يساعد هذا النموذج على تعلم التعرف على نفس الكائنات عبر مجموعة واسعة من المواقف.
في هذه المقالة، سنستكشف كيف تعمل زيادة البيانات على تعزيز متانة النموذج وموثوقية أنظمة رؤية الذكاء الاصطناعي عند نشرها خارج الإعدادات الخاضعة للرقابة. لنبدأ!
Link to this sectionكيفية التحقق من متانة النموذج#
قبل الغوص في زيادة البيانات، دعونا نناقش كيفية معرفة ما إذا كان نموذج الرؤية الحاسوبية جاهزًا حقًا للاستخدام في العالم الحقيقي.
يستمر النموذج المتين في الأداء الجيد حتى عند تغير الظروف، بدلاً من العمل فقط على صور نظيفة ومصنفة بشكل مثالي. إليك بعض العوامل العملية التي يجب مراعاتها عند تقييم متانة نموذج الذكاء الاصطناعي:
- تغيرات الإضاءة: قد تتصرف النماذج بشكل مختلف عند تعرضها لضوء ساطع، أو إضاءة منخفضة، أو وهج، أو ظلال، مما قد يؤثر على مدى ثقة اكتشاف الكائنات.
- الإخفاء الجزئي: في المشاهد اليومية، غالبًا ما تكون الكائنات محجوبة بواسطة عناصر أخرى أو تكون مرئية جزئيًا فقط. النموذج الأكثر متانة قادر على التعرف عليها حتى مع وجود معلومات بصرية مفقودة.
- المشاهد المزدحمة: يمكن للبيئات التي تحتوي على العديد من الكائنات المتداخلة أن تجعل الاكتشاف أكثر صعوبة. النماذج التي تعمل بشكل جيد في هذه الحالات تكون عادةً أكثر موثوقية في الإعدادات المعقدة.
لا تترجم النتائج الجيدة على الصور النظيفة والملتقطة بشكل مثالي دائمًا إلى أداء قوي في العالم الحقيقي. يساعد الاختبار المنتظم عبر ظروف متنوعة في إظهار مدى جودة صمود النموذج بمجرد نشره.
Link to this sectionما هي زيادة البيانات؟#
يمكن أن تتغير الطريقة التي يظهر بها كائن في صورة بناءً على الإضاءة، أو الزاوية، أو المسافة، أو الخلفية. عند تدريب نموذج رؤية حاسوبية، يجب أن تتضمن مجموعة البيانات التي يتعلم منها هذا النوع من التباين حتى يتمكن من الأداء بشكل جيد في بيئات غير متوقعة.
تعمل زيادة البيانات على توسيع مجموعة بيانات التدريب من خلال إنشاء أمثلة إضافية من الصور التي تمتلكها بالفعل. يتم ذلك عن طريق تطبيق تغييرات متعمدة مثل تدوير الصورة أو قلبها، أو ضبط السطوع، أو قص جزء منها.
على سبيل المثال، تخيل أن لديك صورة واحدة فقط لقطة. إذا قمت بتدوير الصورة أو تغيير سطوعها، يمكنك إنشاء عدة إصدارات جديدة من تلك الصورة الواحدة. يبدو كل إصدار مختلفًا قليلاً، لكنها لا تزال صورة لنفس القطة. تساعد هذه الاختلافات في تعليم النموذج أن الكائن يمكن أن يبدو مختلفًا بينما يظل هو نفسه.

الشكل 1. نظرة على زيادة صورة قطة (المصدر)
Link to this sectionكيف تعمل زيادة البيانات على تحسين أداء النموذج#
أثناء تدريب النموذج، يمكن دمج زيادة البيانات مباشرة في خط أنابيب التدريب. بدلاً من إنشاء نسخ جديدة من الصور وتخزينها يدويًا، يمكن تطبيق تحويلات عشوائية عند تحميل كل صورة.
هذا يعني أن النموذج يرى نسخة مختلفة قليلاً من الصورة في كل مرة، سواء كانت تظهر أكثر سطوعًا، أو مقلوبة، أو مخفية جزئيًا. يمكن لتقنيات مثل المسح العشوائي حتى إزالة مناطق صغيرة من الصورة لمحاكاة مواقف العالم الحقيقي حيث يكون الكائن محجوبًا أو مرئيًا جزئيًا فقط.

الشكل 2. أمثلة على الزيادة القائمة على المسح العشوائي (المصدر)
رؤية العديد من الإصدارات المختلفة لنفس الصورة تجعل من الممكن للنموذج تعلم السمات المهمة، بدلاً من الاعتماد على مثال واحد مثالي. يبني هذا التنوع متانة نموذج الذكاء الاصطناعي حتى يتمكن من الأداء بشكل أكثر موثوقية في ظروف العالم الحقيقي.
Link to this sectionتقنيات زيادة البيانات الشائعة#
إليك بعض تقنيات زيادة البيانات المستخدمة لتقديم التباين في صور التدريب:
- التحويلات الهندسية: تغير هذه التقنيات كيفية ظهور الكائن مكانيًا داخل الصورة. تدوير الصورة، أو قلبها، أو تغيير حجمها، أو قصها، أو تحريكها يُمكّن النموذج من فهم كيفية رؤية الكائن من زوايا أو مسافات مختلفة.
- تعديلات الألوان والإضاءة: نادرًا ما تكون إضاءة العالم الحقيقي متسقة. يمكن أن تكون الصور ساطعة جدًا، أو داكنة جدًا، أو ذات لون مختلف قليلاً، اعتمادًا على البيئة أو الكاميرا المستخدمة. يسمح ضبط السطوع، والتباين، ودرجة اللون، والتشبع للنماذج بالتعامل مع هذه التغيرات البصرية والأداء بشكل جيد عبر مشاهد مختلفة.
- تغيرات جودة الصورة: يمكن أن تجعل الضبابية أو الضوضاء البصرية الصور تبدو غير واضحة. تساعد إضافة الضبابية أو الضوضاء أثناء التدريب النموذج على تعلم التعامل مع ضبابية الحركة، أو الصور ذات الإضاءة المنخفضة، أو نتائج الكاميرا منخفضة الجودة، ليصبح أقل حساسية للمرئيات غير المثالية.
- زيادات قائمة على الإخفاء: في البيئات الحقيقية، غالبًا ما تكون الكائنات محجوبة جزئيًا بواسطة كائنات أخرى. يُشار إلى هذا باسم إخفاء الصور. يساعد إخفاء أو حجب مناطق صغيرة من الصورة أثناء التدريب النموذج في تعلم اكتشاف الكائنات حتى عندما يكون جزء منها فقط مرئيًا.
- زيادات متعددة الصور: تدمج هذه التقنيات أجزاءً من صور متعددة في مثال تدريب واحد، مما يمكن أن يزيد من عدد الكائنات المعروضة ويحسن قدرة النموذج على التعامل مع المشاهد المعقدة أو المزدحمة.

الشكل 3. مثال على زيادة متعددة الصور (المصدر)
Link to this sectionأصبحت زيادة البيانات سهلة مع حزمة Python الخاصة بـ Ultralytics#
يمكن أن تضيف إدارة مجموعات البيانات، وإنشاء تنويعات للصور، وكتابة كود التحويل خطوات إضافية لبناء تطبيق رؤية حاسوبية. تساعد حزمة Python الخاصة بـ Ultralytics في تبسيط ذلك من خلال توفير واجهة واحدة لتدريب، وتشغيل، ونشر نماذج Ultralytics YOLO مثل YOLO26. كجزء من هذا الجهد لتبسيط عمليات التدريب، تتضمن الحزمة زيادة بيانات مدمجة ومختبرة من قبل Ultralytics ومحسنة لنماذج YOLO.
كما أنها تدعم عمليات تكامل مفيدة تلغي الحاجة إلى أدوات منفصلة أو كود مخصص. على وجه التحديد، بالنسبة لزيادة البيانات، تتكامل الحزمة مع Albumentations، وهي مكتبة زيادة صور مستخدمة على نطاق واسع. يسمح هذا التكامل بتطبيق الزيادات تلقائيًا أثناء التدريب، دون الحاجة إلى نصوص برمجية إضافية أو كود مخصص.
Link to this sectionإدارة التعليقات التوضيحية ومجموعات البيانات الموسعة#
عامل آخر يؤثر على متانة النموذج هو جودة التعليق التوضيحي. تساعد التسميات النظيفة والدقيقة، التي يتم إنشاؤها وإدارتها باستخدام أدوات التعليق التوضيحي مثل Roboflow، النموذج على فهم مكان وجود الكائنات وما تبدو عليه.
أثناء التدريب، يتم تطبيق زيادات البيانات مثل القلب، والقص، والتدوير ديناميكيًا، ويتم تعديل التعليقات التوضيحية تلقائيًا لتتناسب مع هذه التغييرات. عندما تكون التسميات دقيقة، تعمل هذه العملية بسلاسة وتوفر للنموذج العديد من الأمثلة الواقعية لنفس المشهد.
إذا كانت التعليقات التوضيحية غير دقيقة أو غير متسقة، فقد تنتهي هذه الأخطاء بالتكرار عبر الصور الموسعة، مما قد يجعل التدريب أقل فعالية. البدء بتعليقات توضيحية دقيقة يمنع انتشار هذه الأخطاء ويساهم في تحقيق متانة أفضل للنموذج.
Link to this sectionتعزيز تطبيقات رؤية الذكاء الاصطناعي بزيادة البيانات#
بعد ذلك، دعونا نمر عبر أمثلة لكيفية مساهمة زيادة البيانات في متانة نموذج الذكاء الاصطناعي في تطبيقات العالم الحقيقي.
Link to this sectionتعزيز دقة اكتشاف الكائنات في البيئات الحقيقية#
غالبًا ما تُستخدم الصور الاصطناعية لتدريب أنظمة اكتشاف الكائنات عندما تكون البيانات الحقيقية محدودة، أو حساسة، أو يصعب جمعها. فهي تسمح للفرق بإنشاء أمثلة للمنتجات، والبيئات، وزوايا الكاميرا بسرعة دون الحاجة إلى التقاط كل سيناريو في الحياة الواقعية.
ومع ذلك، يمكن أن تبدو مجموعات البيانات الاصطناعية أحيانًا نظيفة جدًا مقارنة بلقطات العالم الحقيقي، حيث تتغير الإضاءة، وتتداخل الكائنات، وتتضمن المشاهد فوضى في الخلفية. تساعد زيادة البيانات في سد هذه الفجوة من خلال تقديم تنويعات واقعية، مثل الإضاءة المختلفة، أو الضوضاء، أو وضع الكائن، حتى يتعلم النموذج التعامل مع أنواع الظروف التي سيراها عند نشره.
على سبيل المثال، في دراسة حديثة، تم تدريب نموذج YOLO11 بالكامل على صور اصطناعية، وأضيفت زيادة البيانات لتقديم تنوع إضافي. لعب هذا دورًا في تعلم النموذج التعرف على الكائنات بشكل أوسع. وقد أدى أداءً جيدًا عند اختباره على صور حقيقية، على الرغم من أنه لم يرَ بيانات العالم الحقيقي أبدًا أثناء التدريب.
Link to this sectionجعل حلول التصوير الطبي أكثر موثوقية#
غالبًا ما تكون مجموعات بيانات التصوير الطبي محدودة، ويمكن أن تختلف عمليات المسح نفسها بناءً على نوع المعدات، أو إعدادات التصوير، أو البيئة السريرية. يمكن أن تجعل الاختلافات في تشريح المريض، أو الزوايا، أو الإضاءة، أو الضوضاء البصرية من الصعب على نماذج الرؤية الحاسوبية تعلم أنماط تعمم بشكل جيد عبر المرضى والمستشفيات.
تساعد زيادة البيانات في معالجة ذلك من خلال إنشاء تنويعات متعددة لنفس المسح أثناء التدريب، مثل إضافة الضوضاء، أو تحريك الصورة قليلاً، أو تطبيق تشوهات صغيرة. تجعل هذه التغييرات بيانات التدريب تبدو أكثر تمثيلاً للظروف السريرية الحقيقية.
على سبيل المثال، في دراسة حول التصوير لدى الأطفال، استخدم الباحثون YOLO11 للتجزئة التشريحية وقاموا بتدريبه على بيانات طبية موسعة. قدموا تنويعات مثل الضوضاء المضافة، وتحولات الموقع الطفيفة، والتشوهات الصغيرة لجعل الصور أكثر واقعية.

الشكل 4. صور طبية أصلية وموسعة للأطفال (المصدر)
من خلال التعلم من هذه التغيرات، ركز النموذج على السمات التشريحية الهامة بدلاً من الاختلافات على مستوى السطح. وهذا جعل نتائج تجزئته أكثر استقرارًا عبر عمليات المسح المختلفة وحالات المرضى.
Link to this sectionأبرز النقاط#
يعد جمع بيانات متنوعة أمرًا صعبًا، ولكن زيادة البيانات تسمح للنماذج بالتعلم من مجموعة أوسع من الظروف البصرية. يؤدي هذا إلى متانة أقوى للنموذج عند التعامل مع الإخفاء، وتغيرات الإضاءة، والمشاهد المزدحمة. بشكل عام، يساعدهم هذا على الأداء بشكل أكثر موثوقية خارج بيئات التدريب الخاضعة للرقابة.
انضم إلى مجتمعنا واستكشف أحدث تقنيات رؤية الذكاء الاصطناعي على مستودع GitHub الخاص بنا. تفضل بزيارة صفحات الحلول الخاصة بنا لمعرفة كيف تقود تطبيقات مثل الذكاء الاصطناعي في التصنيع والرؤية الحاسوبية في الرعاية الصحية التقدم، وتحقق من خيارات الترخيص لدينا لتشغيل حل الذكاء الاصطناعي التالي الخاص بك.






