مسرد المصطلحات

تصنيف الصور

اكتشف تصنيف الصور باستخدام Ultralytics YOLO : قم بتدريب نماذج مخصصة للرعاية الصحية والزراعة وتجارة التجزئة وغيرها باستخدام أدوات متطورة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تصنيف الصور هو مهمة أساسية في مجال الرؤية الحاسوبية (CV) تتضمن تعيين تسمية أو فئة واحدة لصورة كاملة بناءً على محتواها المرئي. إنها قدرة أساسية في الذكاء الاصطناعي (AI)، مما يمكّن الآلات من فهم الصور وتصنيفها بشكل مشابه لكيفية تعرّف البشر على المشاهد أو الأشياء. يهدف تصنيف الصور، المدعوم بتقنيات التعلّم الآلي (ML) وخاصةً تقنيات التعلّم العميق (DL) ، إلى الإجابة عن السؤال "ما هو الموضوع الأساسي لهذه الصورة؟ تعمل هذه المهمة كلبنة أساسية للعديد من مشاكل الفهم البصري الأكثر تعقيدًا.

كيفية عمل تصنيف الصور

عادةً ما تتضمن العملية تدريب نموذج، غالباً ما يكون نوعاً متخصصاً من الشبكات العصبية يسمى الشبكة العصبية التلافيفية (CNN)، على مجموعة بيانات كبيرة من الصور المصنفة. تُستخدم مجموعات البيانات الشهيرة مثل ImageNet، التي تحتوي على ملايين الصور عبر آلاف الفئات، بشكل شائع لتدريب نماذج قوية. أثناء التدريب، يتعلم النموذج تحديد الأنماط والسمات المميزة - مثل القوام والأشكال والحواف وتوزيعات الألوان - التي تميز الفئات المختلفة. أطر عمل مثل PyTorch و TensorFlow الأدوات والمكتبات اللازمة لبناء نماذج التعلم العميق هذه وتدريبها. يمكنك استكشاف مجموعات بيانات تصنيفUltralytics المختلفة مثل CIFAR-100 أو MNIST لبدء مشاريعك الخاصة. الهدف النهائي هو أن يتنبأ النموذج المُدرَّب بدقة بتسمية الفئة للصور الجديدة التي لم يسبق رؤيتها. للحصول على فهم تقني أعمق للآليات الأساسية، تقدم موارد مثل دورة ستانفورد CS231n حول الشبكات العصبية التلافيفية للتعرف البصري مواد شاملة.

الاختلافات الرئيسية عن مهام الرؤية الأخرى

يركز تصنيف الصور على تعيين تسمية واحدة شاملة للصورة بأكملها. وهذا يجعله مختلفًا عن مهام الرؤية الحاسوبية الشائعة الأخرى:

  • اكتشاف الكائن: تتقدم هذه المهمة خطوة إلى الأمام ليس فقط بتصنيف الكائنات داخل الصورة ولكن أيضًا بتحديد موقعها، وعادةً ما يتم ذلك من خلال رسم مربعات محددة حول كل مثيل تم اكتشافه. وهي تجيب على السؤال "ما هي الكائنات الموجودة في هذه الصورة وأين تقع؟
  • تجزئة الصور: يتضمن ذلك تصنيف كل بكسل في الصورة.
    • التقسيم الدلالي يعيّن تسمية فئة (مثل "سيارة" أو "طريق" أو "سماء") لكل بكسل، دون التمييز بين الحالات المختلفة للفئة نفسها.
    • تجزئة المثيل يميّز بين المثيلات الفردية للأجسام، مع تعيين معرّف فريد لوحدات البكسل التي تنتمي إلى كل جسم منفصل (على سبيل المثال، تسمية "سيارة 1" و"سيارة 2").

يعد فهم هذه الاختلافات أمرًا بالغ الأهمية لاختيار التقنية المناسبة لمشكلة معينة، حيث توفر كل مهمة مستوى مختلفًا من التفاصيل حول محتوى الصورة.

التطبيقات الواقعية

يُستخدم تصنيف الصور على نطاق واسع في مختلف المجالات نظرًا لفعاليته في تصنيف المعلومات المرئية:

تصنيف الصور باستخدام Ultralytics

على الرغم من شهرة نماذج Ultralytics YOLO باكتشاف الأجسام، إلا أنها تُظهر أيضاً أداءً قوياً في مهام تصنيف الصور. البنى الحديثة مثل Ultralytics YOLO11 يمكن تدريبها أو ضبطها بسهولة للتصنيف باستخدام حزمةUltralytics Python البديهية أو منصة Ultralytics HUB التي لا تحتوي على رموز. توفر هذه الأدوات موارد شاملة، بما في ذلك نصائح لتدريب النماذج ووثائق واضحة، مثل الدليل الخاص بكيفية استخدام Ultralytics YOLO11 لتصنيف الصور. لمزيد من الممارسة، فكّر في استكشاف البرامج التعليمية لتصنيفPyTorch أو المشاركة في مسابقات Kaggle لتصنيف الصور. للبقاء على اطلاع على أحدث التطورات البحثية، فإن موارد مثل Papers With Code لا تقدر بثمن. يمكنك أيضًا مقارنة أداء نموذج YOLO على المعايير القياسية.

قراءة الكل