اكتشف تصنيف الصور باستخدام Ultralytics YOLO: قم بتدريب نماذج مخصصة للرعاية الصحية والزراعة والبيع بالتجزئة والمزيد باستخدام أدوات متطورة.
تصنيف الصور هو مهمة أساسية في الرؤية الحاسوبية (CV) تتضمن تعيين تسمية واحدة ومحددة لصورة كاملة من مجموعة محددة مسبقًا من الفئات. الهدف الأساسي هو تحديد الموضوع الرئيسي للصورة وتصنيفه وفقًا لذلك. على سبيل المثال، سيقوم نموذج التصنيف بتحليل صورة وإخراج تسمية مثل "قطة" أو "كلب" أو "سيارة". تشكل هذه المهمة الأساس للعديد من تطبيقات الرؤية الحاسوبية الأكثر تعقيدًا وهي عنصر أساسي في التعلم الآلي (ML). تعتمد العملية على الخوارزميات، وأبرزها الشبكات العصبية التلافيفية (CNNs)، لتعلم الميزات المميزة من مجموعات البيانات الكبيرة المسماة.
يتم تدريب نماذج تصنيف الصور باستخدام التعلم الخاضع للإشراف، حيث يتم تزويدها بعدد كبير من الصور التي تم تصنيفها يدويًا بالفعل بالفئة الصحيحة. أثناء التدريب، تتعلم الشبكة العصبية تحديد الأنماط والأنسجة والأشكال ومجموعات الألوان المرتبطة بكل فئة. يتم تحقيق هذا التعلم من خلال عملية تسمى الانتشار الخلفي، والتي تضبط المعلمات الداخلية للنموذج، أو الأوزان، لتقليل الفرق بين تنبؤاته والتسميات الفعلية.
غالبًا ما تستخدم نماذج التصنيف الحديثة بنى التعلم العميق مع العديد من الطبقات. قد تتعلم الطبقات المبكرة التعرف على الميزات البسيطة مثل الحواف والزوايا، بينما تجمع الطبقات الأعمق هذه لتحديد هياكل أكثر تعقيدًا مثل العيون أو العجلات أو الوجوه. تستخدم الطبقة الأخيرة من الشبكة عادةً دالة softmax لإنتاج درجة احتمالية لكل فئة ممكنة. يتم اختيار الفئة ذات الاحتمالية الأعلى باعتبارها التنبؤ النهائي. المفتاح في هذه العملية هو استخراج الميزات، حيث يتعلم النموذج تلقائيًا الميزات الأكثر إفادة لمهمة التصنيف.
يستخدم تصنيف الصور في العديد من الصناعات لأتمتة وتوسيع نطاق مهام التعرف البصري. ومن الأمثلة البارزة على ذلك:
في حين أنها وثيقة الصلة بمهام الرؤية الحاسوبية الأخرى، إلا أن لتصنيف الصور غرضًا متميزًا. من المهم تمييزه عن:
باختصار، يخبرك التصنيف ماذا يوجد في الصورة، ويكشف الاكتشاف ماذا و أين، بينما يوفر التقسيم خريطة مفصلة على مستوى البكسل لكل شيء في المشهد.
في حين أن نماذج Ultralytics YOLO مشهورة باكتشاف الكائنات، إلا أنها تتفوق أيضًا في مهام تصنيف الصور (image classification tasks). يمكن بسهولة تدريب أو ضبط أحدث النماذج مثل YOLOv8 على مجموعات بيانات مخصصة باستخدام حزمة Ultralytics Python سهلة الاستخدام أو منصة Ultralytics HUB بدون تعليمات برمجية.
توفر وثائقنا موارد واسعة النطاق، بما في ذلك نصائح تدريب النموذج ودليل مفصل حول كيفية استخدام YOLO11 لتصنيف الصور. يمكن للمطورين الاستفادة من النماذج المدربة مسبقًا على مجموعات البيانات القياسية مثل ImageNet و CIFAR-100 و Caltech-101 أو تدريب نموذج جديد من البداية. بالنسبة لأولئك المهتمين بأحدث التطورات، توفر موارد مثل Papers With Code نظرة عامة شاملة على أفضل النماذج أداءً. يمكنك أيضًا مقارنة أداء نموذج YOLO على المعايير القياسية. توفر أطر العمل مثل PyTorch و TensorFlow الأساس لبناء وتدريب هذه النماذج.