Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تصنيف الصور

استكشف أساسيات تصنيف الصور، من شبكات CNN إلى استخدامات الذكاء الاصطناعي في العالم الواقعي. تعلم كيفية تدريب ونشر مصنفات متطورة باستخدام Ultralytics .

تصنيف الصور هو مهمة أساسية في الرؤية الحاسوبية (CV) حيث يقوم نموذج التعلم الآلي بتحليل الصورة بأكملها ويخصص لها تسمية واحدة من مجموعة محددة مسبقًا من الفئات. في الأساس، يجيب على السؤال "ما هو الموضوع الرئيسي لهذه الصورة؟" كعنصر أساسي في الذكاء الاصطناعي (AI)، تتيح هذه العملية للأنظمة الآلية تنظيم البيانات المرئية وتصنيفها وتفسيرها على نطاق واسع. على الرغم من أن الأمر قد يبدو بسيطًا للعين البشرية، فإن تمكين أجهزة الكمبيوتر من التعرف على الأنماط يتطلب خوارزميات تعلم آلي (ML) متطورة لسد الفجوة بين وحدات البكسل الخام والمفاهيم ذات المعنى.

الآلية الكامنة وراء التصنيف

يعتمد تصنيف الصور الحديث بشكل كبير على بنى التعلم العميق (DL) المعروفة باسم الشبكات العصبية التلافيفية (CNNs). تم تصميم هذه الشبكات لتقليد الطريقة التي تعالج بها القشرة البصرية البيولوجية المعلومات. من خلال عملية تسمى استخراج الميزات، يتعلم النموذج تحديد السمات منخفضة المستوى مثل الحواف والأنسجة في الطبقات المبكرة، ليقوم في النهاية بدمجها للتعرف على الأشكال والأجسام المعقدة في الطبقات الأعمق.

لبناء مصنف، يستخدم المطورون التعلم الخاضع للإشراف، حيث يزودون النموذج بكميات هائلة من بيانات التدريب التي تحتوي على أمثلة مصنفة. مجموعات البيانات العامة الكبيرة مثل ImageNet كانت مفيدة في تحسين دقة هذه الأنظمة. خلال مرحلة الاستدلال، ينتج النموذج درجة احتمالية لكل فئة، غالبًا باستخدام وظيفة softmax لتحديد الفئة الأكثر احتمالية .

التصنيف مقابل مهام الرؤية الأخرى

من المهم التمييز بين تصنيف الصور وقدرات الرؤية الحاسوبية ذات الصلة، حيث أن اختيار التقنية يعتمد على المشكلة المحددة:

  • التصنيف مقابل اكتشاف الكائنات: يُعطي التصنيف تسمية واحدة للصورة بأكملها. في المقابل، يحدد اكتشاف الكائنات موقع عدة كائنات داخل مشهد ما عن طريق رسم مربع حدودي حول كل منها.
  • التصنيف مقابل تقسيم الصورة: بينما يراعي التصنيف السياق العام، يوفر التقسيم دقة على مستوى البكسل. يقوم التقسيم الدلالي بتصنيف كل بكسل على حدة، مما يسمح بتحديد الحدود بدقة بين الكائنات والخلفية.

تطبيقات واقعية

تدعم تصنيف الصور مجموعة واسعة من تطبيقات الذكاء الاصطناعي في العالم الواقعي في مختلف الصناعات:

تشخيص الرعاية الصحية

في المجال الطبي، تساعد نماذج التصنيف أخصائيي الأشعة من خلال تحليل الفحوصات التشخيصية. يمكن لأدوات تحليل الصور الطبية أن تصنف بسرعة الأشعة السينية أو التصوير بالرنين المغناطيسي على أنها "طبيعية" أو "غير طبيعية"، أو تحديد حالات محددة مثل الكشف عن الأورام، مما يتيح فرز المرضى وتشخيص حالاتهم بشكل أسرع.

مراقبة الجودة في التصنيع

تستخدم المصانع الفحص البصري الآلي للحفاظ على معايير المنتجات. تلتقط الكاميرات الموجودة على خطوط التجميع صورًا للمكونات، وتقوم نماذج التصنيف بصنفتها على الفور إلى "مقبولة" أو "مرفوضة" بناءً على العيوب الظاهرة. يضمن هذا التحكم الآلي في الجودة وصول العناصر غير المعيبة فقط إلى مرحلة التعبئة والتغليف.

الزراعة الذكية

يستفيد المزارعون من الذكاء الاصطناعي في الزراعة لمراقبة صحة المحاصيل. من خلال تصنيف الصور الملتقطة بواسطة الطائرات بدون طيار أو الهواتف الذكية، يمكن للأنظمة تحديد علامات المرض أو نقص المغذيات أو الإصابة بالآفات، مما يتيح تدخلات زراعية دقيقة وموجهة.

تنفيذ التصنيف باستخدام YOLO26

يُعرف إطار عمل Ultralytics بقدرته على الكشف، كما يوفر أداءً متطورًا في مهام تصنيف الصور. تم تحسين بنيته من حيث السرعة والدقة، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي.

فيما يلي مثال موجز عن كيفية تحميل نموذج مدرب مسبقًا classify باستخدام ultralytics حزمة Python :

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

بالنسبة للفرق التي تسعى إلى تبسيط سير عملها، تعمل Ultralytics على تبسيط العملية برمتها. فهي تتيح للمستخدمين إدارة مجموعات بيانات التصنيف، وإجراء التدريب القائم على السحابة ، ونشر النماذج بتنسيقات مختلفة مثل ONNX أو TensorRT دون الحاجة إلى بنية تحتية واسعة النطاق للبرمجة.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن