استكشف أساسيات تصنيف الصور، من شبكات CNN إلى استخدامات الذكاء الاصطناعي في العالم الواقعي. تعلم كيفية تدريب ونشر مصنفات متطورة باستخدام Ultralytics .
تصنيف الصور هو مهمة أساسية في الرؤية الحاسوبية (CV) حيث يقوم نموذج التعلم الآلي بتحليل الصورة بأكملها ويخصص لها تسمية واحدة من مجموعة محددة مسبقًا من الفئات. في الأساس، يجيب على السؤال "ما هو الموضوع الرئيسي لهذه الصورة؟" كعنصر أساسي في الذكاء الاصطناعي (AI)، تتيح هذه العملية للأنظمة الآلية تنظيم البيانات المرئية وتصنيفها وتفسيرها على نطاق واسع. على الرغم من أن الأمر قد يبدو بسيطًا للعين البشرية، فإن تمكين أجهزة الكمبيوتر من التعرف على الأنماط يتطلب خوارزميات تعلم آلي (ML) متطورة لسد الفجوة بين وحدات البكسل الخام والمفاهيم ذات المعنى.
يعتمد تصنيف الصور الحديث بشكل كبير على بنى التعلم العميق (DL) المعروفة باسم الشبكات العصبية التلافيفية (CNNs). تم تصميم هذه الشبكات لتقليد الطريقة التي تعالج بها القشرة البصرية البيولوجية المعلومات. من خلال عملية تسمى استخراج الميزات، يتعلم النموذج تحديد السمات منخفضة المستوى مثل الحواف والأنسجة في الطبقات المبكرة، ليقوم في النهاية بدمجها للتعرف على الأشكال والأجسام المعقدة في الطبقات الأعمق.
لبناء مصنف، يستخدم المطورون التعلم الخاضع للإشراف، حيث يزودون النموذج بكميات هائلة من بيانات التدريب التي تحتوي على أمثلة مصنفة. مجموعات البيانات العامة الكبيرة مثل ImageNet كانت مفيدة في تحسين دقة هذه الأنظمة. خلال مرحلة الاستدلال، ينتج النموذج درجة احتمالية لكل فئة، غالبًا باستخدام وظيفة softmax لتحديد الفئة الأكثر احتمالية .
من المهم التمييز بين تصنيف الصور وقدرات الرؤية الحاسوبية ذات الصلة، حيث أن اختيار التقنية يعتمد على المشكلة المحددة:
تدعم تصنيف الصور مجموعة واسعة من تطبيقات الذكاء الاصطناعي في العالم الواقعي في مختلف الصناعات:
في المجال الطبي، تساعد نماذج التصنيف أخصائيي الأشعة من خلال تحليل الفحوصات التشخيصية. يمكن لأدوات تحليل الصور الطبية أن تصنف بسرعة الأشعة السينية أو التصوير بالرنين المغناطيسي على أنها "طبيعية" أو "غير طبيعية"، أو تحديد حالات محددة مثل الكشف عن الأورام، مما يتيح فرز المرضى وتشخيص حالاتهم بشكل أسرع.
تستخدم المصانع الفحص البصري الآلي للحفاظ على معايير المنتجات. تلتقط الكاميرات الموجودة على خطوط التجميع صورًا للمكونات، وتقوم نماذج التصنيف بصنفتها على الفور إلى "مقبولة" أو "مرفوضة" بناءً على العيوب الظاهرة. يضمن هذا التحكم الآلي في الجودة وصول العناصر غير المعيبة فقط إلى مرحلة التعبئة والتغليف.
يستفيد المزارعون من الذكاء الاصطناعي في الزراعة لمراقبة صحة المحاصيل. من خلال تصنيف الصور الملتقطة بواسطة الطائرات بدون طيار أو الهواتف الذكية، يمكن للأنظمة تحديد علامات المرض أو نقص المغذيات أو الإصابة بالآفات، مما يتيح تدخلات زراعية دقيقة وموجهة.
يُعرف إطار عمل Ultralytics بقدرته على الكشف، كما يوفر أداءً متطورًا في مهام تصنيف الصور. تم تحسين بنيته من حيث السرعة والدقة، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي.
فيما يلي مثال موجز عن كيفية تحميل نموذج مدرب مسبقًا classify باستخدام
ultralytics حزمة Python :
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")
بالنسبة للفرق التي تسعى إلى تبسيط سير عملها، تعمل Ultralytics على تبسيط العملية برمتها. فهي تتيح للمستخدمين إدارة مجموعات بيانات التصنيف، وإجراء التدريب القائم على السحابة ، ونشر النماذج بتنسيقات مختلفة مثل ONNX أو TensorRT دون الحاجة إلى بنية تحتية واسعة النطاق للبرمجة.