اكتشف كيف يحسن تجزئة المثيل (instance segmentation) اكتشاف الكائنات بدقة على مستوى البكسل، مما يتيح أقنعة كائنات مفصلة لتطبيقات الذكاء الاصطناعي.
تجزئة المثيل هي تقنية متطورة الرؤية الحاسوبية (CV) المتطورة التي تحدد وتحدد موقع الكائنات الفردية داخل الصورة على مستوى البكسل. على عكس اكتشاف الأجسام، والتي تقارب موقع الجسم موقع كائن ما باستخدام مربع مستطيل محدّد، فإن تجزئة المثيل يُنشئ التجزئة قناعًا دقيقًا يحدد الشكل الدقيق لكل كائن مميز. هذا المستوى الدقيق من من التفاصيل يسمح للأنظمة بالتمييز بين حالات متعددة من نفس الفئة - مثل الفصل بين سيارتين متداخلتين سيارتين متداخلتين أو أشخاص منفردين في حشد من الناس - مما يجعله عنصراً حاسماً في الذكاء الاصطناعي المتقدم المتقدم.
لفهم تجزئة المثيل فهماً كاملاً، من المفيد مقارنته بمهام أساسية أخرى الأساسية الأخرى للرؤية الحاسوبية:
يدمج تجزئة المثيل بشكل فعال بين إمكانيات تحديد موقع الكشف عن الكائنات مع الدقة على مستوى البكسل دقة التجزئة الدلالية على مستوى البكسل.
تستخدم نماذج تجزئة المثيل بشكل عام معماريات التعلم العميق (DL) ، وتحديداً الشبكات العصبية التلافيفية (CNNs)، لاستخراج الميزات من الصورة. تتضمن العملية عادةً خطوتين متوازيتين:
استخدمت المقاربات المبكرة مثل Mask R-CNN عملية من مرحلتين، حيث يتم أولاً أولاً توليد مقترحات المنطقة ثم تنقيحها. البنى الحديثة، مثل Ultralytics YOLO11أحدثت ثورة في هذا الأمر من خلال إجراء الكشف والتجزئة في مرحلة واحدة. وهذا يتيح الاستدلال في الوقت الحقيقي، مما يجعل من الممكن segment الأجسام في بث الفيديو المباشر بسرعة ودقة عالية.
لا يمكن الاستغناء عن الكشف الدقيق عن الحدود التي يوفرها تجزئة المثيل في مختلف الصناعات:
يمكن للمطورين تنفيذ تجزئة المثيل بسهولة باستخدام ultralytics حزمة Python . المكتبة
تدعم YOLO11 نماذج مدربة مسبقًا على
مجموعة بيانات COCOوالتي يمكنها detect 80 فئة من فئات الكائنات الشائعة segment خارج
الصندوق.
فيما يلي مثال موجز لكيفية تحميل نموذج وتشغيل التجزئة على صورة:
from ultralytics import YOLO
# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Visualize the results with masks plotted
results[0].show()
بالنسبة للمستخدمين الذين يتطلعون إلى تطبيق ذلك على بياناتهم الخاصة، يدعم الإطار التدريب على مجموعات بيانات مخصصة، مما يسمح للنموذج بتعلم فئات جديدة خاصة بالتطبيقات المتخصصة.