تعرف على كيفية تمكين تحليل الحالات من اكتشاف الكائنات على مستوى البكسل. اكتشف كيفية استخدام Ultralytics لإنشاء أقنعة عالية السرعة في الوقت الفعلي والمزيد.
تعد تجزئة المثيلات تقنية متطورة في الرؤية الحاسوبية (CV) تعمل على تحديد و تحديد كل كائن متميز مهم داخل الصورة على مستوى البكسل. في حين أن الكشف القياسي عن الكائنات يحدد مواقع العناصر باستخدام مربعات حدودية مستطيلة، فإن تجزئة المثيلات تأخذ التحليل إلى مستوى أعمق من خلال إنشاء قناع دقيق لكل كيان تم الكشف عنه. تتيح هذه القدرة لنماذج الذكاء الاصطناعي (AI) التمييز بين الكائنات الفردية من نفس الفئة — مثل فصل شخصين متداخلين — مما يوفر فهمًا أكثر ثراءً وتفصيلاً للمشهد المرئي مقارنةً بطرق التصنيف الأبسط.
لفهم فائدة تقسيم المثيلات بشكل كامل، من المفيد التمييز بينها وبين مهام معالجة الصور الأخرى ذات الصلة . توفر كل طريقة مستوى مختلفًا من الدقة اعتمادًا على متطلبات التطبيق.
تعتمد نماذج تقسيم المثيلات الحديثة عادةً على بنى التعلم العميق (DL) المتقدمة، ولا سيما الشبكات العصبية التلافيفية (CNNs). تستخرج هذه الشبكات ميزات من الصورة للتنبؤ بفئة الكائن ومحيطه المكاني. تاريخياً، كانت البنى ذات المرحلتين مثل Mask R-CNN هي المعيار، حيث كانت تقترح أولاً المناطق ذات الأهمية ثم تقوم بتحسينها لتصبح أقنعة.
ومع ذلك، أدت التطورات الحديثة إلى ظهور أجهزة كشف أحادية المرحلة مثل YOLO26، التي تقوم بالكشف والتجزئة في وقت واحد. ويؤدي هذا النهج "الشامل" إلى تحسين سرعات الاستدلال في الوقت الفعلي بشكل كبير، مما يجعل من الممكن تطبيق التجزئة عالية الدقة على تدفقات الفيديو المباشرة على الأجهزة الاستهلاكية.
تعد الحدود الدقيقة التي توفرها تقسيم الحالات أمرًا بالغ الأهمية للصناعات التي يتطلب فيها فهم الشكل والموضع الدقيق للكائن اتخاذ القرار.
يمكن للمطورين تنفيذ تجزئة المثيل بسهولة باستخدام ultralytics المكتبة. يوضح المثال التالي
كيفية تحميل يولو26 نموذج
وإنشاء أقنعة تقسيم لصورة.
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()
على الرغم من قوتها، فإن تقسيم المثيلات يتطلب حسابًا مكثفًا مقارنةً بالكشف البسيط عن المربعات المحيطة. يتطلب إنشاء أقنعة دقيقة للبكسل GPU كبيرة وتعليقات دقيقة على البيانات. يتضمن تعليق البيانات لهذه المهام رسم مضلعات ضيقة حول كل كائن، وهو ما قد يستغرق وقتًا طويلاً.
لتبسيط هذه العملية، غالبًا ما تستخدم الفرق أدوات مثل Ultralytics التي توفر ميزات لإدارة مجموعات البيانات والتعليق التلقائي والتدريب المستند إلى السحابة. وهذا يتيح للمطورين ضبط النماذج على البيانات المخصصة — مثل الأجزاء الصناعية المحددة أو العينات البيولوجية — ونشرها بكفاءة على أجهزة الذكاء الاصطناعي المتطورة باستخدام تنسيقات محسّنة مثل ONNX أو TensorRT.