استكشف التجزئة البانوبتيكية لتوحيد التجزئة الدلالية وتجزئة الحالات. تعرف على كيفية قيام Ultralytics بتوفير فهم دقيق للمشهد لمشاريع الذكاء الاصطناعي.
التقسيم البانوبتيكي هو مهمة شاملة لرؤية الكمبيوتر (CV) توحد شكلين متميزين من أشكال تحليل الصور: التقسيم الدلالي وتقسيم الحالات. في حين أن الطرق التقليدية تعالج هذه المهام بشكل منفصل — إما بتصنيف مناطق الخلفية مثل "السماء" أو "العشب" بشكل عام، أو الكشف عن كائنات محددة مثل "السيارة" أو "الشخص" — فإن التقسيم البانوبتيكي يجمعها في إطار عمل واحد متماسك. يخصص هذا النهج قيمة فريدة لكل بكسل في الصورة، مما يوفر فهمًا كاملاً للمشهد يميز بين الكائنات القابلة للعد (يشار إليها باسم "الأشياء") ومناطق الخلفية غير المتماثلة (يشار إليها باسم "الأشياء"). من خلال ضمان حساب كل بكسل وتصنيفه، تحاكي هذه التقنية الإدراك البصري البشري بشكل أقرب من طرق الكشف المعزولة.
لفهم التجزئة البانوبتيكية بشكل كامل، من المفيد فهم ثنائية المعلومات البصرية التي تعالجها. تقسم المهمة العالم البصري إلى فئتين أساسيتين:
هذا التمييز أمر بالغ الأهمية بالنسبة لأنظمة الذكاء الاصطناعي المتقدمة (AI) ، حيث يتيح لها التنقل في البيئات مع التفاعل في الوقت نفسه مع كائنات محددة.
عادةً ما تستخدم بنى التقسيم البانوبتيكية الحديثة عمودًا فقريًا قويًا للتعلم العميق (DL) ، مثل الشبكة العصبية التلافيفية (CNN) أو محول الرؤية (ViT)، لاستخراج تمثيلات غنية للميزات من الصورة. تنقسم الشبكة عمومًا إلى فرعين أو "رأسين":
ثم تقوم وحدة دمج أو خطوة معالجة لاحقة بحل التضارب بين هذه المخرجات — على سبيل المثال، تحديد ما إذا كان البكسل ينتمي إلى مثيل "شخص" أو إلى جدار "الخلفية" خلفه — لإنتاج خريطة تقسيم بانوبتيكية نهائية غير متداخلة.
الطبيعة الشاملة للتجزئة البانوبتيكية تجعلها لا غنى عنها للصناعات التي تعتبر فيها السلامة والسياق أمراً بالغ الأهمية.
على الرغم من أن التدريب البانوبتيكي الكامل قد يكون معقدًا، يمكن للمطورين تحقيق دقة عالية في تقسيم الحالات— وهو عنصر حاسم في اللغز البانوبتيكي — باستخدام Ultralytics . يوفر هذا النموذج المتطور أداءً في الوقت الفعلي وهو مُحسّن للاستخدام المتطور.
يوضح Python التالي Python كيفية تحميل نموذج تجزئة مدرب مسبقًا وتشغيل الاستدلال لعزل كائنات مميزة:
from ultralytics import YOLO
# Load the YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to segment individual instances
# The model identifies 'things' and generates pixel-perfect masks
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with overlaid segmentation masks
results[0].show()
بالنسبة للفرق التي تسعى إلى إدارة بيانات التدريب الخاصة بها وأتمتة عملية التعليق التوضيحي، توفر Ultralytics مجموعة من الأدوات لإدارة مجموعات البيانات وتدريب النماذج. يعد التعليق التوضيحي عالي الجودة للبيانات أمرًا بالغ الأهمية لمهام التجزئة، حيث تتطلب النماذج علامات دقيقة على مستوى البكسل للتعلم بفعالية.
فهم الفروق الدقيقة بين أنواع التجزئة أمر بالغ الأهمية لاختيار النموذج المناسب لمشروعك:
لمزيد من الاستكشاف لتنسيقات مجموعات البيانات المستخدمة في هذه المهام، يمكنك مراجعة وثائقCOCO وهي معيار قياسي لقياس أداء التجزئة.