Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تجزئة المثيل

تعرف على كيفية تمكين تحليل الحالات من اكتشاف الكائنات على مستوى البكسل. اكتشف كيفية استخدام Ultralytics لإنشاء أقنعة عالية السرعة في الوقت الفعلي والمزيد.

تعد تجزئة المثيلات تقنية متطورة في الرؤية الحاسوبية (CV) تعمل على تحديد و تحديد كل كائن متميز مهم داخل الصورة على مستوى البكسل. في حين أن الكشف القياسي عن الكائنات يحدد مواقع العناصر باستخدام مربعات حدودية مستطيلة، فإن تجزئة المثيلات تأخذ التحليل إلى مستوى أعمق من خلال إنشاء قناع دقيق لكل كيان تم الكشف عنه. تتيح هذه القدرة لنماذج الذكاء الاصطناعي (AI) التمييز بين الكائنات الفردية من نفس الفئة — مثل فصل شخصين متداخلين — مما يوفر فهمًا أكثر ثراءً وتفصيلاً للمشهد المرئي مقارنةً بطرق التصنيف الأبسط.

تمييز أنواع التجزئة

لفهم فائدة تقسيم المثيلات بشكل كامل، من المفيد التمييز بينها وبين مهام معالجة الصور الأخرى ذات الصلة . توفر كل طريقة مستوى مختلفًا من الدقة اعتمادًا على متطلبات التطبيق.

  • التقسيم الدلالي: يصنف هذا النهج كل بكسل في الصورة إلى فئة (على سبيل المثال، "طريق"، "سماء"، "سيارة"). ومع ذلك، فإنه لا يميز بين الكائنات المنفصلة من نفس الفئة. إذا كانت هناك ثلاث سيارات متوقفة بجانب بعضها البعض، فإن التقسيم الدلالي يعتبرها منطقة "سيارة" واحدة.
  • تجزئة الحالات: تعامل هذه الطريقة كل كائن على أنه كيان فريد. فهي تكتشف الحالات الفردية وتخصص علامة فريدة لكل بكسل من بكسلات كل حالة . في مثال السيارات المتوقفة، ستنشئ تجزئة الحالات ثلاثة أقنعة مميزة، تحدد "السيارة أ" و"السيارة ب" و"السيارة ج" بشكل منفصل.
  • التجزئة البانوبتيكية: نهج هجين يجمع بين تسمية الخلفية للتجزئة الدلالية وتحديد الكائنات القابلة للعد في التجزئة المثالية.

آليات تحليل مستوى البكسل

تعتمد نماذج تقسيم المثيلات الحديثة عادةً على بنى التعلم العميق (DL) المتقدمة، ولا سيما الشبكات العصبية التلافيفية (CNNs). تستخرج هذه الشبكات ميزات من الصورة للتنبؤ بفئة الكائن ومحيطه المكاني. تاريخياً، كانت البنى ذات المرحلتين مثل Mask R-CNN هي المعيار، حيث كانت تقترح أولاً المناطق ذات الأهمية ثم تقوم بتحسينها لتصبح أقنعة.

ومع ذلك، أدت التطورات الحديثة إلى ظهور أجهزة كشف أحادية المرحلة مثل YOLO26، التي تقوم بالكشف والتجزئة في وقت واحد. ويؤدي هذا النهج "الشامل" إلى تحسين سرعات الاستدلال في الوقت الفعلي بشكل كبير، مما يجعل من الممكن تطبيق التجزئة عالية الدقة على تدفقات الفيديو المباشرة على الأجهزة الاستهلاكية.

تطبيقات واقعية

تعد الحدود الدقيقة التي توفرها تقسيم الحالات أمرًا بالغ الأهمية للصناعات التي يتطلب فيها فهم الشكل والموضع الدقيق للكائن اتخاذ القرار.

  • الذكاء الاصطناعي في الرعاية الصحية: في التشخيص الطبي ، يعد تحديد الحجم والشكل الدقيقين للأورام أو الآفات أمرًا حيويًا. تسمح تجزئة الحالات للنماذج بتحديد التشوهات في فحوصات التصوير بالرنين المغناطيسي بدقة عالية، مما يساعد أطباء الأشعة في تخطيط العلاج ومراقبة تطور المرض.
  • المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة على التجزئة للتنقل في البيئات المعقدة. باستخدام مجموعات بيانات مثل Cityscapes، يمكن للمركبات تحديد الأسطح القابلة للقيادة، والتعرف على علامات حارات السير، وفصل المشاة الأفراد في ممرات المشاة المزدحمة لضمان السلامة.
  • الذكاء الاصطناعي في الزراعة: تستخدم الزراعة الدقيقة التجزئة لمراقبة صحة المحاصيل. يمكن للروبوتات المزودة بأنظمة رؤية تحديد الفاكهة الفردية للحصاد الآلي أو detect الأعشاب detect لاستخدام مبيدات الأعشاب بشكل مستهدف، مما يقلل من استخدام المواد الكيميائية ويحسن المحصول.

تنفيذ التجزئة باستخدام Python

يمكن للمطورين تنفيذ تجزئة المثيل بسهولة باستخدام ultralytics المكتبة. يوضح المثال التالي كيفية تحميل يولو26 نموذج وإنشاء أقنعة تقسيم لصورة.

from ultralytics import YOLO

# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()

التحديات والتدريب النموذجي

على الرغم من قوتها، فإن تقسيم المثيلات يتطلب حسابًا مكثفًا مقارنةً بالكشف البسيط عن المربعات المحيطة. يتطلب إنشاء أقنعة دقيقة للبكسل GPU كبيرة وتعليقات دقيقة على البيانات. يتضمن تعليق البيانات لهذه المهام رسم مضلعات ضيقة حول كل كائن، وهو ما قد يستغرق وقتًا طويلاً.

لتبسيط هذه العملية، غالبًا ما تستخدم الفرق أدوات مثل Ultralytics التي توفر ميزات لإدارة مجموعات البيانات والتعليق التلقائي والتدريب المستند إلى السحابة. وهذا يتيح للمطورين ضبط النماذج على البيانات المخصصة — مثل الأجزاء الصناعية المحددة أو العينات البيولوجية — ونشرها بكفاءة على أجهزة الذكاء الاصطناعي المتطورة باستخدام تنسيقات محسّنة مثل ONNX أو TensorRT.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن