Instance Segmentation
تعلم كيف تتيح التجزئة الفردية (instance segmentation) اكتشاف الكائنات على مستوى البكسل. اكتشف كيفية استخدام Ultralytics YOLO26 لتوليد الأقنعة بسرعة عالية وفي الوقت الفعلي والمزيد.
تجزئة النطاقات (Instance segmentation) هي تقنية متطورة في رؤية الحاسوب (CV) تقوم بتحديد وتعيين كل كائن فردي موضع اهتمام داخل الصورة على مستوى البكسل. بينما تقوم تقنية اكتشاف الكائنات القياسية بتحديد مواقع العناصر باستخدام صناديق إحاطة مستطيلة، تأخذ تجزئة النطاقات التحليل إلى مستوى أعمق من خلال إنشاء قناع دقيق لكل كيان يتم اكتشافه. تتيح هذه القدرة لنماذج الذكاء الاصطناعي (AI) التمييز بين الكائنات الفردية من نفس الفئة—مثل فصل شخصين متداخلين—مما يوفر فهماً أغنى وأكثر تفصيلاً للمشهد البصري مقارنة بطرق التصنيف الأبسط.
Link to this sectionالتمييز بين أنواع التجزئة#
لإدراك فائدة تجزئة النطاقات بشكل كامل، من المفيد التمييز بينها وبين مهام معالجة الصور الأخرى ذات الصلة. تقدم كل طريقة مستوى مختلفاً من الدقة اعتماداً على متطلبات التطبيق.
- التجزئة الدلالية: يصنف هذا النهج كل بكسل في الصورة إلى فئة (مثل "طريق"، "سماء"، "سيارة"). ومع ذلك، فإنه لا يميز بين الكائنات المنفصلة من نفس الفئة. إذا كانت ثلاث سيارات متوقفة بجانب بعضها البعض، فإن التجزئة الدلالية تراها كمنطقة "سيارة" واحدة.
- تجزئة النطاقات: تتعامل هذه الطريقة مع كل كائن ككيان فريد. فهي تكتشف النطاقات الفردية وتعين تسمية فريدة لبكسلات كل منها. في مثال السيارات المتوقفة، ستقوم تجزئة النطاقات بإنشاء ثلاثة أقنعة متميزة، وتحديد "السيارة أ"، و"السيارة ب"، و"السيارة ج" بشكل منفصل.
- التجزئة الشمولية: نهج هجين يجمع بين تصنيف الخلفية في التجزئة الدلالية وتحديد الكائنات القابلة للعد في تجزئة النطاقات.
Link to this sectionآليات تحليل مستوى البكسل#
تعتمد نماذج تجزئة النطاقات الحديثة عادةً على بنى متطورة لـ التعلم العميق (DL)، ولا سيما الشبكات العصبية التلافيفية (CNNs). تستخرج هذه الشبكات ميزات من الصورة للتنبؤ بفئة الكائن ومحيطه المكاني. تاريخياً، كانت البنى ثنائية المرحلة مثل Mask R-CNN هي المعيار، حيث تقترح أولاً مناطق الاهتمام ثم تصقلها إلى أقنعة.
ومع ذلك، أدت التطورات الأخيرة إلى ظهور كاشفات أحادية المرحلة مثل YOLO26، والتي تقوم بالاكتشاف والتجزئة في وقت واحد. يعمل نهج "النهاية إلى النهاية" هذا على تحسين سرعات الاستدلال في الوقت الفعلي بشكل كبير، مما يجعل من الممكن تطبيق التجزئة عالية الدقة على بث الفيديو المباشر باستخدام أجهزة المستهلك العادية.
Link to this sectionتطبيقات العالم الحقيقي#
تعد الحدود الدقيقة التي توفرها تجزئة النطاقات أمراً بالغ الأهمية للصناعات التي يكون فيها فهم الشكل والموقع الدقيق للكائن ضرورياً لاتخاذ القرار.
- الذكاء الاصطناعي في الرعاية الصحية: في التشخيص الطبي، يعد تحديد الحجم والشكل الدقيق للأورام أو الآفات أمراً حيوياً. تسمح تجزئة النطاقات للنماذج بتحديد الخطوط العريضة للتشوهات في مسوحات MRI بدقة عالية، مما يساعد أطباء الأشعة في تخطيط العلاج ومراقبة تطور المرض.
- المركبات ذاتية القيادة: تعتمد السيارات ذاتية القيادة على التجزئة للتنقل في البيئات المعقدة. باستخدام مجموعات بيانات مثل Cityscapes، يمكن للمركبات تحديد الأسطح القابلة للقيادة، والتعرف على علامات المسار، وفصل المشاة الأفراد في ممرات المشاة المزدحمة لضمان السلامة.
- الذكاء الاصطناعي في الزراعة: تستخدم الزراعة الدقيقة التجزئة لمراقبة صحة المحاصيل. يمكن للروبوتات المجهزة بأنظمة الرؤية تحديد الثمار الفردية للحصاد الآلي أو اكتشاف أعشاب ضارة محددة لتطبيق مبيدات الأعشاب المستهدفة، مما يقلل من استخدام المواد الكيميائية ويحسن الإنتاجية.
Link to this sectionتنفيذ التجزئة باستخدام Python#
يمكن للمطورين تنفيذ تجزئة النطاقات بسهولة باستخدام مكتبة ultralytics. يوضح المثال التالي كيفية تحميل نموذج YOLO26 مدرب مسبقاً وإنشاء أقنعة تجزئة لصورة.
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()Link to this sectionالتحديات وتدريب النماذج#
على الرغم من قوتها، تعتبر تجزئة النطاقات مكثفة حسابياً مقارنة باكتشاف صناديق الإحاطة البسيطة. يتطلب إنشاء أقنعة مثالية على مستوى البكسل موارد GPU كبيرة وتعليقات توضيحية للبيانات دقيقة. يتضمن توضيح البيانات لهذه المهام رسم مضلعات محكمة حول كل كائن، وهو أمر قد يستغرق وقتاً طويلاً.
لتبسيط هذه العملية، تستخدم الفرق غالباً أدوات مثل Ultralytics Platform، التي توفر ميزات لإدارة مجموعات البيانات، والتعليق التوضيحي التلقائي، والتدريب القائم على السحابة. يتيح ذلك للمطورين ضبط النماذج بدقة على بيانات مخصصة—مثل أجزاء صناعية محددة أو عينات بيولوجية—ونشرها بكفاءة على أجهزة الذكاء الاصطناعي الطرفي باستخدام تنسيقات محسنة مثل ONNX أو TensorRT.






