استكشف تقسيم الصور في الرؤية الحاسوبية. تعرف على كيفية قيام Ultralytics بتوفير أقنعة دقيقة على مستوى البكسل لتقسيم الصور على سبيل المثال، والتقسيم الدلالي، والتقسيم الشامل.
تعد تجزئة الصور تقنية متطورة في الرؤية الحاسوبية (CV) تتضمن تقسيم الصورة الرقمية إلى مجموعات فرعية متعددة من وحدات البكسل، والتي يشار إليها غالبًا باسم مقاطع الصورة أو المناطق. على عكس تصنيف الصور القياسي، الذي يعين علامة واحدة للصورة بأكملها، تحلل التجزئة البيانات المرئية على مستوى أكثر تفصيلاً من خلال تعيين علامة فئة محددة لكل بكسل على حدة. تنتج عن هذه العملية خريطة دقيقة على مستوى البكسل، مما يسمح لنماذج الذكاء الاصطناعي (AI) بفهم ليس فقط الكائنات الموجودة، ولكن أيضًا مكانها بالضبط وحدودها المحددة .
لتحقيق هذا الفهم عالي الدقة، تستفيد نماذج التجزئة عادةً من بنى التعلم العميق (DL) ، ولا سيما الشبكات العصبية التلافيفية (CNNs). تعمل هذه الشبكات كمستخرجات قوية للميزات، حيث تحدد أنماطًا مثل الحواف والأنسجة والأشكال المعقدة . تستخدم بنى التجزئة التقليدية، مثل U-Net، غالبًا ما تستخدم بنية التشفير-الترميز. يقوم المشفر بضغط الصورة المدخلة لالتقاط السياق الدلالي، بينما يقوم المرمز بإعادة بناء التفاصيل المكانية لإخراج قناع التجزئة النهائي.
أدت التطورات الحديثة إلى ظهور بنى في الوقت الحقيقي مثل YOLO26، التي تم إصدارها في يناير 2026. تدمج هذه النماذج قدرات التجزئة مباشرة في خط أنابيب شامل، مما يسمح بمعالجة عالية السرعة على مختلف الأجهزة، من وحدات معالجة الرسومات السحابية إلى الأجهزة الطرفية .
اعتمادًا على الهدف المحدد للمشروع، يختار المطورون عمومًا بين ثلاث تقنيات رئيسية للتجزئة:
من المهم التمييز بين التجزئة و الكشف عن الأجسام. في حين أن خوارزميات الكشف تحدد مواقع العناصر باستخدام مربع حدودي مستطيل، فإنها تتضمن حتماً بكسلات الخلفية داخل هذا المربع. يوفر التقسيم تمثيلاً أكثر دقة ووضوحًا من خلال تتبع المحيط أو المضلع الدقيق للكائن. هذا الاختلاف مهم جدًا لتطبيقات مثل الإمساك الآلي، حيث يجب أن تعرف ذراع الروبوت الهندسة الدقيقة للعنصر لتتمكن من التعامل معه دون اصطدام.
تساهم الدقة التي توفرها تقنية تقسيم الصور في دفع عجلة الابتكار في مختلف الصناعات:
يمكن للمطورين تنفيذ تجزئة المثيلات بكفاءة باستخدام ultralytics Python .
يستخدم المثال التالي أحدث نموذج YOLO26،
والذي تم تحسينه من حيث السرعة والدقة.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()
لتحقيق أداء عالٍ في المهام المخصصة، غالبًا ما تحتاج الفرق إلى تنظيم بيانات تدريب عالية الجودة . Ultralytics على تبسيط هذه العملية من خلال توفير أدوات لتعليق الصور باستخدام أقنعة متعددة الأضلاع، وإدارة مجموعات البيانات، وتدريب النماذج في السحابة، مما يؤدي إلى تبسيط دورة حياة عمليات التعلم الآلي (MLOps) بأكملها. مكتبات مثل OpenCV بشكل متكرر إلى جانب هذه النماذج لمعالجة الصور مسبقًا ومعالجة الأقنعة الناتجة لاحقًا.