اكتشف قوة تجزئة الصور مع Ultralytics YOLO. استكشف الدقة على مستوى البكسل وأنواعها وتطبيقاتها وحالات استخدام الذكاء الاصطناعي في العالم الحقيقي.
تعد تجزئة الصور عملية أساسية في مجال الرؤية الحاسوبية (CV) تتضمن تقسيم الصورة الرقمية إلى مجموعات فرعية متعددة من وحدات البكسل، والمعروفة باسم مقاطع الصورة أو المناطق. بينما يقوم التصنيف القياسي للصور بتعيين علامة واحدة للصورة بأكملها، فإن التقسيم يأخذ التحليل خطوة إلى الأمام من خلال تعيين علامة فئة محددة لكل بكسل فردي . ينتج عن هذا النهج التفصيلي خريطة دقيقة للصورة على مستوى البكسل، مما يسمح لنماذج الذكاء الاصطناعي (AI) بفهم ليس فقط الكائنات الموجودة، ولكن أيضًا مكانها بالضبط وشكلها المحدد.
لتحقيق هذا الفهم التفصيلي، تستخدم نماذج التجزئة عمومًا بنى التعلم العميق (DL) ، وتحديدًا الشبكات العصبية التلافيفية (CNNs). تعمل هذه الشبكات كمستخرجات للميزات، حيث تحدد أنماطًا مثل الحواف والأنسجة والأشكال. تستخدم بنية التجزئة النموذجية، مثل U-Net الكلاسيكية، هيكل التشفير-الترميز. يقوم المشفر بضغط المدخلات لالتقاط السياق الدلالي، بينما يقوم المرمز بإعادة بناء التفاصيل المكانية لإخراج قناع التجزئة.
أدت التطورات الحديثة إلى ظهور بنى في الوقت الحقيقي مثل YOLO26، التي تدمج قدرات التجزئة مباشرة في خط أنابيب الكشف من البداية إلى النهاية. وهذا يسمح بمعالجة عالية السرعة على أجهزة مختلفة، من وحدات معالجة الرسومات السحابية القوية إلى الأجهزة الطرفية المحدودة الموارد .
اعتمادًا على المتطلبات المحددة للمشروع، يختار المطورون عادةً بين ثلاث تقنيات أساسية للتجزئة :
تتيح الدقة التي توفرها عملية التجزئة وظائف مهمة في مختلف الصناعات:
من المهم التمييز بين التجزئة و الكشف عن الأجسام. في حين أن الكشف عن الأجسام يحدد مواقع العناصر باستخدام مربع مستطيل، فإنه يشمل بكسلات الخلفية داخل هذا المربع. توفر التجزئة تمثيلاً أكثر دقة ووضوحاً من خلال تتبع الحدود الدقيقة للجسم. هذا الاختلاف مهم للغاية لتطبيقات مثل الإمساك الآلي، حيث يجب أن تعرف ذراع الروبوت الهندسة الدقيقة للعنصر لالتقاطه دون اصطدام.
يمكن للمطورين تنفيذ تجزئة المثيلات بكفاءة باستخدام ultralytics Python .
يستخدم المثال التالي أحدث نموذج YOLO26،
الذي تم إصداره في يناير 2026، والذي تم تحسينه من حيث السرعة والدقة.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")
# Display the image with segmentation overlays
results[0].show()
لتحقيق أداء عالٍ في المهام المخصصة، غالبًا ما تحتاج الفرق إلى تنظيم بيانات تدريب عالية الجودة . تعمل Ultralytics على تبسيط هذه العملية من خلال توفير أدوات لتعليق الصور باستخدام أقنعة متعددة الأضلاع، وإدارة مجموعات البيانات، وتدريب النماذج في السحابة، مما يؤدي إلى تبسيط دورة حياة عمليات التعلم الآلي (MLOps) بأكملها.