Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تجزئة الصور

استكشف تقسيم الصور في الرؤية الحاسوبية. تعرف على كيفية قيام Ultralytics بتوفير أقنعة دقيقة على مستوى البكسل لتقسيم الصور على سبيل المثال، والتقسيم الدلالي، والتقسيم الشامل.

تعد تجزئة الصور تقنية متطورة في الرؤية الحاسوبية (CV) تتضمن تقسيم الصورة الرقمية إلى مجموعات فرعية متعددة من وحدات البكسل، والتي يشار إليها غالبًا باسم مقاطع الصورة أو المناطق. على عكس تصنيف الصور القياسي، الذي يعين علامة واحدة للصورة بأكملها، تحلل التجزئة البيانات المرئية على مستوى أكثر تفصيلاً من خلال تعيين علامة فئة محددة لكل بكسل على حدة. تنتج عن هذه العملية خريطة دقيقة على مستوى البكسل، مما يسمح لنماذج الذكاء الاصطناعي (AI) بفهم ليس فقط الكائنات الموجودة، ولكن أيضًا مكانها بالضبط وحدودها المحددة .

آليات تحليل مستوى البكسل

لتحقيق هذا الفهم عالي الدقة، تستفيد نماذج التجزئة عادةً من بنى التعلم العميق (DL) ، ولا سيما الشبكات العصبية التلافيفية (CNNs). تعمل هذه الشبكات كمستخرجات قوية للميزات، حيث تحدد أنماطًا مثل الحواف والأنسجة والأشكال المعقدة . تستخدم بنى التجزئة التقليدية، مثل U-Net، غالبًا ما تستخدم بنية التشفير-الترميز. يقوم المشفر بضغط الصورة المدخلة لالتقاط السياق الدلالي، بينما يقوم المرمز بإعادة بناء التفاصيل المكانية لإخراج قناع التجزئة النهائي.

أدت التطورات الحديثة إلى ظهور بنى في الوقت الحقيقي مثل YOLO26، التي تم إصدارها في يناير 2026. تدمج هذه النماذج قدرات التجزئة مباشرة في خط أنابيب شامل، مما يسمح بمعالجة عالية السرعة على مختلف الأجهزة، من وحدات معالجة الرسومات السحابية إلى الأجهزة الطرفية .

الأنواع الأساسية للتجزئة

اعتمادًا على الهدف المحدد للمشروع، يختار المطورون عمومًا بين ثلاث تقنيات رئيسية للتجزئة:

  • التقسيم الدلالي: تصنف هذه الطريقة البكسلات بناءً على فئتها ولكنها لا تميز بين الكائنات المنفصلة من نفس الفئة. على سبيل المثال، في تحليل صورة القمر الصناعي، سيتم تلوين جميع البكسلات التي تمثل "الغابة" باللون الأخضر، معاملة الغابة بأكملها ككيان واحد.
  • تجزئة الحالات: تحدد هذه التقنية وتفصل بين الكائنات الفردية المختلفة التي تهمنا. في مشهد شارع مزدحم، تولد تجزئة الحالات قناعًا فريدًا لـ "السيارة أ" و"السيارة ب" و"المشاة أ"، مما يمكّن الأنظمة من حساب track كيانات track . هذه هي الميزة الأساسية لـ عائلة نماذج Ultralytics .
  • التجزئة البانوبتيكية: نهج هجين يجمع بين تغطية التجزئة الدلالية ودقة التجزئة المثالية. يُعين علامة لكل بكسل، ويميز عناصر الخلفية غير المتماثلة (مثل السماء والطريق) بينما يحدد بشكل فريد الأجسام القابلة للعد في المقدمة.

التمييز عن اكتشاف الكائنات

من المهم التمييز بين التجزئة و الكشف عن الأجسام. في حين أن خوارزميات الكشف تحدد مواقع العناصر باستخدام مربع حدودي مستطيل، فإنها تتضمن حتماً بكسلات الخلفية داخل هذا المربع. يوفر التقسيم تمثيلاً أكثر دقة ووضوحًا من خلال تتبع المحيط أو المضلع الدقيق للكائن. هذا الاختلاف مهم جدًا لتطبيقات مثل الإمساك الآلي، حيث يجب أن تعرف ذراع الروبوت الهندسة الدقيقة للعنصر لتتمكن من التعامل معه دون اصطدام.

تطبيقات واقعية

تساهم الدقة التي توفرها تقنية تقسيم الصور في دفع عجلة الابتكار في مختلف الصناعات:

  • التشخيص الطبي: في مجال تحليل الصور الطبية، يعد التقسيم أمرًا ضروريًا لتحديد الخطوط العريضة للهياكل التشريحية. تحلل الخوارزميات فحوصات التصوير بالرنين المغناطيسي لتحديد حدود الأورام أو الأعضاء، مما يسمح للجراحين بحساب الأحجام الدقيقة وتخطيط الإجراءات بدقة منقذة للحياة.
  • القيادة الذاتية: تعتمد المركبات ذاتية القيادة على التجزئة للتنقل بأمان. من خلال معالجة موجات الفيديو، يمكن لكمبيوتر المركبة التمييز بين الممرات القابلة للقيادة والأرصفة والعوائق. تحدد منظمات المعايير مثل SAE International مستويات الاستقلالية التي تتطلب هذا الإدراك البيئي عالي الدقة.
  • الزراعة الدقيقة: في الذكاء الاصطناعي في الزراعة، تساعد التجزئة الأنظمة الروبوتية على تحديد الأعشاب الضارة وسط المحاصيل. من خلال إنشاء أقنعة لأوراق نباتات معينة، يمكن للرشاشات الآلية استهداف الأنواع الغازية فقط، مما يقلل بشكل كبير من استخدام مبيدات الأعشاب.

تنفيذ التجزئة باستخدام YOLO26

يمكن للمطورين تنفيذ تجزئة المثيلات بكفاءة باستخدام ultralytics Python . يستخدم المثال التالي أحدث نموذج YOLO26، والذي تم تحسينه من حيث السرعة والدقة.

from ultralytics import YOLO

# Load a pre-trained YOLO26 segmentation model
# 'n' denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image to generate masks
# The model identifies objects and outlines their shape
results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with segmentation overlays
results[0].show()

لتحقيق أداء عالٍ في المهام المخصصة، غالبًا ما تحتاج الفرق إلى تنظيم بيانات تدريب عالية الجودة . Ultralytics على تبسيط هذه العملية من خلال توفير أدوات لتعليق الصور باستخدام أقنعة متعددة الأضلاع، وإدارة مجموعات البيانات، وتدريب النماذج في السحابة، مما يؤدي إلى تبسيط دورة حياة عمليات التعلم الآلي (MLOps) بأكملها. مكتبات مثل OpenCV بشكل متكرر إلى جانب هذه النماذج لمعالجة الصور مسبقًا ومعالجة الأقنعة الناتجة لاحقًا.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن