Semantic Segmentation
استكشف التجزئة الدلالية (semantic segmentation) لفهم الصور على مستوى البكسل. تعلم كيفية تدريب ونشر نماذج تجزئة دقيقة باستخدام Ultralytics YOLO26 اليوم.
التجزئة الدلالية هي مهمة في رؤية الحاسوب تتضمن تقسيم الصورة إلى مناطق متميزة عن طريق تعيين تسمية فئة محددة لكل بكسل على حدة. على عكس المهام الأبسط مثل تصنيف الصور، الذي يعين تسمية واحدة للصورة بأكملها، أو اكتشاف الكائنات، الذي يرسم مربعات إحاطة حول الكائنات، توفر التجزئة الدلالية فهمًا للمشهد على مستوى البكسل. هذا التحليل الدقيق أمر بالغ الأهمية للتطبيقات التي يكون فيها الشكل الدقيق وحدود الكائن بنفس أهمية هويته. وهو يسمح للآلات بـ "رؤية" العالم بطريقة أقرب إلى البشر، حيث تميز البكسلات الدقيقة التي تشكل طريقاً، أو مشاة، أو ورماً داخل مسح طبي.
Link to this sectionكيف تعمل التجزئة الدلالية#
في جوهرها، تتعامل التجزئة الدلالية مع الصورة كشبكة من البكسلات التي تحتاج إلى تصنيف. تعد نماذج التعلم العميق، وتحديداً الشبكات العصبية التلافيفية (CNNs)، هي البنية القياسية لهذه المهمة. تستخدم البنية النموذجية، مثل U-Net المستخدمة على نطاق واسع، هيكل التشفير وفك التشفير. يقوم المشفر بضغط صورة الإدخال لاستخراج ميزات عالية المستوى (مثل الأنسجة والأشكال)، بينما يقوم فك التشفير برفع عينة هذه الميزات مرة أخرى إلى دقة الصورة الأصلية لإنشاء قناع تجزئة دقيق.
لتحقيق ذلك، يتم تدريب النماذج على مجموعات بيانات مشروحة ضخمة حيث قام المشرحون البشريون بتلوين كل بكسل بعناية وفقاً لفئته. تعمل أدوات مثل Ultralytics Platform على تسهيل هذه العملية من خلال تقديم ميزات التعليق التلقائي التي تسرع إنشاء بيانات حقيقة أساسية عالية الجودة. بمجرد التدريب، يخرج النموذج قناعاً تتوافق فيه قيمة كل بكسل مع معرف الفئة، مما يؤدي فعلياً إلى "طلاء" الصورة بالمعنى.
Link to this sectionالتمييز بين المفاهيم ذات الصلة#
من الشائع الخلط بين التجزئة الدلالية ومهام أخرى على مستوى البكسل. يعد فهم الاختلافات أمراً أساسياً لاختيار النهج الصحيح للمشروع:
- تجزئة المثيل: بينما تعامل التجزئة الدلالية جميع الكائنات من نفس الفئة ككيان واحد (على سبيل المثال، جميع "السيارات" ملونة باللون الأزرق)، تميز تجزئة المثيل بين الكائنات الفردية (على سبيل المثال، "السيارة أ" زرقاء، و"السيارة ب" حمراء).
- التجزئة البانوبتية: يجمع هذا بين المفهومين. فهو يعين فئة لكل بكسل (دلالية) بينما يقوم أيضاً بفصل المثيلات الفردية للكائنات القابلة للعد (مثيل)، مما يوفر الفهم الأكثر شمولاً للمشهد.
Link to this sectionتطبيقات العالم الحقيقي#
القدرة على تحليل البيانات المرئية بدقة فائقة للبكسل تدفع الابتكار عبر العديد من الصناعات ذات المخاطر العالية:
- الذكاء الاصطناعي في السيارات: تعتمد المركبات ذاتية القيادة بشكل كبير على التجزئة للتنقل بأمان. من خلال تحديد المناطق القابلة للقيادة مقابل الأرصفة، وتحديد المشاة والسيارات والعقبات بدقة، يمكن لأنظمة القيادة الذاتية اتخاذ قرارات حاسمة في الوقت الفعلي.
- الذكاء الاصطناعي في الرعاية الصحية: في التصوير الطبي، تقوم النماذج بتجزئة الأعضاء أو الآفات أو الأورام من الأشعة المقطعية والرنين المغناطيسي. يساعد هذا أطباء الأشعة في حساب حجم الورم لتخطيط العلاج أو توجيه أدوات الجراحة الروبوتية بدقة متناهية.
- الذكاء الاصطناعي في الزراعة: يستخدم المزارعون صور الطائرات بدون طيار والتجزئة لمراقبة صحة المحاصيل. من خلال تصنيف البكسلات على أنها "محصول صحي" أو "أعشاب ضارة" أو "تربة"، يمكن للأنظمة المؤتمتة استهداف رش مبيدات الأعشاب، مما يقلل من استخدام المواد الكيميائية ويحسن الإنتاجية.
Link to this sectionتنفيذ التجزئة باستخدام Ultralytics#
تحتاج نماذج التجزئة الحديثة إلى موازنة الدقة مع السرعة، خاصة بالنسبة لـ الاستنتاج في الوقت الفعلي على الأجهزة الطرفية. تتضمن عائلة نماذج Ultralytics YOLO26 نماذج تجزئة متخصصة (مشار إليها بلاحقة -seg) والتي تعد شاملة بطبيعتها، مما يوفر أداءً متفوقاً على البنيات الأقدم مثل YOLO11.
يوضح المثال التالي كيفية إجراء التجزئة على صورة باستخدام حزمة ultralytics بلغة Python. ينتج هذا أقنعة ثنائية تحدد حدود الكائنات.
from ultralytics import YOLO
# Load a pre-trained YOLO26 segmentation model
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# This will display the image with the segmentation masks overlaid
results[0].show()Link to this sectionالتحديات والتوجهات المستقبلية#
على الرغم من التقدم الكبير، تظل التجزئة الدلالية مكثفة حسابياً. يتطلب إنشاء تصنيف لكل بكسل على حدة موارد GPU وذاكرة كبيرة. يعمل الباحثون بنشاط على تحسين هذه النماذج من حيث الكفاءة، واستكشاف تقنيات مثل تكميم النموذج لتشغيل الشبكات الثقيلة على الهواتف المحمولة والأجهزة المدمجة.
علاوة على ذلك، تعد الحاجة إلى مجموعات بيانات ضخمة مصنفة عنق زجاجة. ولمعالجة هذه المشكلة، تتجه الصناعة نحو توليد البيانات الاصطناعية والتعلم شبه المشرف، مما يسمح للنماذج بالتعلم من الصور الخام دون الحاجة إلى ملايين من تسميات البكسل اليدوية. مع نضوج هذه التقنيات، يمكننا توقع أن تصبح التجزئة أكثر انتشاراً في الكاميرات الذكية والروبوتات وتطبيقات الواقع المعزز.






