اكتشف قوة تجزئة الصور مع Ultralytics YOLO. استكشف الدقة على مستوى البكسل وأنواعها وتطبيقاتها وحالات استخدام الذكاء الاصطناعي في العالم الحقيقي.
تجزئة الصور هي تقنية أساسية في الرؤية الحاسوبية (CV) التي تتضمن تقسيم صورة رقمية إلى مجموعات فرعية متعددة من البكسلات، والتي يشار إليها عادةً باسم قطاعات الصورة. الهدف الأساسي هو تبسيط تمثيل الصورة إلى شيء أكثر وضوحًا وأسهل في التحليل. على عكس الكشف عن الأجسام، والذي يحدد موقع الأجسام داخل مستطيل الشكل، فإن تجزئة الصورة توفر خريطة دقيقة على مستوى البكسل لشكل الجسم. تقوم هذه العملية بتعيين تسمية لكل بيكسل في الصورة، مما يسمح لنماذج الذكاء الاصطناعي لنماذج الذكاء الاصطناعي (AI) فهم الحدود والخطوط الدقيقة للكيانات داخل المشهد.
في العديد من عمليات سير عمل التعلم الآلي الحديثة (ML), معرفة الموقع التقريبي للكائن غير كافٍ. تتطلب التطبيقات التي تتطلب التفاعل مع الفيزيائية - مثل الروبوت الذي يمسك بحزمة أو سيارة تتنقل في طريق متعرج - تتطلب فهمًا دقيقًا الهندسة. يعمل تجزئة الصور على سد هذه الفجوة من خلال تحويل البيانات المرئية الأولية إلى مجموعة من المناطق المصنفة. هذه القدرة هذه القدرة مدعومة ببنى المتقدمة (DL) ، ولا سيما الشبكات العصبية التلافيفية (CNNs)، التي تستخرج السمات المكانية للتمييز بين الأجسام الأمامية والخلفية.
إن فهم مهمة التجزئة المحددة أمر بالغ الأهمية لاختيار بنية النموذج الصحيح. الفئات الثلاث الأساسية الأساسية الثلاثة هي:
إن القدرة على ترسيم الحدود الدقيقة تجعل التجزئة أمرًا لا غنى عنه في مختلف الصناعات:
قامت الأطر الحديثة بتبسيط تنفيذ مهام التجزئة. بينما كانت أجهزة الكشف القديمة ذات المرحلتين مثل Mask R-CNN دقيقة ولكن بطيئة، فقد أحدثت النماذج أحادية المرحلة ثورة في هذا المجال من خلال تقديم الاستدلال في الوقت الحقيقي. إن Ultralytics YOLO11 على سبيل المثال، يدعم تجزئة المثيل أصلاً. استشرافًا للمستقبل, يجري تطوير نموذج YOLO26 لتحسين هذه مع المعالجة الشاملة.
يمكن للمطورين استخدام مكتبات قياسية مثل OpenCV للمعالجة المسبقة والتصور، بينما يستخدمون PyTorch أطر العمل القائمة على PyTorch من أجل رفع الأحمال الثقيلة استدلال النموذج.
فيما يلي مثال موجز لكيفية إجراء تجزئة النماذج باستخدام نموذج YOLO11 المدرب مسبقًا في Python:
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with segmentation masks overlaid
results[0].show()
يتعامل هذا المقتطف البرمجي تلقائيًا مع المهام المعقدة لاستخراج الميزات، وانحدار المربع المحدود، وإنشاء القناع مما يسمح للمطوّرين بالتركيز على دمج نتائج نتائج التجزئة في تطبيقاتهم الأكبر.