Interactive Segmentation
تعلم كيف تستخدم التجزئة التفاعلية (interactive segmentation) مطالبات الإنسان في الحلقة لعزل الكائنات. اكتشف كيفية استخدام Ultralytics YOLO26 ومنصة Ultralytics للمهام.
التجزئة التفاعلية هي نهج تعاوني للغاية في الرؤية الحاسوبية حيث يقدم المستخدم البشري مدخلات مستمرة أو لمرة واحدة - مثل النقرات، أو صناديق الإحاطة، أو مطالبات النص - لتوجيه نموذج AI في عزل كائنات محددة داخل صورة. على عكس الأساليب المؤتمتة بالكامل، تسمح هذه التقنية التي تعتمد على الإنسان في الحلقة للمستخدمين بتحديد ما يجب تجزئته بالضبط، مما يجعلها ذات قيمة خاصة عند التعامل مع بيانات بصرية غامضة، أو كائنات متداخلة، أو فئات غير مرئية. على مدى السنوات القليلة الماضية، أدى إدخال النماذج الأساسية إلى تحسين سرعة ودقة هذه العملية بشكل كبير، مما حولها إلى أداة حيوية لـ توسيم البيانات والتصوير الدقيق.
Link to this sectionكيف تعمل التجزئة التفاعلية#
في جوهرها، تعتمد سير العمل على تجزئة المفاهيم القابلة للمطالبة، حيث يفسر النموذج توجيهات المستخدم لإنشاء قناع مثالي على مستوى البكسل. قد يضع المستخدم نقرة "إيجابية" على الكائن الأمامي الذي يريد تحديده ونقرة "سلبية" على مناطق الخلفية التي يريد استبعادها. تأخذ النماذج المتقدمة مثل نموذج Segment Anything Model (SAM) وخلفائه، Meta SAM 3، هذا الأمر خطوة أخرى إلى الأمام من خلال قبول أنواع متنوعة من الإيماءات [1]، وصناديق الإحاطة، وحتى أوصاف النص لتأسيس البحث البصري. يقوم النموذج بحساب الحدود المثلى بناءً على هذه المطالبات، ويمكن للمستخدم تحسين القناع بشكل تكراري بنقرات إضافية حتى يتم تحقيق الدقة المطلوبة.
Link to this sectionتطبيقات العالم الحقيقي#
تُحدث التجزئة التفاعلية تحولاً في سير العمل عبر العديد من الصناعات من خلال مزج الخبرة البشرية بكفاءة AI.
- التصوير الطبي: في AI في الرعاية الصحية، يستخدم الأطباء وأخصائيو الأشعة أدوات تفاعلية لعزل الأورام، أو الآفات، أو أعضاء معينة في فحوصات MRI و CT. تظهر الأبحاث حول النمذجة المكانية للصور الطبية [2] أن النقرات التفاعلية تسمح للمهنيين الطبيين بتصحيح تنبؤات AI بسرعة، مما يضمن الدقة الصارمة المطلوبة لتشخيص المريض.
- رسم الخرائط الجغرافية المكانية والأقمار الصناعية: يستخدم المخططون الحضريون وعلماء البيئة نماذج تفاعلية لتسريع استخراج ميزات GIS [3]. بدلاً من تتبع الخطوط الساحلية المعقدة، أو الحدود الزراعية، أو البنية التحتية الجديدة يدوياً، يمكن للمحللين وضع بضع نقرات استراتيجية لإنشاء مضلعات جغرافية دقيقة على الفور.
- الكشف عن عيوب الصناعة: بالنسبة لـ AI في التصنيع، يمكن لمهندسي مراقبة الجودة استخدام مطالبات تفاعلية لتسليط الضوء على العيوب المجهرية في خطوط الإنتاج، مما يؤدي إلى تكييف النظام ديناميكياً مع أنواع جديدة من العيوب دون إعادة تدريب النموذج بالكامل.
Link to this sectionالتجزئة التفاعلية مقابل تجزئة المثيل#
على الرغم من أن كلا المفهومين يتضمنان فصل الكائنات على مستوى البكسل، إلا أنهما يخدمان أغراضاً تشغيلية مختلفة. تجزئة المثيل هي عادة عملية مؤتمتة بالكامل حيث يكتشف نموذج، مثل Ultralytics YOLO26، ويحدد فئات محددة مسبقاً (مثل "سيارة"، "شخص"، "كلب") دون تدخل المستخدم. يمكنك معرفة المزيد حول كيفية عمل ذلك في دليلنا لتجزئة المثيل.
على العكس من ذلك، لا تعتمد التجزئة التفاعلية بشكل صارم على فئات محددة مسبقاً. إنها مستقلة عن الفئة، مما يعني أنها تجزئ كل ما يشير إليه المستخدم، مما يجعلها مناسبة تماماً لخطوط أنابيب التعلم النشط حيث تحتاج الكائنات الجديدة إلى توسيم سريع وإضافتها إلى مجموعات بيانات مخصصة باستخدام أدوات مثل Ultralytics Platform.
Link to this sectionمثال باستخدام Ultralytics#
يمكنك بسهولة تنفيذ التجزئة التفاعلية في مشاريعك الخاصة باستخدام PyTorch وحزمة Python ultralytics. في هذا المثال، نستخدم FastSAM لتجزئة كائن معين من خلال تقديم مطالبة صندوق إحاطة.
from ultralytics import FastSAM
# Load a pretrained FastSAM model
model = FastSAM("FastSAM-s.pt")
# Perform interactive segmentation using a bounding box prompt [x1, y1, x2, y2]
results = model("path/to/image.jpg", bboxes=[100, 100, 300, 300])
# Display the segmented result on screen
results[0].show()توضح هذه القصاصة كيف توجه مطالبة مكانية بسيطة النموذج مباشرة لعزل منطقة الاهتمام، مما يبسط مهام تجزئة الصور المعقدة بأقل قدر من الكود.






