مسرد المصطلحات

مربع الإحاطة

تعرف على كيفية تحديد مربعات الحدود لمواقع الكائنات في الرؤية الحاسوبية. استكشف تنسيقات الإحداثيات والتطبيقات الواقعية وكيفية استخدام Ultralytics .

المربع المحيط هو منطقة مستطيلة محددة بمجموعة من الإحداثيات تحيط بكائن معين داخل صورة أو إطار فيديو. في مجال الرؤية الحاسوبية (CV)، تعمل هذه المربعات ك تعليقات أساسية لتعليم أنظمة الذكاء الاصطناعي (AI) كيفية تحديد موقع العناصر المتميزة والتعرف عليها. بدلاً من مجرد تصنيف الصورة بأكملها على أنها "تحتوي على سيارة"، يسمح المربع المحيط للنموذج بتحديد الموقع الدقيق والامتداد المكاني للسيارة، وفصلها عن الخلفية والكيانات الأخرى. تعد قدرة تحديد الموقع هذه ضرورية لمهام الكشف عن الكائنات ، حيث يكون الهدف هو تحديد كائنات متعددة في وقت واحد بدقة عالية.

المفاهيم الأساسية والإحداثيات

لمعالجة البيانات المرئية بفعالية، تعتمد نماذج التعلم الآلي (ML) على أنظمة إحداثيات محددة لتمثيل المربعات المحيطة رياضيًا. غالبًا ما يحدد التنسيق المختار كيفية إعداد البيانات لتدريب النموذج وكيفية إخراج النموذج لتنبؤاته.

إحداثيات XYXY: يحدد هذا التنسيق مربعًا باستخدام القيم المطلقة للبكسل في الزاوية العلوية اليسرى والزاوية السفلية اليمنى. وهو بديهي لأدوات التصور مثل OpenCV أو Matplotlib عند رسم مستطيلات مباشرة على الصور.
تنسيق XYWH: شائع في مجموعات البيانات مثل COCO، تحدد هذه الطريقة نقطة مركز الكائن متبوعة بعرض المربع وارتفاعه. هذا التمثيل مهم جدًا لحساب دوال الخسارة أثناء عملية التعلم .
الإحداثيات المعيارية: لضمان قابلية التوسع عبر الصور ذات الدقة المختلفة ، غالبًا ما يتم قياس الإحداثيات في نطاق يتراوح بين 0 و 1. وهذا يساعد النماذج على التعميم بشكل أفضل عند تحليل المدخلات ذات الأبعاد المتفاوتة.

تطبيقات واقعية

تعد الصناديق المحددة العناصر الأساسية لعدد لا يحصى من حلول الذكاء الاصطناعي في مختلف الصناعات. من خلال تمكين التحديد الدقيق للموقع، فإنها تسمح للأنظمة بالتفاعل بذكاء مع العالم المادي.

المركبات ذاتية القيادة: تستخدم السيارات ذاتية القيادة مربعات حدودية detect track والمركبات الأخرى وإشارات المرور والعوائق في الوقت الفعلي. هذا الإدراك المكاني ضروري لأنظمة الملاحة والسلامة لاتخاذ قرارات في أجزاء من الثانية.
تحليلات البيع بالتجزئة: في المتاجر الذكية، تساعد الصناديق المحددة على مراقبة المخزون على الرفوف track تفاعلات track مع المنتجات. يمكن لهذه البيانات أتمتة تجديد المخزون وتوفير رؤى حول سلوك المتسوقين دون الحاجة إلى العد اليدوي.

مربعات الحدود في العمل

عند استخدام البنى الحديثة مثل يولو26، يتنبأ النموذج بمربعات الحدود مع تسمية الفئة و درجة الثقة. يوضح المثال التالي كيفية تشغيل الاستدلال على صورة والوصول إلى إحداثيات المربع المحيط باستخدام ultralytics الحزمة.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Access bounding box coordinates (xyxy format) for the first detected object
boxes = results[0].boxes
print(boxes.xyxy[0])  # Output: tensor([x1, y1, x2, y2, ...])

المصطلحات ذات الصلة والتمايز

في حين أن المربعات المحيطة هي المعيار للكشف العام، إلا أنها تختلف عن أنواع التعليقات التوضيحية الأخرى المستخدمة في مهام أكثر تفصيلاً.

تقسيم المثيل: على عكس المربع المستطيل، يخلق التقسيم قناعًا دقيقًا للبكسل يتتبع المخطط الدقيق للكائن. وهذا مفيد عندما يكون الشكل الدقيق أكثر أهمية من الموقع العام.
مربع الحدود الموجه (OBB): مربعات الحدود القياسية محاذاة للمحور (مستطيلات قائمة). يمكن أن تدور مربعات OBB لتناسب الكائنات ذات الزوايا، مثل السفن في صور الأقمار الصناعية أو الطرود على حزام ناقل، مما يوفر ملاءمة أفضل ويقلل من ضوضاء الخلفية.
النقاط الرئيسية: بدلاً من إحاطة كائن ما، تحدد النقاط الرئيسية معالم محددة، مثل المفاصل في جسم الإنسان من أجل تقدير الوضع.

أدوات للتعليق والإدارة

يعد إنشاء تعليقات توضيحية عالية الجودة للمربعات المحيطة خطوة حاسمة في مسار التعلم الآلي. تعمل Ultralytics على تبسيط هذه العملية من خلال توفير أدوات لتعليق البيانات وإدارة مجموعات البيانات. يضمن التعليق التوضيحي المناسب أن تتعلم النماذج التمييز بين الكائنات بدقة، مما يقلل من الأخطاء مثل التكيف المفرط أو الخلط بين الخلفيات. تُستخدم تقنيات متقدمة مثل القمع غير الأقصى (NMS) أثناء الاستدلال لتحسين هذه التنبؤات عن طريق إزالة المربعات المتداخلة، مما يضمن بقاء الكشف الأكثر دقة لكل كائن.

مربع الإحاطة

تدريب نماذج Ultralytics YOLO لتبسيط سير العمل في مختلف الصناعات

حل ترخيص مرن للمؤسسات لدعم ابتكاراتك

تدريب نماذج الذكاء الاصطناعي في ثوانٍ مع Ultralytics YOLO

المفاهيم الأساسية والإحداثيات

تطبيقات واقعية

مربعات الحدود في العمل

المصطلحات ذات الصلة والتمايز

أدوات للتعليق والإدارة

اقرأ المزيد في هذه الفئة

12 حالة استخدام للصور الجوية مدعومة بالرؤية الحاسوبية

ما هو تقدير العمق الأحادي العين؟ نظرة عامة

نظرة على استخدامYOLO Ultralytics YOLO للكشف عن التهديدات باستخدام الذكاء الاصطناعي

انضم إلى مجتمع Ultralytics