اكتشف قوة اكتشاف الأجسام - تعرف على الأجسام في الصور أو مقاطع الفيديو وحدد موقعها باستخدام نماذج متطورة مثل YOLO. استكشف تطبيقات العالم الحقيقي!
يُعد اكتشاف الأجسام قدرة محورية في مجال الرؤية الحاسوبية (CV) التي تمكّن البرمجيات الأنظمة ليس فقط من التعرف على ما تمثله الصورة، بل أيضًا من تحديد مواقع بعض العناصر داخلها. بينما يعين التصنيف القياسي تسمية واحدة لمدخلات بصرية كاملة، فإن اكتشاف الكائنات يوفر فهماً أكثر دقة من خلال التنبؤ بمربع محدّد حول كل كيان محدد، مصحوبًا بتسمية فئة محددة ودرجة ثقة ودرجة ثقة. تعمل هذه التقنية كأساس حسي للذكاء الاصطناعي الذكاء الاصطناعي المتقدم، مما يسمح للآلات بإدراك تعقيدات العالم المادي وتفسيرها والتفاعل معها. من مراقبة الجودة الآلية الآلية في المصانع إلى المراقبة المتقدمة، فهي تحوّل بيانات البكسل غير المنظمة إلى رؤى قابلة للتنفيذ.
تعتمد أجهزة الكشف الحديثة بشكل أساسي على معماريات التعلم العميق (DL) ، وتحديداً الشبكات العصبية التلافيفية (CNNs)، لتعلم التسلسلات الهرمية المكانية للسمات. تتكون البنية النموذجية من العمود الفقري، مثل ResNet أو CSPNet، التي تستخرج السمات البصرية الأساسية من الصورة المدخلة. ثم تتم معالجة هذه الميزات بواسطة رأس الكشف الذي يُخرج إحداثيات المربعات المحددة واحتمالية عضوية الفئة.
ولتحقيق أداء عالٍ، يتم تدريب النماذج على مجموعات ضخمة موسومة مثل مثل مجموعة بياناتCOCO والتي توفر معيارًا لقياس الأداء. أثناء الاستدلال الخوارزميات غالبًا ما تولد خوارزميات متعددة متداخلة لنفس الكائن. تقنيات مثل القمع غير الأقصى (NMS) لتصفية هذه التكرارات، مع الاحتفاظ فقط بالمربع الذي يتمتع بأعلى ثقة وأفضل تقاطع على الاتحاد (IoU) مع الحقيقة الأرضية.
يتم تصنيف النماذج بشكل عام إلى نوعين:
من الأهمية بمكان التفريق بين اكتشاف الأجسام ومهام الرؤية الحاسوبية المماثلة مهام الرؤية الحاسوبية المماثلة.
يُعد اكتشاف الكائنات هو المحرك وراء العديد من التقنيات التحويلية في مختلف الصناعات.
يوضح المقتطف البرمجي التالي كيفية إجراء عملية الكشف عن الكائنات باستخدام نموذج YOLO11 المدرب مسبقًا باستخدام
ultralytics الحزمة. يقوم سير العمل البسيط هذا بتحميل نموذج وتشغيل الاستدلال على صورة لتحديد
الأجسام مثل الحافلات والأشخاص.
from ultralytics import YOLO
# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")
# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes and labels
results[0].show()