Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

اكتشاف الأجسام

اكتشف قوة اكتشاف الأجسام - تعرف على الأجسام في الصور أو مقاطع الفيديو وحدد موقعها باستخدام نماذج متطورة مثل YOLO. استكشف تطبيقات العالم الحقيقي!

يُعد اكتشاف الأجسام قدرة محورية في مجال الرؤية الحاسوبية (CV) التي تمكّن البرمجيات الأنظمة ليس فقط من التعرف على ما تمثله الصورة، بل أيضًا من تحديد مواقع بعض العناصر داخلها. بينما يعين التصنيف القياسي تسمية واحدة لمدخلات بصرية كاملة، فإن اكتشاف الكائنات يوفر فهماً أكثر دقة من خلال التنبؤ بمربع محدّد حول كل كيان محدد، مصحوبًا بتسمية فئة محددة ودرجة ثقة ودرجة ثقة. تعمل هذه التقنية كأساس حسي للذكاء الاصطناعي الذكاء الاصطناعي المتقدم، مما يسمح للآلات بإدراك تعقيدات العالم المادي وتفسيرها والتفاعل معها. من مراقبة الجودة الآلية الآلية في المصانع إلى المراقبة المتقدمة، فهي تحوّل بيانات البكسل غير المنظمة إلى رؤى قابلة للتنفيذ.

ميكانيكا اكتشاف الأجسام

تعتمد أجهزة الكشف الحديثة بشكل أساسي على معماريات التعلم العميق (DL) ، وتحديداً الشبكات العصبية التلافيفية (CNNs)، لتعلم التسلسلات الهرمية المكانية للسمات. تتكون البنية النموذجية من العمود الفقري، مثل ResNet أو CSPNet، التي تستخرج السمات البصرية الأساسية من الصورة المدخلة. ثم تتم معالجة هذه الميزات بواسطة رأس الكشف الذي يُخرج إحداثيات المربعات المحددة واحتمالية عضوية الفئة.

ولتحقيق أداء عالٍ، يتم تدريب النماذج على مجموعات ضخمة موسومة مثل مثل مجموعة بياناتCOCO والتي توفر معيارًا لقياس الأداء. أثناء الاستدلال الخوارزميات غالبًا ما تولد خوارزميات متعددة متداخلة لنفس الكائن. تقنيات مثل القمع غير الأقصى (NMS) لتصفية هذه التكرارات، مع الاحتفاظ فقط بالمربع الذي يتمتع بأعلى ثقة وأفضل تقاطع على الاتحاد (IoU) مع الحقيقة الأرضية.

يتم تصنيف النماذج بشكل عام إلى نوعين:

تتميز عن مهام السيرة الذاتية ذات الصلة

من الأهمية بمكان التفريق بين اكتشاف الأجسام ومهام الرؤية الحاسوبية المماثلة مهام الرؤية الحاسوبية المماثلة.

  • تصنيف الصور: يحدد ما هو موجود في الصورة (على سبيل المثال، "كلب") ولكن ليس مكان وجوده أو عدده.
  • تجزئة المثيل: مثل الكشف، يحدد موقع الأجسام، ولكن بدلًا من المربع، يُنتج قناعًا مثاليًا بالبكسل يحدد الشكل الدقيق للكائن.
  • تتبع الكائنات: هذا يوسع نطاق الكشف في المجال الزمني، وتعيين معرّف فريد للأجسام المكتشفة وتتبع مسارها عبر إطارات الفيديو.

تطبيقات واقعية

يُعد اكتشاف الكائنات هو المحرك وراء العديد من التقنيات التحويلية في مختلف الصناعات.

  • الأنظمة المستقلة: في صناعة السيارات, تستخدم السيارات ذاتية القيادة نماذج الكشف لتحديد المشاة وإشارات المرور والسيارات الأخرى في أجزاء من الثانية. تعتمد الشركات الرائدة في هذا المجال مثل Waymo وTesla Autopilot تعتمد على على هذه القدرات للتنقل في البيئات المعقدة بأمان.
  • التشخيص الطبي: في الذكاء الاصطناعي للرعاية الصحية، تساعد نماذج الكشف أخصائيي الأشعة من خلال تسليط الضوء على المناطق المهمة في الأشعة السينية أو الأشعة المقطعية، مثل الأورام أو الكسور. المنظمات مثل المعاهد الوطنية للصحة (NIH) تبحث بنشاط في كيفية يمكن أن يقلل تحليل الصور الطبية من الأخطاء التشخيصية.
  • تحليلات البيع بالتجزئة: تستفيد المتاجر من الذكاء الاصطناعي في البيع بالتجزئة لأتمتة عمليات الدفع و ومراقبة المخزون. تستخدم الأنظمة المشابهة ل Amazon Go الكشف track العناصر التي يلتقطها العملاء من الرفوف.

مثال على التنفيذ

يوضح المقتطف البرمجي التالي كيفية إجراء عملية الكشف عن الكائنات باستخدام نموذج YOLO11 المدرب مسبقًا باستخدام ultralytics الحزمة. يقوم سير العمل البسيط هذا بتحميل نموذج وتشغيل الاستدلال على صورة لتحديد الأجسام مثل الحافلات والأشخاص.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن