استكشف أساسيات اكتشاف الكائنات. تعرف على كيفية قيام Ultralytics بتحديد الكائنات وتحديد مواقعها في الوقت الفعلي بسرعة ودقة لا مثيل لهما.
يعد اكتشاف الكائنات تقنية محورية في مجال الرؤية الحاسوبية (CV) التي تسمح لأنظمة الكمبيوتر بتحديد وتحديد موقع عناصر معينة ضمن البيانات المرئية. على عكس مهام تصنيف الصور الأبسط ، التي تخصص تصنيفًا واحدًا للصورة بأكملها، يوفر اكتشاف الكائنات فهمًا دقيقًا من خلال التنبؤ في الوقت نفسه بفئة الكائن (على سبيل المثال، "شخص" أو "سيارة" أو "كلب") وموقعه المكاني. عادةً ما يتم تمثيل هذا الموقع بمربع مستطيل يحيط بالكائن، مصحوبًا بدرجة ثقة تشير إلى دقة النموذج. هذه القدرة المزدوجة — التعرف بالإضافة إلى تحديد الموقع — تعمل كأساس حسي لتطبيقات الذكاء الاصطناعي (AI) الحديثة، مما يتيح للآلات التفاعل بشكل هادف مع بيئتها.
تعتمد أجهزة الكشف الحديثة بشكل كبير على بنى التعلم العميق (DL) ، وتحديداً الشبكات العصبية التلافيفية (CNNs)، لاستخراج الميزات المعقدة من الصور المدخلة. تبدأ العملية بمرحلة التدريب، حيث يتعلم النموذج التعرف على الأنماط باستخدام مجموعات ضخمة ومصنفة مثل COCO . خلال هذه المرحلة، تعمل الخوارزمية على تحسين أوزان النموذج لتقليل أخطاء التنبؤ إلى الحد الأدنى.
عندما يتم نشر النموذج للاستدلال، فإنه يقوم بمسح الصور الجديدة لاقتراح كائنات محتملة. ثم تقوم الخوارزميات المتقدمة بتطبيق القمع غير الأقصى (NMS) لتصفية الاكتشافات المكررة، مما يضمن تمييز كل كيان مميز مرة واحدة فقط. غالبًا ما يتم تقييم دقة هذه التنبؤات باستخدام مقياس التقاطع على الاتحاد (IoU) ، الذي يقيس التداخل بين المربع المتنبأ به والحقيقة الأساسية. أدت التطورات الحديثة إلى ظهور بنى شاملة مثل YOLO26، والتي تعمل على تبسيط هذه العملية لتحقيق سرعة استثنائية وقدرات استدلال في الوقت الفعلي على الأجهزة المتطورة.
من الضروري التمييز بين اكتشاف الأجسام والمفاهيم ذات الصلة لاختيار الأداة المناسبة للمشروع:
تساهم تعددية استخدامات الكشف عن الأجسام في دفع عجلة الابتكار في مختلف الصناعات الرئيسية. في قطاع السيارات، تعتمد الذكاء الاصطناعي في المركبات ذاتية القيادة بشكل كبير على نماذج الكشف للتعرف على المشاة وإشارات المرور والمركبات الأخرى على الفور من أجل القيادة بأمان. من خلال معالجة مقاطع الفيديو الواردة من الكاميرات المثبتة على متن المركبة، تتخذ هذه الأنظمة قرارات في أجزاء من الثانية تمنع وقوع الحوادث.
هناك حالة استخدام بارزة أخرى في مجال الذكاء الاصطناعي في تجارة التجزئة. تستخدم أنظمة الدفع الآلي وروبوتات إدارة المخزون الذكية خاصية الكشف عن الأشياء لمسح الرفوف والتعرف على المنتجات detect نقص detect أو الأصناف الموضوعة في غير مكانها. تعمل هذه الأتمتة على تبسيط سلاسل التوريد وتحسين تجربة العملاء من خلال ضمان توفر المنتجات دائمًا.
يمكن للمطورين تنفيذ سير عمل الكشف بسهولة باستخدام ultralytics Python . يوضح المثال التالي
كيفية تحميل يولو26 نموذج
وتنفيذ الاستدلال على صورة.
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()
بالنسبة للفرق التي تسعى إلى توسيع نطاق عملياتها، توفر Ultralytics بيئة شاملة لتعليق البيانات وتدريب النماذج المخصصة في السحابة ونشرها في تنسيقات مختلفة مثل ONNX أو TensorRT. يساهم استخدام هذه المنصات في تبسيط دورة حياة MLOps ، مما يتيح للمهندسين التركيز على تحسين تطبيقاتهم بدلاً من إدارة البنية التحتية.