Изучите основы обнаружения объектов. Узнайте, как Ultralytics идентифицирует и локализует объекты в режиме реального времени с непревзойденной скоростью и точностью.
Обнаружение объектов — это ключевая технология в области компьютерного зрения (CV), которая позволяет компьютерным системам идентифицировать и локализовать определенные объекты в визуальных данных. В отличие от более простых задач классификации изображений, которые присваивают один ярлык всему изображению, обнаружение объектов обеспечивает детальное понимание, одновременно предсказывая класс объекта (например, «человек», «автомобиль», «собака») и его пространственное расположение. Это местоположение обычно представляется в виде прямоугольной ограничивающей рамки, охватывающей объект, в сопровождении оценки достоверности, указывающей на степень уверенности модели. Эта двойная способность — распознавание плюс локализация — служит сенсорной основой для современных приложений искусственного интеллекта (ИИ) , позволяя машинам значимо взаимодействовать со своим окружением.
Современные детекторы в значительной степени полагаются на архитектуры глубокого обучения (DL), в частности на сверточные нейронные сети (CNN), для извлечения сложных характеристик из входных изображений. Процесс начинается с фазы обучения, на которой модель учится распознавать шаблоны с помощью огромных коллекций с метками, таких как COCO . На этой фазе алгоритм оптимизирует веса модели, чтобы минимизировать ошибки прогнозирования .
Когда модель развернута для вывода, она сканирует новые изображения, чтобы предложить потенциальные объекты. Затем передовые алгоритмы применяют немаксимальное подавление (NMS) для фильтрации дублирующихся обнаружений, обеспечивая, чтобы каждая отдельная сущность выделялась только один раз. Точность этих прогнозов часто оценивается с помощью метрики пересечения над объединением (IoU), которая измеряет перекрытие между прогнозируемым прямоугольником и фактическими данными. Недавние достижения привели к появлению сквозных архитектур, таких как YOLO26, которые оптимизируют этот конвейер для исключительной скорости и возможностей вывода в реальном времени на периферийных устройствах.
Для выбора подходящего инструмента для проекта очень важно отличать обнаружение объектов от смежных понятий:
Универсальность обнаружения объектов стимулирует инновации в основных отраслях промышленности. В автомобильной промышленности искусственный интеллект в автономных транспортных средствах в значительной степени полагается на модели обнаружения для мгновенной идентификации пешеходов, дорожных знаков и других транспортных средств с целью обеспечения безопасного движения. Обрабатывая видеопоток с бортовых камер, эти системы принимают решения за доли секунды, что позволяет предотвращать аварии.
Еще один яркий пример использования ИИ — розничная торговля. Автоматизированные системы кассового учета и интеллектуальные роботы для управления запасами используют функцию обнаружения объектов для сканирования полок, распознавания товаров и detect нехватки detect или неправильно размещенных товаров. Такая автоматизация оптимизирует цепочки поставок и улучшает качество обслуживания клиентов, обеспечивая постоянную доступность товаров.
Разработчики могут легко реализовать рабочие процессы обнаружения с помощью ultralytics Python . Следующий
пример демонстрирует, как загрузить предварительно обученный YOLO26 модель
и выполнить инференцию по изображению.
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()
Для команд, стремящихся к расширению масштабов своей деятельности, Ultralytics предлагает комплексную среду для аннотирования данных, обучения пользовательских моделей в облаке и их развертывания в различных форматах, таких как ONNX или TensorRT. Использование таких платформ упрощает жизненный цикл MLOps, позволяя инженерам сосредоточиться на доработке своих приложений, а не на управлении инфраструктурой.