Object Detection
Исследуй основы детектирования объектов. Узнай, как Ultralytics YOLO26 идентифицирует и находит объекты в режиме реального времени с непревзойденной скоростью и точностью.
Обнаружение объектов — это ключевая технология в области Computer Vision (CV), позволяющая компьютерным системам идентифицировать и локализовать конкретные объекты в визуальных данных. В отличие от более простых задач классификации изображений, которые присваивают единственную метку всему изображению, обнаружение объектов обеспечивает детальное понимание, одновременно предсказывая класс объекта (например, «человек», «автомобиль», «собака») и его пространственное положение. Это положение обычно представляется в виде прямоугольной граничной рамки (bounding box), которая охватывает объект, сопровождаемой показателем уверенности (confidence score), указывающим на степень уверенности модели. Эта двойная возможность — распознавание плюс локализация — служит сенсорной основой для современных приложений искусственного интеллекта (AI), позволяя машинам осмысленно взаимодействовать с окружающей средой.
Link to this sectionМеханика обнаружения#
Современные детекторы сильно зависят от архитектур глубокого обучения (DL), в частности от сверточных нейронных сетей (CNN), для извлечения сложных признаков из входных изображений. Процесс начинается с этапа обучения, где модель учится распознавать паттерны, используя огромные размеченные коллекции, такие как датасет COCO. На этом этапе алгоритм оптимизирует свои веса модели, чтобы минимизировать ошибки прогнозирования.
Когда модель развернута для вывода (inference), она сканирует новые изображения, чтобы предложить потенциальные объекты. Затем передовые алгоритмы применяют подавление немаксимумов (NMS) для фильтрации дублирующихся обнаружений, гарантируя, что каждый отдельный объект выделен только один раз. Точность этих прогнозов часто оценивается с помощью метрики пересечение над объединением (IoU), которая измеряет степень перекрытия между предсказанной рамкой и истинной разметкой. Недавние достижения привели к созданию архитектур сквозного обучения, таких как YOLO26, которые оптимизируют этот конвейер для достижения исключительной скорости и возможностей вывода в реальном времени на граничных устройствах.
Link to this sectionРазграничение ключевых терминов#
Крайне важно отличать обнаружение объектов от смежных концепций, чтобы выбрать правильный инструмент для проекта:
- Обнаружение объектов против классификации изображений: В то время как классификация изображений отвечает на вопрос «Что находится на этом изображении?», обнаружение объектов отвечает на вопрос «Что и где находится?».
- Обнаружение объектов против сегментации экземпляров: Обнаружение рисует рамку вокруг объекта. В отличие от него, сегментация экземпляров определяет точный, попиксельный контур (маску) каждого объекта.
- Обнаружение объектов против отслеживания объектов: Обнаружение находит объекты в одном кадре. Отслеживание объектов связывает эти обнаружения в последовательности видео для мониторинга движения во времени.
Link to this sectionРеальные приложения#
Универсальность обнаружения объектов стимулирует инновации в основных отраслях. В автомобильном секторе ИИ в автономных транспортных средствах критически зависит от моделей обнаружения для мгновенной идентификации пешеходов, дорожных знаков и других транспортных средств для безопасной навигации. Обрабатывая видеопотоки с бортовых камер, эти системы принимают решения за доли секунды, которые предотвращают аварии.
Еще один важный пример использования можно найти в ИИ для розничной торговли. Автоматизированные системы оплаты и умные роботы для управления инвентарем используют обнаружение объектов для сканирования полок, распознавания товаров и выявления нехватки запасов или неправильно расположенных предметов. Эта автоматизация оптимизирует цепочки поставок и улучшает качество обслуживания клиентов, гарантируя, что товары всегда в наличии.
Link to this sectionВнедрение обнаружения объектов#
Ты можешь легко внедрить рабочие процессы обнаружения, используя Python-пакет ultralytics. Следующий пример демонстрирует, как загрузить предобученную модель YOLO26 и выполнить вывод на изображении.
from ultralytics import YOLO
# Load the latest YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on an image from a URL
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results with bounding boxes
results[0].show()Для команд, стремящихся масштабировать свои операции, Ultralytics Platform предлагает комплексную среду для аннотирования данных, обучения кастомных моделей в облаке и их развертывания в различных форматах, таких как ONNX или TensorRT. Использование таких платформ упрощает жизненный цикл MLOps, позволяя инженерам сосредоточиться на совершенствовании своих приложений, а не на управлении инфраструктурой.






