Object Tracking
Узнай, как работает трекинг объектов в компьютерном зрении. Открой для себя, как использовать Ultralytics YOLO26 для идентификации и мониторинга объектов с уникальными ID для анализа в реальном времени.
Отслеживание объектов — это динамический процесс в компьютерном зрении (CV), который включает идентификацию конкретных сущностей на видео и мониторинг их перемещения по последовательности кадров. В отличие от анализа статических изображений, который рассматривает каждый снимок изолированно, отслеживание вводит измерение времени. Это позволяет системам искусственного интеллекта (ИИ) присваивать уникальный идентификационный номер (ID) каждому обнаруженному объекту — например, автомобилю, человеку или животному — и сохранять эту идентификацию по мере того, как объект движется, меняет ориентацию или временно скрывается из виду. Эта возможность является краеугольным камнем передового понимания видео, позволяя машинам анализировать поведение, рассчитывать траектории и извлекать полезную информацию из «сырых» видеоматериалов.
Link to this sectionКак работает отслеживание объектов#
Современные системы отслеживания обычно используют парадигму «отслеживание через обнаружение» (tracking-by-detection). Этот рабочий процесс объединяет мощные модели обнаружения со специализированными алгоритмами для связывания результатов обнаружения во времени. Процесс обычно состоит из трех основных этапов:
-
Обнаружение: В каждом кадре модель обнаружения объектов, такая как ультрасовременная YOLO26, сканирует изображение для поиска интересующих объектов. Модель выдает ограничивающие рамки (bbox), которые определяют пространственные границы каждого объекта.
-
Прогнозирование движения: Алгоритмы, такие как фильтр Калмана, оценивают будущее положение объекта на основе его текущей скорости и траектории. Это прогнозирование сокращает область поиска для следующего кадра, делая систему более эффективной.
-
Ассоциация данных: Система сопоставляет новые обнаруженные объекты с существующими треками, используя методы оптимизации, такие как венгерский алгоритм. Этот шаг часто опирается на такие метрики, как Intersection over Union (IoU), для измерения того, насколько предсказанная рамка перекрывается с новым обнаружением. Продвинутые трекеры также могут использовать визуальное извлечение признаков для повторной идентификации объектов, которые выглядят похожими.
Link to this sectionОтслеживание объектов против обнаружения объектов#
Хотя эти термины тесно связаны, они выполняют различные функции в конвейере машинного обучения (ML).
- Обнаружение объектов отвечает на вопрос: «Что присутствует на этом изображении и где?». Оно не имеет состояния (stateless), то есть у него нет памяти о предыдущих кадрах. Если автомобиль проезжает через видео, детектор видит «автомобиль» в кадре 1 и «автомобиль» в кадре 2, но не знает, что это одно и то же транспортное средство.
- Отслеживание объектов отвечает на вопрос: «Куда направляется этот конкретный объект?». Оно имеет состояние (stateful). Оно связывает «автомобиль» в кадре 1 с «автомобилем» в кадре 2, позволяя системе зафиксировать, что «Car ID #42» движется слева направо. Это необходимо для таких задач, как прогнозное моделирование и подсчет объектов.
Link to this sectionРеальные приложения#
Способность сохранять идентичность объекта обеспечивает работу комплексных приложений инференса в реальном времени в различных отраслях.
- Интеллектуальные транспортные системы: Отслеживание жизненно важно для безопасной навигации автономных транспортных средств. Отслеживая пешеходов и другие транспортные средства, автомобили могут прогнозировать потенциальные столкновения. Кроме того, инженеры по дорожному движению используют эти системы для оценки скорости, чтобы обеспечивать соблюдение правил безопасности и оптимизировать транспортные потоки.
- Розничная аналитика: Обычные магазины используют ИИ в ритейле для понимания поведения покупателей. Отслеживание позволяет менеджерам магазинов выполнять подсчет объектов, чтобы измерять посещаемость, анализировать время пребывания перед витринами с помощью тепловых карт и оптимизировать управление очередями для сокращения времени ожидания.
- Анализ спортивных состязаний: В профессиональном спорте тренеры используют отслеживание в сочетании с оценкой позы, чтобы анализировать биомеханику игроков и построения команд. Эти данные дают конкурентное преимущество, выявляя закономерности, невидимые невооруженным глазом.
Link to this sectionРеализация отслеживания с помощью Python#
Ultralytics делает реализацию высокопроизводительного отслеживания простой задачей. Режим track в библиотеке автоматически обрабатывает обнаружение, прогнозирование движения и назначение ID. В примере ниже показано, как использовать совместимую с платформой Ultralytics модель YOLO26 для отслеживания объектов на видео.
from ultralytics import YOLO
# Load the official YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Track objects in a video file or webcam (source=0)
# 'show=True' displays the video with bounding boxes and unique IDs
results = model.track(source="https://ultralytics.com/images/bus.jpg", show=True)
# Access the unique tracking IDs from the results
if results[0].boxes.id is not None:
print(f"Detected Track IDs: {results[0].boxes.id.cpu().numpy()}")Link to this sectionСвязанные концепции#
Чтобы полностью понять экосистему трекинга, полезно изучить instance segmentation, которая отслеживает точные контуры объекта на уровне пикселей, а не просто ограничивающую рамку. Кроме того, задачи Multi-Object Tracking (MOT) часто включают использование широко распространенных бенчмарков, таких как MOTChallenge, для оценки того, насколько хорошо алгоритмы справляются с переполненными сценами и перекрытиями. Для развертывания в производственных средах разработчики часто используют такие инструменты, как NVIDIA DeepStream или OpenCV, чтобы интегрировать эти модели в эффективные конвейеры.






