Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Отслеживание объектов

Откройте для себя отслеживание объектов с помощью Ultralytics! Узнайте, как track движение, поведение и взаимодействие в видео с помощью моделей YOLO для приложений реального времени.

Отслеживание объектов является ключевой задачей в компьютерного зрения (КВ), которая включает в себя идентификацию конкретных объектов в видеопоследовательности и отслеживание их перемещения по последовательным кадрам. В отличие от статического анализа изображений в отличие от статического анализа изображений, этот процесс вводит временное измерение, позволяя системам сохранять уникальную идентичность для каждого обнаруженного объекта по мере его перемещения по сцене. Присваивая каждому объекту постоянный идентификационный номер (ID), модели искусственного интеллекта (ИИ) могут анализировать траектории движения, рассчитывать скорость и понимать взаимодействие во времени. Эта возможность необходима для преобразования необработанных видеоданных в полезные сведения, служащие основой для передовых передовых систем понимания видео.

Основные механизмы слежения

Современные системы слежения обычно работают в парадигме "слежение по обнаружению". Этот рабочий процесс начинается с модели обнаружения объекта, такой как современная модель YOLO11которая определяет местоположение объектов в каждом отдельном кадре. После обнаружения и локализации объектов с помощью ограничительные рамки, алгоритм отслеживания берет на себя задачу связывать эти обнаруженные объекты с существующими треками из предыдущих кадров.

Как правило, этот процесс включает в себя три важнейших этапа:

  1. Предсказание движения: Алгоритмы, подобные фильтр Калмана (KF), используют прошлое местоположение объекта местоположение и скорость объекта, чтобы оценить, где он может появиться в следующем кадре. Это предсказание сужает область поиска сужает область поиска, значительно повышая эффективность вычислений.
  2. Объединение данных: Система сопоставляет вновь обнаруженные объекты с существующими треками, используя оптимизационные методов, таких как венгерский алгоритм. Этот шаг опирается на такие метрики, как Пересечение над объединением (IoU) для пространственного совпадения или сходства визуальных признаков.
  3. Поддержание личности: Сложные трекеры, такие как ByteTrack и BoT-SORT, справляются со сложными сценариями, в которых объекты пересекаются или временно скрыты за препятствиями (окклюзия). Используя извлечение признаков и глубокое обучение вкраплений, система может повторно идентифицировать объект даже после его повторного появления, предотвращая "подмену идентификатора".

Отслеживание объектов в сравнении с обнаружением объектов

Хотя эти термины часто упоминаются вместе, они служат разным целям в конвейере машинного обучения (ML).

  • Обнаружение объектов отвечает на вопрос: "Что и где присутствует на этом изображении?". Он рассматривает каждый кадр как независимое событие, выводя метки классов и оценки доверия, не помня о прошлом.
  • Функция отслеживания объектов отвечает на вопрос "Куда движется этот конкретный объект?". Оно связывает обнаружения во времени, позволяя системе распознать, что автомобиль в кадре 10 - это тот же автомобиль, что и в кадре 100. Это различие жизненно важно для приложений, требующих прогностического моделирования поведения.

Применение в реальном мире

Способность надежно следить за объектами преобразует различные отрасли промышленности, позволяя в реальном времени в динамических средах.

  • Интеллектуальные транспортные системы: В сфере автономных транспортных средств отслеживание не подлежит обсуждению. Самоуправляемые автомобили должны track пешеходами, велосипедистами и другими транспортными средствами, чтобы предсказывать их будущее и избегать столкновений. Для этого часто приходится объединять данные с камер и LiDAR-сенсоров для поддержания точности в различных погодных условиях.
  • Аналитика розничной торговли: Кирпичные и обычные магазины используют ИИ в розничной торговле для составления карт путешествий покупателей. Отслеживая отслеживая движение покупателей, ритейлеры могут создавать тепловые карты популярных проходов, анализировать время пребывания покупателей и оптимизировать планировку магазина. планировки. Эти данные помогают эффективно управлению очередями и размещению товарных запасов.
  • Спортивный анализ: Профессиональные команды используют трекинг для анализа характеристик игроков. Сочетая отслеживания с оценкой позы, тренеры могут оценить биомеханику, скорость и командные расстановки, обеспечивая конкурентное преимущество благодаря стратегии, основанной на данных.

Реализация трекинга с помощью Python

Реализовать высокопроизводительное отслеживание очень просто с помощью ultralytics пакет. Следующий пример демонстрирует, как загрузить предварительно обученный Модель YOLO11 и track объекты в видеофайле. Сайт track режим автоматически обрабатывает обнаружение и назначение идентификатора.

from ultralytics import YOLO

# Load the official YOLO11 nano model
model = YOLO("yolo11n.pt")

# Track objects in a video source (use '0' for webcam)
# The 'show=True' argument visualizes the tracking IDs in real-time
results = model.track(source="https://supervision.roboflow.com/assets/", show=True)

# Print the unique IDs detected in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked IDs: {results[0].boxes.id.cpu().numpy()}")

Связанные понятия

Чтобы полностью разобраться в тонкостях трекинга, полезно понять следующее Многообъектное отслеживание (MOT), которое в частности, для работы с несколькими целями одновременно в многолюдных сценах. Кроме того, отслеживание часто сочетается с сегментацией объектов для track точные контуры объектов, а не просто ограничительные рамки, что обеспечивает более высокий уровень детализации для таких задач, как медицинская визуализации или роботизированного манипулирования.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас