Руководство по отслеживанию движущихся объектов на видео с помощью моделей Ultralytics YOLO

Абирами Вина

5 минут чтения

15 апреля 2025 г.

Узнайте, как работают системы компьютерного зрения, изучите популярные модели для отслеживания объектов, такие как YOLO11, и откройте для себя их реальное применение.

Роботы, собирающие электрические детали, системы, ловящие превышающие скорость автомобили, умные решения для розничной торговли, отслеживающие покупки клиентов, - все эти инновации основаны на компьютерном зрении. Это направление искусственного интеллекта (ИИ), которое помогает машинам анализировать и понимать изображения и видео.

Например, робот должен распознавать и отслеживать различные детали, чтобы правильно собрать их вместе. Аналогичным образом, система дорожного движения может использовать компьютерное зрение для обнаружения автомобилей, считывания номерных знаков и определения превышения скорости. В то же время в магазинах искусственное зрение может помочь отследить, на что смотрят или что берут покупатели, и даже проследить за инвентаризацией.

В таких приложениях используются модели компьютерного зрения, такие как Ultralytics YOLO11, которые поддерживают широкий спектр визуальных задач. Многие из этих задач направлены на сбор информации по одному изображению, но одна особенно интересная задача - отслеживание объектов- может использоваться для отслеживания перемещения объектов по серии изображений или видеокадров.

__wf_reserved_inherit
Рис. 1. Пример обнаружения и отслеживания автомобилей.

В этом руководстве мы подробно рассмотрим, как работает отслеживание объектов, и изучим реальные примеры его использования. Мы также обсудим, как модели Vision AI, такие как Ultralytics YOLO11, поддерживают отслеживание объектов. Давайте начнем!

Пристальный взгляд на системы слежения с помощью компьютерного зрения

Отслеживание объектов - это задача компьютерного зрения , используемая для отслеживания перемещения объектов по видеокадрам, что помогает системам отслеживать и понимать, как изменяются объекты с течением времени. Это очень похоже на то, как человек может естественным образом следить глазами за движущимся человеком или объектом, например, когда вы смотрите теннисный матч и ваши глаза следят за мячом, который движется по корту взад-вперед.

Аналогичным образом слежение за объектами предполагает использование камер и искусственного интеллекта для отслеживания движения мяча в режиме реального времени. Эта технология позволяет зрителям дома лучше понять ход игры, особенно благодаря таким аналитическим показателям, как скорость, траектория и позиционирование игрока.

В то время как для человека такое визуальное отслеживание может показаться легким, в машинном зрении оно включает в себя ряд шагов, выполняемых моделями искусственного интеллекта Vision AI. Вот простая схема того, как работает отслеживание объектов: 

  • Съемка видео: Камеры записывают видеоматериалы, фиксируя, как объекты перемещаются по сцене с течением времени.
  • Обнаружение объектов: Модели компьютерного зрения на основе искусственного интеллекта, такие как YOLO11, могут анализировать каждый кадр для идентификации и определения местоположения конкретных объектов, таких как люди, транспортные средства или продукты.
  • Присвоение идентификатора: Как только объект обнаружен, алгоритмы слежения присваивают ему уникальный идентификатор, который будет следовать за ним на протяжении нескольких кадров, гарантируя, что система знает, что это один и тот же объект, даже когда он движется.
  • Мониторинг движения: Система отслеживает движение во времени, и эти данные могут быть использованы для сбора информации о скорости, направлении и взаимодействии с другими объектами.
  • Генерирование информации: Эта информация может использоваться в режиме реального времени для аналитики, помощи в принятии решений или визуального наложения - в зависимости от конкретного случая использования.

Сравнение обнаружения и отслеживания объектов с помощью YOLO

Еще одна задача компьютерного зрения, поддерживаемая YOLO11, которая тесно связана с отслеживанием объектов, - это обнаружение объектов. Давайте рассмотрим разницу между этими двумя задачами. 

Обнаружение объектов включает в себя идентификацию и определение местоположения интересующих объектов в одном кадре изображения или видео. Например, самодвижущийся автомобиль использует обнаружение объектов, чтобы распознать знак "Стоп" или пешехода в одном кадре, снятом камерами на борту. Оно отвечает на вопросы: "Что и где находится на этом изображении?". Однако он не дает никакой информации о том, куда объект направляется дальше.

Отслеживание объектов опирается на обнаружение объектов, добавляя понимание движения во времени. Ключевое различие между этими двумя методами заключается в том, как они обрабатывают время и движение. При обнаружении объектов каждый кадр рассматривается как независимый снимок, в то время как при отслеживании объектов соединяются точки между кадрами, используя прошлые данные для предсказания будущего положения объекта.

Сочетание этих двух технологий позволяет создавать мощные системы искусственного зрения, способные в реальном времени отслеживать перемещения в динамичных средах. Например, автоматизированная система безопасности может обнаруживать людей, входящих в помещение, и непрерывно отслеживать их перемещение по кадру.

Отслеживание в реальном времени с помощью моделей Ultralytics YOLO

Теперь, когда мы рассмотрели разницу между обнаружением и отслеживанием объектов, давайте посмотрим, как модели Ultralytics YOLO, такие как YOLO11, поддерживают отслеживание объектов в режиме реального времени.

Хотя модели YOLO не являются алгоритмами отслеживания, они играют важную роль, обнаруживая объекты в каждом видеокадре. После обнаружения объектов алгоритмы слежения необходимы для присвоения им уникальных идентификаторов, что позволяет системе следить за их перемещением от кадра к кадру. 

Для решения этой задачи пакет Ultralytics Python легко интегрирует обнаружение объектов с популярными алгоритмами отслеживания, такими как BoT-SORT и ByteTrack. Эта интеграция позволяет пользователям запускать обнаружение и отслеживание вместе с минимальными настройками.

При использовании моделей YOLO для отслеживания объектов вы можете выбрать, какой алгоритм отслеживания применить, исходя из требований вашего приложения. Например, BoT-SORT - хороший вариант для слежения за объектами, которые движутся непредсказуемо, благодаря использованию предсказания движения и глубокого обучения. ByteTrack, с другой стороны, особенно хорошо работает в многолюдных сценах, обеспечивая надежное отслеживание даже при размытых или частично скрытых объектах.

__wf_reserved_inherit
Рис. 2. Пакет Ultralytics Python легко интегрирует BoT-SORT и ByteTrack.

Как обучение пользовательской модели YOLO связано с отслеживанием объектов?

Пользовательское обучение - это процесс тонкой настройки предварительно обученной модели обнаружения объектов, например YOLO11, на определенном наборе данных, чтобы она могла распознавать объекты, не включенные в стандартные наборы данных. Это особенно важно, когда система слежения должна отслеживать нестандартные или необычные объекты.

Системы слежения полагаются на модель обнаружения, чтобы сначала распознать объект. Если модель YOLO не может обнаружить конкретный объект, например определенный тип техники или вид диких животных, алгоритм слежения не сможет его отследить.

Вот почему обучение очень важно: оно гарантирует, что модель обнаружения сможет точно идентифицировать объекты, которые вы хотите отследить.

Также важно помнить, что в ходе этого процесса настраивается только модель обнаружения. Алгоритмы отслеживания, такие как BoT-SORT или ByteTrack, не настраиваются - они просто используют результаты модели YOLO для отслеживания обнаруженных объектов по кадрам.

Приложения для отслеживания объектов с помощью Ultralytics YOLO

Теперь, когда мы лучше понимаем, что такое отслеживание объектов и как оно работает, давайте рассмотрим некоторые реальные приложения, в которых эта технология оказывает влияние.

Слежение в реальном времени с использованием Ultralytics YOLO для оценки скорости

Системы оценки скорости, созданные на основе компьютерного зрения, решают такие задачи, как обнаружение и отслеживание объектов. Эти системы предназначены для расчета скорости движения объекта - будь то автомобиль, велосипедист или даже человек. Эта информация крайне важна для различных приложений - от управления дорожным движением до контроля безопасности и промышленной автоматизации.

С помощью такой модели, как Ultralytics YOLO11, можно обнаруживать и отслеживать объекты по видеокадрам. Анализируя расстояние, на которое перемещается объект за определенный промежуток времени, система может оценить его скорость. 

__wf_reserved_inherit
Рис. 3. Использование поддержки отслеживания объектов в YOLO11 для оценки скорости.

Исследование отслеживания объектов в производстве

Производственные процессы могут быть быстро развивающимися и очень сложными, что затрудняет отслеживание каждого выпускаемого изделия вручную. Отслеживание объектов - хорошее решение для автоматизации контроля продукции на каждом этапе производства. Это поможет фабрикам поддерживать высокий уровень точности и эффективности, не замедляя работу.

От подсчета продукции на конвейере до выявления дефектов или проверки правильности сборки - отслеживание объектов обеспечивает наглядность и контроль над задачами, которые в противном случае отнимали бы много времени или приводили к ошибкам. Эта технология особенно важна в таких крупносерийных отраслях, как пищевая промышленность, электроника и упаковка, где скорость и точность имеют решающее значение.

__wf_reserved_inherit
Рис. 4. Пример отслеживания и подсчета продуктов на сборочной линии с помощью YOLO11.

Обзор отслеживания объектов в аналитике розничной торговли

Каждый день бесчисленные покупатели входят и выходят из розничных магазинов, и понимание их поведения является ключом к улучшению как обслуживания покупателей, так и эффективности бизнеса. Отслеживание объектов позволяет ритейлерам контролировать пешеходный трафик, измерять время пребывания в магазине и анализировать модели движения - и все это без использования инвазивных или ручных методов.

Отслеживая людей при входе, выходе и перемещении по магазину, компании могут получить информацию о часах пик, популярных зонах и даже длине очередей. Эти данные могут быть использованы при принятии решений по подбору персонала, планировке магазина и размещению товарных запасов, что в конечном итоге приведет к повышению эффективности работы и росту продаж.

__wf_reserved_inherit
Рис. 5. Использование возможностей YOLO11 по отслеживанию объектов для наблюдения за людьми, входящими и выходящими из магазина.

Плюсы и минусы отслеживания объектов

От розничных магазинов до заводских цехов, отслеживание объектов используется во всех видах промышленности для повышения эффективности, безопасности и общего впечатления от работы. Вот некоторые из ключевых преимуществ, которые может дать отслеживание объектов в различных отраслях:

  • Обеспечивает оповещения в режиме реального времени: Системы, интегрированные с системой слежения за объектами, можно настроить на автоматическое включение оповещений при обнаружении чего-то необычного, например человека, входящего в запретную зону, или доставки, оставленной на одном месте слишком долго.
  • Интеграция с другими системами: Данные отслеживания объектов можно объединить с другими технологиями, такими как распознавание лиц, тепловизоры или системы инвентаризации, чтобы получить еще более глубокие знания.
  • Экономическая эффективность в долгосрочной перспективе: Хотя первоначальная настройка может потребовать инвестиций, автоматизированное отслеживание снижает потребность в ручном труде, уменьшает количество ошибок и со временем сокращает эксплуатационные расходы.

Хотя эти преимущества подчеркивают, как отслеживание объектов положительно влияет на различные сценарии использования, важно также учитывать проблемы, связанные с его реализацией. Давайте подробнее рассмотрим некоторые ограничения, связанные с отслеживанием объектов:

  • Трудности в Многолюдные места: В оживленных местах, таких как концерты, торговые центры или городские улицы, системы слежения могут с трудом различать людей или объекты, расположенные близко друг к другу, что приводит к путанице или неточным результатам.
  • Чувствительность к условиям окружающей среды: Плохое освещение, туман, быстрое движение или дрожание камеры могут повлиять на способность системы точно отслеживать объекты, особенно на открытом воздухе или в неконтролируемой среде.
  • Конфиденциальность и юридические проблемы: Неправильная обработка персональных данных, отсутствие согласия пользователей или слежка в общественных местах могут вызвать этические проблемы и привести к несоблюдению законов о защите частной жизни.

Основные выводы

Отслеживание объектов - это задача компьютерного зрения, позволяющая машинам следить за перемещением объектов во времени. Она используется в самых разных реальных сценариях - от оценки скорости автомобиля и подсчета изделий на сборочном конвейере до анализа движений игроков в спорте.

Благодаря моделям искусственного интеллекта Vision AI, таким как YOLO11, и алгоритмам отслеживания, таким как BoT-SORT и ByteTrack, отслеживание объектов стало быстрее, умнее и доступнее в различных отраслях. По мере развития технологии отслеживания объектов она помогает системам становиться более интеллектуальными, эффективными и быстро реагирующими на каждый кадр.

Хотите узнать больше о компьютерном зрении и искусственном интеллекте? Изучите наш репозиторий GitHub, общайтесь с нашим сообществом и ознакомьтесь с нашими вариантами лицензирования, чтобы начать свой проект по компьютерному зрению. Если вы изучаете такие инновации, как ИИ в производстве и компьютерное зрение в автомобильной промышленности, посетите страницы наших решений, чтобы узнать больше. 

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена