Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас

Руководство по отслеживанию движущихся объектов на видео с помощью моделей Ultralytics YOLO

Абирами Вина

5 мин чтения

15 апреля 2025 г.

Узнайте, как работают системы отслеживания компьютерного зрения, изучите популярные модели, поддерживающие отслеживание объектов, например YOLO11, и откройте для себя их реальное применение.

Роботы, собирающие электрические детали, системы, ловящие превышающие скорость автомобили, умные решения для розничной торговли, track покупки клиентов, - все эти инновации основаны на компьютерном зрении. Это направление искусственного интеллекта (ИИ), которое помогает машинам анализировать и понимать изображения и видео.

Например, робот должен распознавать и отслеживать различные детали, чтобы правильно собрать их вместе. Аналогичным образом, система дорожного движения может использовать компьютерное зрение для обнаружения автомобилей, считывания номерных знаков и определения превышения скорости. В магазинах искусственное зрение может помочь track , на что смотрят или что берут покупатели, и даже проследить за инвентаризацией.

В таких приложениях используются модели компьютерного зрения, например Ultralytics YOLO11которые поддерживают широкий спектр визуальных задач. Многие из этих задач направлены на сбор информации по одному изображению, но одна особенно интересная задача - отслеживание объектов- может быть использована для отслеживания перемещения объектов по серии изображений или видеокадров.

__wf_reserved_inherit
Рис. 1. Пример обнаружения и отслеживания автомобилей.

В этом руководстве мы подробно рассмотрим, как работает отслеживание объектов, и изучим реальные примеры его использования. Мы также обсудим, как модели Vision AI, такие как Ultralytics YOLO11 , поддерживают отслеживание объектов. Давайте начнем!

Более пристальный взгляд на системы отслеживания компьютерного зрения

Отслеживание объектов - это задача компьютерного зрения , используемая для отслеживания перемещения объектов по видеокадрам, что помогает системам отслеживать и понимать, как изменяются объекты с течением времени. Это очень похоже на то, как человек может естественным образом следить глазами за движущимся человеком или объектом, например, когда вы смотрите теннисный матч и ваши глаза track мячом, который движется по корту взад-вперед.

Точно так же отслеживание объектов включает в себя использование камер и ИИ для отслеживания движения мяча в режиме реального времени. Эта технология может дать зрителям дома лучшее понимание хода игры, особенно с помощью аналитики, такой как скорость, траектория и позиционирование игроков.

Хотя такой вид визуального отслеживания может показаться людям легким, когда дело доходит до машинного зрения, он включает в себя ряд шагов, основанных на моделях Vision AI. Вот простое описание того, как работает отслеживание объектов: 

  • Запись видео: Камеры записывают видеоматериалы, фиксируя, как объекты перемещаются по сцене с течением времени.
  • Обнаружение объектов: Модели компьютерного зрения на основе искусственного интеллекта, такие как YOLO11 , могут анализировать каждый кадр для идентификации и определения местоположения конкретных объектов, таких как люди, транспортные средства или продукты.
  • Присвоение идентификатора: После обнаружения объекта алгоритмы отслеживания присваивают ему уникальный идентификатор для отслеживания его по нескольким кадрам, гарантируя, что система знает, что это один и тот же объект, даже когда он движется.
  • Мониторинг движения: Система отслеживает движение во времени, и эти данные можно использовать для сбора такой информации, как скорость, направление и взаимодействие с другими объектами.
  • Генерация аналитических данных: Эта информация может использоваться в режиме реального времени для предоставления аналитики, помощи в принятии решений или для визуальных наложений - в зависимости от конкретного случая использования.

Сравнение обнаружения и отслеживания объектов с помощью YOLO

Еще одна задача компьютерного зрения, поддерживаемая YOLO11 , которая тесно связана с отслеживанием объектов, - это обнаружение объектов. Давайте рассмотрим разницу между этими двумя задачами. 

Обнаружение объектов включает в себя идентификацию и локализацию интересующих объектов в пределах одного изображения или видеокадра. Например, беспилотный автомобиль использует обнаружение объектов для распознавания знака остановки или пешехода в одном кадре, снятом бортовыми камерами. Это отвечает на вопрос: «Что находится на этом изображении и где это находится?». Однако это не дает никакой информации о том, куда объект движется дальше.

Отслеживание объектов основывается на обнаружении объектов, добавляя понимание движения во времени. Ключевое различие между ними заключается в том, как они обрабатывают время и движение. Обнаружение объектов рассматривает каждый кадр как независимый снимок, а отслеживание объектов соединяет точки между кадрами, используя прошлые данные для прогнозирования будущего положения объекта.

Сочетание этих двух технологий позволяет создавать мощные системы искусственного зрения, способные в реальном времени отслеживать перемещения в динамичных средах. Например, автоматизированная система безопасности может detect людей, входящих в помещение, и непрерывно track их перемещение по кадру.

Отслеживание в реальном времени с помощью моделей Ultralytics YOLO

Теперь, когда мы рассмотрели разницу между обнаружением и отслеживанием объектов, давайте посмотрим, как модели Ultralytics YOLO , такие как YOLO11, поддерживают отслеживание объектов в режиме реального времени.

Хотя модели YOLO не являются алгоритмами слежения, они играют важную роль, обнаруживая объекты в каждом видеокадре. После обнаружения объектов алгоритмы слежения необходимы для присвоения им уникальных идентификаторов, что позволяет системе следить за их перемещением от кадра к кадру. 

Для решения этой задачи пакетUltralytics Python легко интегрирует обнаружение объектов с популярными алгоритмами отслеживания, такими как BoT-SORT и ByteTrack. Эта интеграция позволяет пользователям запускать обнаружение и отслеживание вместе с минимальными настройками.

При использовании моделей YOLO для отслеживания объектов вы можете выбрать, какой алгоритм отслеживания применить, исходя из требований вашего приложения. Например, BoT-SORT - хороший вариант для слежения за объектами, которые движутся непредсказуемо, благодаря использованию предсказания движения и глубокого обучения. ByteTrack, с другой стороны, особенно хорошо работает в многолюдных сценах, обеспечивая надежное отслеживание даже при размытых или частично скрытых объектах.

__wf_reserved_inherit
Рис. 2. Пакет Ultralytics Python легко интегрирует BoT-SORT и ByteTrack.

Как обучение пользовательской модели YOLO связано с отслеживанием объектов?

Пользовательское обучение - это процесс тонкой настройки предварительно обученной модели обнаружения объектов, например YOLO11, на определенном наборе данных, чтобы она могла распознавать объекты, не включенные в стандартные наборы данных. Это особенно важно, когда система слежения должна отслеживать нестандартные или необычные объекты.

Системы слежения полагаются на модель обнаружения, чтобы сначала распознать объект. Если модель YOLO не может detect конкретный объект, например определенный тип техники или вид диких животных, алгоритм слежения не сможет его отследить.

Вот почему обучение очень важно: оно гарантирует, что модель обнаружения сможет точно идентифицировать объекты, которые вы хотите track.

Также важно помнить, что в ходе этого процесса настраивается только модель обнаружения. Алгоритмы отслеживания, такие как BoT-SORT или ByteTrack, не настраиваются - они просто используют результаты модели YOLO для отслеживания обнаруженных объектов по кадрам.

Приложения для отслеживания объектов с помощью Ultralytics YOLO

Теперь, когда у нас есть лучшее понимание того, что такое отслеживание объектов и как оно работает, давайте рассмотрим некоторые реальные приложения, в которых эта технология оказывает влияние.

Слежение в реальном времени с использованием Ultralytics YOLO для оценки скорости

Системы оценки скорости, основанные на компьютерном зрении, зависят от таких задач, как обнаружение и отслеживание объектов. Эти системы предназначены для расчета скорости движения объекта — будь то транспортное средство, велосипедист или даже человек. Эта информация имеет решающее значение для различных приложений, от управления дорожным движением до мониторинга безопасности и промышленной автоматизации.

С помощью такой модели, как Ultralytics YOLO11, можно обнаруживать и отслеживать объекты по видеокадрам. Анализируя расстояние, на которое перемещается объект за определенный промежуток времени, система может оценить его скорость. 

__wf_reserved_inherit
Рис. 3. Использование поддержки отслеживания объектов в YOLO11для оценки скорости.

Изучение отслеживания объектов в производстве

Производственные процессы могут быть быстро развивающимися и очень сложными, что затрудняет track каждого выпускаемого изделия вручную. Отслеживание объектов - хорошее решение для автоматизации контроля продукции на каждом этапе производства. Это поможет заводам поддерживать высокий уровень точности и эффективности, не замедляя работу.

От подсчета продукции на конвейерной ленте до выявления дефектов или проверки правильности сборки, отслеживание объектов обеспечивает наглядность и контроль над задачами, которые в противном случае были бы трудоемкими или подверженными ошибкам. Эта технология особенно эффективна в отраслях с большими объемами производства, таких как пищевая промышленность, электроника и упаковка, где скорость и точность имеют решающее значение.

__wf_reserved_inherit
Рис. 4. Пример отслеживания и подсчета продуктов на сборочной линии с помощью YOLO11.

Обзор отслеживания объектов в розничной аналитике

Бесчисленное количество клиентов ежедневно входит и выходит из розничных магазинов, и понимание их поведения является ключом к улучшению как клиентского опыта, так и эффективности бизнеса. Отслеживание объектов позволяет розничным продавцам отслеживать посещаемость, измерять время пребывания и анализировать модели передвижения — и все это без необходимости использования инвазивных или ручных методов.

Отслеживая людей, когда они входят, выходят и перемещаются по магазину, предприятия могут получить представление о пиковых часах, популярных зонах и даже длине очередей. Эти данные могут быть использованы для принятия решений о штатном расписании, планировке магазина и размещении товаров, что в конечном итоге приведет к повышению эффективности работы и увеличению продаж.

__wf_reserved_inherit
Рис. 5. Использование возможностей YOLO11по отслеживанию объектов для наблюдения за людьми, входящими и выходящими из магазина.

Плюсы и минусы отслеживания объектов

От розничных магазинов до заводских цехов, отслеживание объектов используется во всех видах отраслей для улучшения таких факторов, как эффективность, безопасность и общее впечатление. Вот некоторые из ключевых преимуществ, которые отслеживание объектов может принести различным отраслям:

  • Обеспечивает оповещения в реальном времени: Системы, интегрированные с отслеживанием объектов, можно настроить для автоматического запуска оповещений при обнаружении чего-либо необычного, например, когда человек входит в запрещенную зону или доставка остается слишком долго в одном месте.
  • Интегрируется с другими системами: Данные отслеживания объектов можно комбинировать с другими технологиями, такими как распознавание лиц, тепловизионные камеры или системы инвентаризации, для получения еще более мощной аналитической информации.
  • Экономичность в долгосрочной перспективе: Хотя первоначальная настройка может потребовать инвестиций, автоматизированное отслеживание снижает потребность в ручном труде, снижает частоту ошибок и сокращает операционные расходы с течением времени.

Хотя эти преимущества показывают, как отслеживание объектов положительно влияет на различные варианты использования, важно также учитывать проблемы, связанные с его внедрением. Давайте подробнее рассмотрим некоторые ограничения отслеживания объектов:

  • Сложности в многолюдных местах: В оживленных местах, таких как концерты, торговые центры или городские улицы, системы слежения могут испытывать трудности с различением людей или объектов, находящихся близко друг к другу, что приводит к путанице или неточным результатам.
  • Чувствительность к условиям окружающей среды: Плохое освещение, туман, быстрое движение или дрожание камеры могут повлиять на способность системы точно track объекты, особенно на открытом воздухе или в неконтролируемой среде.
  • Конфиденциальность и юридические аспекты: Неправильное обращение с персональными данными, отсутствие согласия пользователя или наблюдение в общественных местах могут вызвать этические вопросы и привести к несоблюдению законов о конфиденциальности.

Основные выводы

Отслеживание объектов — это задача компьютерного зрения, которая позволяет машинам следить за движением объектов с течением времени. Он используется в широком спектре реальных сценариев — от оценки скорости транспортных средств и подсчета продуктов на сборочной линии до анализа движений игроков в спорте.

Благодаря моделям искусственного интеллекта Vision AI, таким как YOLO11 , и алгоритмам отслеживания, таким как BoT-SORT и ByteTrack, отслеживание объектов стало быстрее, умнее и доступнее в различных отраслях. По мере развития технологии отслеживания объектов она помогает системам становиться более интеллектуальными, эффективными и быстро реагирующими на каждый кадр.

Хотите узнать больше о компьютерном зрении и ИИ? Изучите наш репозиторий на GitHub, свяжитесь с нашим сообществом и ознакомьтесь с нашими вариантами лицензирования, чтобы ускорить свой проект в области компьютерного зрения. Если вы изучаете такие инновации, как ИИ в производстве и компьютерное зрение в автомобильной промышленности, посетите страницы с нашими решениями, чтобы узнать больше. 

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно