Настраивайтесь на YOLO Vision 2025!
25 сентября 2025 г.
10:00 — 18:00 BST
Гибридное мероприятие
Yolo Vision 2024

Руководство по отслеживанию движущихся объектов в видео с помощью моделей Ultralytics YOLO

Абирами Вина

5 мин чтения

15 апреля 2025 г.

Узнайте, как работают системы отслеживания на основе компьютерного зрения, изучите популярные модели, поддерживающие отслеживание объектов, такие как YOLO11, и откройте для себя их реальные приложения.

Роботы, которые могут собирать электрические детали, системы, которые ловят превышающие скорость автомобили, и интеллектуальные розничные решения, которые отслеживают, как покупатели совершают покупки, — все эти инновации основаны на компьютерном зрении. Это раздел искусственного интеллекта (ИИ), который помогает машинам анализировать и понимать изображения и видео.

Например, роботу необходимо распознавать и отслеживать различные детали, чтобы правильно их собрать. Аналогично, система управления дорожным движением может использовать компьютерное зрение для обнаружения автомобилей, считывания номерных знаков и определения превышения скорости. Между тем, в магазинах Vision AI может помочь отслеживать, что покупатели смотрят или берут, и даже следить за запасами.

Такие приложения работают на основе моделей компьютерного зрения, таких как Ultralytics YOLO11, которые поддерживают широкий спектр визуальных задач. Многие из этих задач сосредоточены на сборе информации из одного изображения, но одна особенно интересная задача, отслеживание объектов, может использоваться для отслеживания движения объектов по серии изображений или видеокадров.

__wf_reserved_inherit
Рис. 1. Пример обнаружения и отслеживания автомобилей.

В этом руководстве мы подробно рассмотрим, как работает отслеживание объектов, и изучим реальные примеры его использования. Мы также обсудим, как модели Vision AI, такие как Ultralytics YOLO11, поддерживают отслеживание объектов. Давайте начнем!

Более пристальный взгляд на системы отслеживания компьютерного зрения

Отслеживание объектов — это задача компьютерного зрения, используемая для отслеживания движения объектов в видеокадрах, помогающая системам отслеживать и понимать, как вещи меняются с течением времени. Это очень похоже на то, как люди могут естественным образом следить за движущимся человеком или объектом своими глазами, например, когда вы смотрите теннисный матч и ваши глаза следят за мячом, когда он движется вперед и назад по корту.

Точно так же отслеживание объектов включает в себя использование камер и ИИ для отслеживания движения мяча в режиме реального времени. Эта технология может дать зрителям дома лучшее понимание хода игры, особенно с помощью аналитики, такой как скорость, траектория и позиционирование игроков.

Хотя такой вид визуального отслеживания может показаться людям легким, когда дело доходит до машинного зрения, он включает в себя ряд шагов, основанных на моделях Vision AI. Вот простое описание того, как работает отслеживание объектов: 

  • Запись видео: Камеры записывают видеоматериалы, фиксируя, как объекты перемещаются по сцене с течением времени.
  • Обнаружение объектов: Модели компьютерного зрения на основе ИИ, такие как YOLO11, могут анализировать каждый кадр для идентификации и определения местоположения конкретных объектов, таких как люди, транспортные средства или продукты.
  • Присвоение идентификатора: После обнаружения объекта алгоритмы отслеживания присваивают ему уникальный идентификатор для отслеживания его по нескольким кадрам, гарантируя, что система знает, что это один и тот же объект, даже когда он движется.
  • Мониторинг движения: Система отслеживает движение во времени, и эти данные можно использовать для сбора такой информации, как скорость, направление и взаимодействие с другими объектами.
  • Генерация аналитических данных: Эта информация может использоваться в режиме реального времени для предоставления аналитики, помощи в принятии решений или для визуальных наложений - в зависимости от конкретного случая использования.

Сравнение обнаружения объектов и отслеживания с помощью YOLO

Еще одна задача компьютерного зрения, поддерживаемая YOLO11 и тесно связанная с отслеживанием объектов, — это обнаружение объектов. Давайте рассмотрим разницу между этими двумя задачами. 

Обнаружение объектов включает в себя идентификацию и локализацию интересующих объектов в пределах одного изображения или видеокадра. Например, беспилотный автомобиль использует обнаружение объектов для распознавания знака остановки или пешехода в одном кадре, снятом бортовыми камерами. Это отвечает на вопрос: «Что находится на этом изображении и где это находится?». Однако это не дает никакой информации о том, куда объект движется дальше.

Отслеживание объектов основывается на обнаружении объектов, добавляя понимание движения во времени. Ключевое различие между ними заключается в том, как они обрабатывают время и движение. Обнаружение объектов рассматривает каждый кадр как независимый снимок, а отслеживание объектов соединяет точки между кадрами, используя прошлые данные для прогнозирования будущего положения объекта.

Объединив оба подхода, мы можем создавать мощные системы машинного зрения, способные отслеживать объекты в реальном времени в динамических средах. Например, автоматизированная система безопасности может обнаруживать людей, входящих в помещение, и непрерывно отслеживать их перемещение в кадре.

Отслеживание в реальном времени с использованием моделей Ultralytics YOLO

Теперь, когда мы рассмотрели разницу между детекцией и отслеживанием объектов, давайте посмотрим, как модели Ultralytics YOLO, такие как YOLO11, поддерживают отслеживание объектов в реальном времени.

Хотя модели YOLO сами по себе не являются алгоритмами отслеживания, они играют важную роль, обнаруживая объекты в каждом кадре видео. После обнаружения объектов необходимы алгоритмы отслеживания, чтобы присвоить им уникальные идентификаторы, позволяющие системе отслеживать их перемещение от кадра к кадру. 

Для удовлетворения этой потребности пакет Ultralytics Python легко интегрирует обнаружение объектов с популярными алгоритмами отслеживания, такими как BoT-SORT и ByteTrack. Эта интеграция позволяет пользователям запускать обнаружение и отслеживание вместе с минимальной настройкой.

При использовании моделей YOLO для отслеживания объектов вы можете выбрать алгоритм отслеживания, который будет применяться в зависимости от требований вашего приложения. Например, BoT-SORT — хороший вариант для отслеживания объектов, которые движутся непредсказуемо, благодаря использованию прогнозирования движения и глубокого обучения. ByteTrack, с другой стороны, особенно хорошо работает в переполненных сценах, поддерживая надежное отслеживание даже тогда, когда объекты размыты или частично скрыты.

__wf_reserved_inherit
Рис. 2.  Python-пакет Ultralytics легко интегрирует BoT-SORT и ByteTrack.

Как обучение пользовательской модели YOLO связано с отслеживанием объектов?

Пользовательское обучение — это процесс точной настройки предварительно обученной модели обнаружения объектов, такой как YOLO11, на конкретном наборе данных, чтобы она могла распознавать объекты, не включенные в стандартные наборы данных. Это особенно важно, когда вашей системе отслеживания необходимо следить за нестандартными или редкими объектами.

Системы отслеживания полагаются на модель обнаружения для первоначального распознавания объекта. Если модель YOLO не может обнаружить конкретный объект, например, определенный тип оборудования или вид диких животных, алгоритм отслеживания не сможет его отследить.

Вот почему кастомное обучение имеет важное значение: оно гарантирует, что модель обнаружения сможет точно идентифицировать объекты, которые вы хотите отслеживать.

Также важно помнить, что в ходе этого процесса тонкой настройке подвергается только модель обнаружения. Алгоритмы отслеживания, такие как BoT-SORT или ByteTrack, не обучаются индивидуально — они просто используют выходные данные модели YOLO для отслеживания обнаруженных объектов в кадрах.

Применение отслеживания объектов с помощью Ultralytics YOLO

Теперь, когда у нас есть лучшее понимание того, что такое отслеживание объектов и как оно работает, давайте рассмотрим некоторые реальные приложения, в которых эта технология оказывает влияние.

Отслеживание в реальном времени с использованием Ultralytics YOLO для оценки скорости

Системы оценки скорости, основанные на компьютерном зрении, зависят от таких задач, как обнаружение и отслеживание объектов. Эти системы предназначены для расчета скорости движения объекта — будь то транспортное средство, велосипедист или даже человек. Эта информация имеет решающее значение для различных приложений, от управления дорожным движением до мониторинга безопасности и промышленной автоматизации.

Используя такую модель, как Ultralytics YOLO11, можно обнаруживать и отслеживать объекты в видеокадрах. Анализируя, насколько далеко объект перемещается за определенный период времени, система может оценить его скорость. 

__wf_reserved_inherit
Рис. 3. Использование поддержки отслеживания объектов в YOLO11 для оценки скорости.

Изучение отслеживания объектов в производстве

Производственные процессы могут быть быстрыми и очень сложными, что затрудняет отслеживание каждого производимого изделия вручную. Отслеживание объектов предлагает хорошее решение для автоматизации мониторинга продукции по мере ее продвижения по каждому этапу производства. Это может помочь предприятиям поддерживать высокий уровень точности и эффективности, не замедляя процесс.

От подсчета продукции на конвейерной ленте до выявления дефектов или проверки правильности сборки, отслеживание объектов обеспечивает наглядность и контроль над задачами, которые в противном случае были бы трудоемкими или подверженными ошибкам. Эта технология особенно эффективна в отраслях с большими объемами производства, таких как пищевая промышленность, электроника и упаковка, где скорость и точность имеют решающее значение.

__wf_reserved_inherit
Рис. 4. Пример отслеживания и подсчета пищевых продуктов на конвейерной линии с использованием YOLO11.

Обзор отслеживания объектов в розничной аналитике

Бесчисленное количество клиентов ежедневно входит и выходит из розничных магазинов, и понимание их поведения является ключом к улучшению как клиентского опыта, так и эффективности бизнеса. Отслеживание объектов позволяет розничным продавцам отслеживать посещаемость, измерять время пребывания и анализировать модели передвижения — и все это без необходимости использования инвазивных или ручных методов.

Отслеживая людей, когда они входят, выходят и перемещаются по магазину, предприятия могут получить представление о пиковых часах, популярных зонах и даже длине очередей. Эти данные могут быть использованы для принятия решений о штатном расписании, планировке магазина и размещении товаров, что в конечном итоге приведет к повышению эффективности работы и увеличению продаж.

__wf_reserved_inherit
Рис. 5. Использование возможностей отслеживания объектов YOLO11 для мониторинга входящих и выходящих людей из магазина.

Плюсы и минусы отслеживания объектов

От розничных магазинов до заводских цехов, отслеживание объектов используется во всех видах отраслей для улучшения таких факторов, как эффективность, безопасность и общее впечатление. Вот некоторые из ключевых преимуществ, которые отслеживание объектов может принести различным отраслям:

  • Обеспечивает оповещения в реальном времени: Системы, интегрированные с отслеживанием объектов, можно настроить для автоматического запуска оповещений при обнаружении чего-либо необычного, например, когда человек входит в запрещенную зону или доставка остается слишком долго в одном месте.
  • Интегрируется с другими системами: Данные отслеживания объектов можно комбинировать с другими технологиями, такими как распознавание лиц, тепловизионные камеры или системы инвентаризации, для получения еще более мощной аналитической информации.
  • Экономичность в долгосрочной перспективе: Хотя первоначальная настройка может потребовать инвестиций, автоматизированное отслеживание снижает потребность в ручном труде, снижает частоту ошибок и сокращает операционные расходы с течением времени.

Хотя эти преимущества показывают, как отслеживание объектов положительно влияет на различные варианты использования, важно также учитывать проблемы, связанные с его внедрением. Давайте подробнее рассмотрим некоторые ограничения отслеживания объектов:

  • Сложности в многолюдных местах: В оживленных местах, таких как концерты, торговые центры или городские улицы, системы слежения могут испытывать трудности с различением людей или объектов, находящихся близко друг к другу, что приводит к путанице или неточным результатам.
  • Чувствительность к условиям окружающей среды: Плохое освещение, туман, быстрое движение или дрожание камеры могут повлиять на способность системы точно отслеживать объекты, особенно на открытом воздухе или в неконтролируемых средах.
  • Конфиденциальность и юридические аспекты: Неправильное обращение с персональными данными, отсутствие согласия пользователя или наблюдение в общественных местах могут вызвать этические вопросы и привести к несоблюдению законов о конфиденциальности.

Основные выводы

Отслеживание объектов — это задача компьютерного зрения, которая позволяет машинам следить за движением объектов с течением времени. Он используется в широком спектре реальных сценариев — от оценки скорости транспортных средств и подсчета продуктов на сборочной линии до анализа движений игроков в спорте.

Благодаря моделям Vision AI, таким как YOLO11, и алгоритмам отслеживания, таким как BoT-SORT и ByteTrack, отслеживание объектов стало быстрее, умнее и доступнее в различных отраслях. По мере развития технологии отслеживания объектов она помогает системам становиться более интеллектуальными, эффективными и отзывчивыми, кадр за кадром.

Хотите узнать больше о компьютерном зрении и ИИ? Изучите наш репозиторий на GitHub, свяжитесь с нашим сообществом и ознакомьтесь с нашими вариантами лицензирования, чтобы ускорить свой проект в области компьютерного зрения. Если вы изучаете такие инновации, как ИИ в производстве и компьютерное зрение в автомобильной промышленности, посетите страницы с нашими решениями, чтобы узнать больше. 

Давайте строить будущее
ИИ вместе!

Начните свой путь в будущее машинного обучения

Начать бесплатно
Ссылка скопирована в буфер обмена