Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Настройки cookie
Нажимая “Принять все файлы cookie”, вы соглашаетесь на сохранение файлов cookie на вашем устройстве с целью улучшения навигации по сайту, анализа использования сайта и помощи в наших маркетинговых усилиях. Подробнее
Узнайте, как искусственный интеллект и компьютерное зрение делают отслеживание движения более интеллектуальным, быстрым и надежным в спорте, робототехнике, мобильных приложениях и других реальных рабочих процессах.
Когда вы смотрите спектакль и ваш любимый актер перемещается по сцене, ваши глаза могут следить за ним практически без особых усилий. Для человека такое отслеживание движения кажется естественным. Ваш мозг автоматически связывает то, что вы видите в один момент, с тем, что вы видите в следующий, заполняя пробелы и сохраняя ощущение непрерывности при смене сцены.
Когда речь заходит о машинах, та же самая задача становится гораздо более сложной. Камера снимает видео в виде последовательности отдельных кадров, и система должна повторно идентифицировать один и тот же объект шаг за шагом, чтобы оценить, куда он переместился, и решить, следует ли за ним продолжать следить.
Эта задача лежит в основе отслеживания движения. Отслеживание движения предполагает отслеживание объекта на видео в динамике и играет важную роль в таких областях, как спортивный анализ, робототехника и мобильные приложения.
Традиционное отслеживание движения и камеры часто зависит от ручной настройки, track и ключевых кадров. Это может работать в простых сценах, но быстро становится медленным и ненадежным, когда движение быстрое или частично заблокировано.
Рис. 1. Взгляд на систему отслеживания движения (Источник)
Последние достижения в области компьютерного зрения значительно упрощают эту задачу. Компьютерное зрение — это отрасль искусственного интеллекта, которая помогает машинам понимать изображения и видео, делая отслеживание движения более точным и менее зависимым от ручной работы. Обнаруживая объекты в каждом кадре и сохраняя их идентичность с течением времени, эти системы более надежно track в реальных условиях.
В этой статье мы рассмотрим, как компьютерное зрение может упростить отслеживание движения. Приступим!
Традиционные методы захвата и отслеживания движения и их ограничения
Традиционное отслеживание движения часто требует тщательной ручной настройки, особенно при монтаже видео и работе с визуальными эффектами, где цель состоит в том, чтобы прикрепить графику, эффекты или наложения к движущимся элементам в отснятом материале.
Многие рабочие процессы начинаются с размещения track на определенных частях кадра, а затем программное обеспечение отслеживает их по кадрам, чтобы составить карту траектории движения. Это обычная практика в таких инструментах, как After Effects, и аналогичные рабочие процессы присутствуют в Premiere Pro благодаря таким функциям, как отслеживание маски, когда редакторы track или область в динамике.
Еще один распространенный метод — сопоставление движения. Он помогает согласовать цифровые элементы с реальным движением камеры, чтобы эффекты или графика оставались на месте в живом кадре. Эти подходы хорошо работают для более простых сцен, но часто не справляются, когда кадр перегружен или объекты движутся быстро.
Отслеживание также может сбой при изменении освещения или частичном закрытии объектов, что может привести к смещению или резким скачкам в track. Это замедляет рабочий процесс и вынуждает редакторов переделывать отдельные фрагменты съемки. Когда объекты быстро меняют направление движения, старые системы отслеживания движения могут не успевать за ними, что приводит к нестабильным результатам, которым трудно доверять.
Как компьютерное зрение преобразует отслеживание движения
Передовые системы компьютерного зрения используют модели искусственного интеллекта для отслеживания движущихся объектов на видео. Вместо постоянных ручных настроек или нестабильного отслеживания кадр за кадром, модель изучает внешний вид объекта и его характер движения. Это помогает отслеживанию движения оставаться стабильным даже при насыщенных сценах, изменении освещения или кратковременном исчезновении объектов.
Например, модели компьютерного зрения, такие как Ultralytics YOLO11 и готовящаяся к выпуску Ultralytics , поддерживают отслеживание объектов путем их обнаружения в каждом кадре. Проще говоря, они определяют, что находится в кадре и где именно, выводя ограничительные рамки и оценки достоверности для каждого обнаруженного объекта.
Рис. 2. Отслеживание транспортных средств с помощью Ultralytics YOLO11 зоны (Источник)
Интересно, что YOLO на самом деле не track во времени самостоятельно. Вместо этого отслеживание осуществляется с помощью Python Ultralytics Python , который связывает YOLO с алгоритмами отслеживания нескольких объектов, такими как ByteTrack и BoT-SORT. В этой конфигурации YOLO объекты кадр за кадром, а трекер связывает эти обнаружения между кадрами, чтобы сохранить единый идентификатор для каждого объекта по мере его движения.
Реальные применения отслеживания движения на основе искусственного интеллекта
Далее давайте подробнее рассмотрим несколько реальных приложений, в которых отслеживание движения на основе искусственного интеллекта оказывает значительное влияние.
Спортивная аналитика и точное отслеживание игроков
В футбольном матче игроки постоянно ускоряются, останавливаются и меняют направление движения, что затрудняет точное измерение их перемещений по полю. В таких моментах ручное отслеживание часто дает сбой, особенно когда игроки пересекаются, сгруппировываются или перемещаются в местах скопления игроков.
Отслеживание движения с помощью искусственного интеллекта помогает следить за каждым игроком во время действия и сохранять четкость и последовательность их траекторий движения. Например, в одном из недавних исследований ученые использовали YOLO11 detect и мяча с нескольких ракурсов камеры. YOLO11 каждого игрока в каждом кадре, а система отслеживания связывала эти обнаружения во времени, чтобы сохранить идентичность каждого игрока во время его движения.
Рис. 3. Обнаружение и отслеживание нескольких футболистов (Источник)
Отслеживание движения в дополненной реальности и виртуальной реальности
Дополненная реальность (AR) позволяет приложениям размещать цифровые объекты в реальном мире, например, этикетку на продукте, персонажа на полу или наложение на вашу ногу, когда вы двигаетесь. Чтобы эти впечатления казались правдоподобными, виртуальный контент должен оставаться закрепленным в нужном месте, когда вы ходите, наклоняете телефон или перемещаете сам объект.
Компьютерное зрение играет здесь ключевую роль, поскольку помогает мобильному устройству понять, на что оно смотрит и как камера движется по сцене. Другими словами, оно обеспечивает 3D-отслеживание, оценивая, где находится объект в пространстве и как он ориентирован, а затем обновляя это положение по мере движения пользователя.
Рис. 4. Пример 3D-отслеживания в приложении AR (Источник)
Виртуальная реальность (VR) основана на аналогичных идеях отслеживания, но ее цель иная. Вместо привязки цифрового контента к реальному миру, VR фокусируется на отслеживании положения вашей головы и рук, чтобы виртуальный мир естественно реагировал на ваши движения.
Отслеживание движущегося оборудования и автоматизация процессов
В промышленных условиях оборудование и продукция часто проходят несколько этапов рабочего процесса. Каждый этап зависит от точного времени и координации. Ручное отслеживание может отставать, поскольку предметы движутся с разной скоростью, пересекаются друг с другом или быстро меняют положение.
Отслеживание движения с помощью искусственного интеллекта помогает производственным системам получить более четкое представление о каждом объекте, движущемся по линии. В рамках интересного исследования сеть подключенных камер отслеживала продукты на протяжении всего производственного цикла и обновляла цифровой двойник, виртуальную копию реального процесса, в режиме реального времени.
Система идентифицировала каждый продукт, отслеживала его перемещение и синхронизировала цифровую модель с тем, что происходило на производстве. Такой подход улучшил мониторинг и обеспечил более безопасную работу, предоставив операторам надежную информацию на каждом этапе. Он также продемонстрировал, как отслеживание движения может обеспечить более гибкую и масштабируемую автоматизацию при наличии согласованных данных отслеживания.
Плюсы и минусы отслеживания движения с помощью искусственного интеллекта
Вот несколько преимуществ использования отслеживания движения на основе искусственного интеллекта:
Улучшенное восстановление после потери связи: системы Vision AI часто могут сохранять или восстанавливать отслеживание, когда объекты перекрываются или на короткое время исчезают.
Масштабируемость: После развертывания AI-трекеры могут обрабатывать длинные видеоролики и несколько потоков с камер без повторной настройки для каждого кадра.
Более подробные данные о движении: результаты отслеживания можно использовать для измерения траекторий, подсчета, времени пребывания и базовых оценок скорости для аналитики.
Отслеживание на основе искусственного интеллекта хорошо работает во многих случаях, но не во всех конфигурациях. Вот некоторые ограничения, которые следует учитывать:
Текущее обслуживание: производительность может меняться со временем в связи с изменением углов камеры, условий окружающей среды или рабочей нагрузки, поэтому часто требуются периодические обновления.
Сложность интеграции: для подключения трекеров к существующим видеоредакторам, системам аналитики или автоматизации могут потребоваться адаптеры, калибровка и дополнительное тестирование.
Крайние случаи в экстремальных условиях: слабое освещение, смазывание движения, сильное затенение и очень маленькие объекты все еще могут вызывать ошибки отслеживания.
Основные выводы
Функции отслеживания движения на основе искусственного интеллекта быстро становятся более практичным выбором для реальных видео, где движение быстрое, сцены переполнены, а ручные исправления не масштабируются. Компьютерное зрение быстро совершенствуется, что делает системы отслеживания более простыми в развертывании и более надежными в сложных условиях. В результате отслеживание движения становится все более полезным в робототехнике, мобильных приложениях, аналитике и создании контента.