Понимание роли FPS в компьютерном зрении

Абирами Вина

4 мин. чтения

20 марта 2025 г.

Узнайте, почему FPS в компьютерном зрении имеет значение и как он влияет на обнаружение объектов в реальном времени, видеоаналитику и приложения, основанные на искусственном интеллекте.

Просмотр замедленного воспроизведения любимого спортивного момента, где отчетливо видна каждая деталь, сильно отличается от просмотра записей с камер наблюдения, которые обычно выглядят дерганными и трудноуловимыми. Ключевая техническая деталь, лежащая в основе этих различий, - FPS (Frames Per Second), то есть количество кадров, отображаемых в секунду в видео. Более высокая частота кадров в секунду обеспечивает плавное и реалистичное движение, в то время как более низкая частота кадров в секунду может привести к рывкам и снижению детализации.

Эта концепция напрямую влияет на компьютерное зрение- отрасль искусственного интеллекта, позволяющую машинам интерпретировать и анализировать визуальные данные аналогично тому, как это делает человек. В компьютерном зрении более высокий FPS означает, что системы могут захватывать больше информации каждую секунду, повышая точность обнаружения и отслеживания объектов в реальном времени.

В этой статье мы рассмотрим технические аспекты FPS и то, как они связаны с приложениями компьютерного зрения. Давайте начнем!

Что означает FPS в компьютерном зрении?

Допустим, вы играете в гоночную игру: при 60 FPS каждый поворот кажется плавным и отзывчивым, но при 20 FPS управление запаздывает, что затрудняет уклонение от препятствий. Проще говоря, можно считать, что FPS - это количество изображений, которые показываются каждую секунду. При большем количестве картинок в секунду движение выглядит плавным и естественным, а при меньшем - прерывистым.

Как и в играх, FPS является ключевой частью приложений компьютерного зрения. Более высокий FPS позволяет плавно отслеживать объекты с помощью Vision AI, в то время как низкий FPS может привести к упущению деталей. 

Например, в спортивной аналитике камерам с искусственным интеллектом требуется более высокий FPS, чтобы отслеживать быстрые передачи, движения игроков и траектории полета мяча. При более низком FPS можно упустить важный контакт ноги с мячом или быстрое изменение направления движения, что повлияет на точность анализа. 

Аналогичным образом, при мониторинге дорожного движения системы полагаются на высокую частоту кадров в секунду для обнаружения автомобилей, превышающих скорость, и смены полосы движения в режиме реального времени. Выбор правильного FPS зависит от конкретных требований каждого приложения компьютерного зрения, баланса между производительностью, эффективностью и визуальной четкостью.

__wf_reserved_inherit
Рис. 1. Сравнение различных частот кадров.

Технические аспекты FPS в компьютерном зрении

Теперь, когда мы обсудили, что такое FPS и как он используется в компьютерном зрении, давайте погрузимся в его технические аспекты - начнем с того, как рассчитать FPS видео. 

Разделив общее количество кадров на их продолжительность в секундах, вы получите FPS видео. Например, если видео содержит 96 кадров в течение 4 секунд, это означает 24 FPS - 24 изображения отображаются каждую секунду, в то время как 32 кадра в течение 4 секунд дают 8 FPS. Библиотеки Python, такие как OpenCV, можно использовать для извлечения метаданных видео, подсчета кадров и автоматического расчета FPS, что упрощает процесс анализа видео.

__wf_reserved_inherit
Рис. 2. 24 кадр/с против 8 кадр/с против 4 кадр/с.

Факторы, влияющие на FPS видео

Однако одного расчета FPS недостаточно для принятия технических решений при разработке решений для компьютерного зрения. Важно также учитывать различные факторы, которые могут повлиять на эффективную частоту кадров, такие как возможности оборудования, оптимизация программного обеспечения и условия окружающей среды. 

Вот более подробный обзор этих факторов:

  • Аппаратные возможности: Качество матрицы камеры и вычислительная мощность устройства определяют количество кадров, снимаемых каждую секунду. Лучшее аппаратное обеспечение обычно означает поддержку более высокого числа кадров в секунду и более плавное видео.
  • Оптимизация программного обеспечения: Эффективное программное обеспечение для кодирования и обработки видео помогает быстро извлекать и анализировать кадры. Это гарантирует, что видео будет обработано без лишних задержек.
  • Условия окружающей среды: Освещение и движение в сцене влияют на четкость захвата кадров. Хорошее освещение и умеренное движение могут повысить FPS, в то время как в плохих условиях для сохранения четкости может потребоваться более высокий FPS.
  • Потребности в хранении: При более высоком FPS снимается больше кадров в секунду, что приводит к увеличению размера файлов. Это повышает требования к хранению и требует более быстрой обработки данных для обеспечения плавного воспроизведения.

Изучение FPS в приложениях компьютерного зрения

Модели ИИ, подобные Ultralytics YOLO11, поддерживающие задачи компьютерного зрения в реальном времени, можно использовать для анализа видео с высокой частотой кадров. Такая возможность работы в реальном времени очень важна для таких приложений, как автономное вождение, видеонаблюдение и робототехника, где даже небольшие задержки могут привести к значительным ошибкам. 

Давайте рассмотрим несколько реальных приложений Vision AI, где высокий FPS необходим для точности и производительности. 

Более высокая частота кадров для решений в области видеонаблюдения и безопасности

Системы видеонаблюдения, контролирующие зоны с высокой интенсивностью движения, такие как автомагистрали, используют высокую частоту кадров в секунду для съемки мельчайших деталей, обеспечивая четкую фиксацию быстро движущихся автомобилей. Такая четкость необходима для систем автоматического распознавания номерных знаков (ANPR), которые полагаются на качественные кадры для точной идентификации автомобилей.

В таких системах модели, подобные YOLO11, могут использоваться для обнаружения номерных знаков непосредственно из видеосигнала. После обнаружения номерного знака для считывания информации о нем используется технология оптического распознавания символов (OCR), которая преобразует изображения текста в машиночитаемые символы. Этот процесс позволяет быстро и точно идентифицировать транспортное средство, что повышает безопасность дорожного движения.

__wf_reserved_inherit
Рис. 3. Использование YOLO11 для обнаружения номерных знаков.

Понимание требований FPS для автономных систем

Представьте себе самоуправляемый автомобиль, стоящий у знака "Стоп" и внимательно изучающий окружающую обстановку, чтобы решить, можно ли ему безопасно ехать дальше. Этот автомобиль должен принимать решения практически мгновенно, что требует захвата и обработки визуальных данных в режиме реального времени. 

Если автономный автомобиль оснащен камерами, способными снимать видео с более высокой частотой кадров в секунду, он получает более непрерывный и детальный поток изображений. Благодаря такому улучшенному визуальному восприятию автомобиль может быстро обнаруживать препятствия, пешеходов и другие транспортные средства. Это позволяет автомобилю оперативно реагировать на любые изменения в окружающей обстановке.

Если камеры обрабатывают изображение с более низкой частотой кадров в секунду, автомобиль может получить более четкое и менее детальное изображение. Это может замедлить время отклика, увеличивая риск упустить важную информацию и, возможно, поставить под угрозу безопасность.

Связь между FPS и спортивной аналитикой

Точная съемка каждого движения очень важна в спорте, где решения в доли секунды могут стать решающими для победы или поражения. Технологии, поддерживающие более высокую частоту кадров в секунду, позволяют фиксировать каждую мельчайшую деталь в движении, а тренеры, аналитики и спортсмены могут просматривать игры в замедленном режиме, не пропуская ни одного удара. Это также помогает судьям принимать более точные решения в таких видах спорта, как теннис, футбол и крикет, благодаря четкому покадровому просмотру происходящего.

Например, в одном интересном исследовании, посвященном волейболу, было проанализировано, как использование более высокого FPS улучшает оценку производительности. Увеличение FPS с 30 до 240 значительно улучшило четкость движений и отслеживание объектов. Также повысилась точность анализа свайпов, что помогло тренерам более точно понять положение рук, точки контакта с мячом и механику прыжка. Кроме того, исследование показало, что более высокий показатель FPS уменьшает размытость движений, что облегчает анализ подач и защитных реакций. 

__wf_reserved_inherit
Рис. 4. Сравнение низкого и высокого FPS в отношении четкости движения.

Когда использование низкого FPS эффективно в видеоаналитике

Не все приложения компьютерного зрения требуют записи видео с высоким FPS. Во многих случаях для достижения точных результатов достаточно более низкого FPS, в зависимости от задачи. Вот некоторые ключевые области, в которых предпочтительнее использовать более низкий FPS:

  • Постобработка и анализ в автономном режиме: Для таких приложений, как мониторинг трафика и анализ толпы, захват каждого кадра с высоким FPS не всегда необходим. При более низком FPS все равно можно получить достаточно данных для анализа моделей движения, таких как поток автомобилей, плотность пешеходов и тенденции заторов. Сокращая количество лишних кадров, этот подход минимизирует требования к хранению данных и вычислительную нагрузку, сохраняя при этом точность аналитики.
  • Тайм-лапс мониторинг окружающей среды: Для отслеживания медленных изменений, таких как рост растений, ход строительства или движение ледника, достаточно делать кадры каждые несколько минут или раз в день, эффективно документируя долгосрочные преобразования и экономя при этом средства хранения.
  • Среды с ограниченными ресурсами: При мониторинге дикой природы и удаленной охране более низкая частота кадров в секунду помогает экономить заряд батареи и средства хранения. Камеры, работающие со скоростью 5-10 кадров в секунду, могут фиксировать важные события в течение длительного времени, что делает их идеальными для установки в автономных сетях.

Выбор правильного FPS для приложений глубокого обучения

Выбор идеального FPS требует баланса между производительностью и системными ограничениями. Вот некоторые соображения, которые следует иметь в виду при оптимизации FPS для приложений глубокого обучения:

  • Баланс между производительностью и ресурсами: Более высокий FPS повышает скорость отклика, но также увеличивает требования к мощности и обработке данных. Динамическая регулировка FPS, использование интерполяции кадров и оптимизация аппаратного обеспечения помогут поддерживать плавную производительность, не перегружая систему.
  • Потребности конкретного приложения: Различные приложения предъявляют разные требования к FPS. Устройствам, работающим от батарей, следует использовать более низкий FPS для экономии энергии, а системам реального времени, таким как беспилотники и автономные транспортные средства, требуется более высокий FPS для быстрой и точной реакции.
  • Тестирование и оптимизация: В идеале настройки FPS следует тестировать при различных условиях освещения и движения. Оценка задержек и сравнение уровней FPS между собой помогут определить оптимальный баланс между отзывчивостью, качеством изображения и эффективностью использования ресурсов.

Будущие инновации и оптимизация FPS для моделей ИИ

Достижения в области искусственного интеллекта и оптимизации аппаратного обеспечения делают более высокую частоту кадров достижимой даже в условиях ограниченных ресурсов. Например, такие отрасли, как кино, спорт и робототехника, могут выиграть от более разумного управления частотой кадров, когда системы динамически регулируют FPS в зависимости от сложности движения и вычислительной мощности. Интерполяция кадров, управляемая искусственным интеллектом, также улучшает плавность видео, генерируя дополнительные кадры в режиме реального времени.

Между тем, недавнее достижение NVIDIA еще больше увеличивает производительность FPS. DLSS 4 (Deep Learning Super Sampling) представляет многокадровую генерацию, которая использует ИИ для предсказания и создания дополнительных кадров. Это повышает частоту кадров до 8 раз, снижая нагрузку на систему.

Позволяя искусственному интеллекту выполнять часть рендеринга, DLSS 4 делает визуальные эффекты более плавными без дополнительной нагрузки на аппаратное обеспечение, повышая производительность и эффективность.

Основные выводы

Частота кадров в секунду - это не просто показатель плавности изображения; она определяет процесс принятия решений в реальном времени в области искусственного интеллекта и компьютерного зрения. Каждый кадр видео фиксирует важные данные, позволяя машинам отслеживать объекты, анализировать движение и реагировать на динамичную обстановку. Будь то самоуправляемые автомобили, избегающие препятствий, или системы наблюдения, мгновенно обнаруживающие угрозы, правильный FPS обеспечивает точность и эффективность.

Будущее FPS связано не только с увеличением частоты кадров, но и с их интеллектуальной оптимизацией. Эта эволюция сделает системы компьютерного зрения более быстрыми, инновационными и ресурсоэффективными в различных отраслях.

Хотите узнать больше об искусственном интеллекте? Изучите наш репозиторий на GitHub и присоединяйтесь к нашему сообществу. Готовы начать собственные проекты по компьютерному зрению? Ознакомьтесь с нашими возможностями лицензирования. Узнайте, как компьютерное зрение в здравоохранении повышает эффективность, и изучите влияние ИИ на производство, посетив страницы наших решений!

Давайте вместе построим будущее
искусственного интеллекта!

Начните свое путешествие в будущее машинного обучения

Начните бесплатно
Ссылка копируется в буфер обмена