Por que FPS é importante: Guia de Taxa de Quadros em Visão Computacional

Assistir a uma repetição em câmara lenta do seu momento desportivo favorito, onde cada detalhe é nítido, é muito diferente de assistir a imagens de vigilância que geralmente parecem instáveis e difíceis de acompanhar. O principal detalhe técnico por trás destas diferenças é o FPS, ou Frames Per Second (fotogramas por segundo), que se refere ao número de fotogramas mostrados por segundo num vídeo. Um FPS mais alto resulta num movimento suave e realista, enquanto um FPS mais baixo pode levar a imagens instáveis e menos detalhadas.

Este conceito impacta diretamente a visão computacional, um ramo da IA que permite que as máquinas interpretem e analisem dados visuais de forma semelhante à forma como os humanos o fazem. Em visão computacional, um FPS mais alto significa que os sistemas podem capturar mais informações a cada segundo, melhorando a precisão da deteção e rastreamento de objetos em tempo real.

Neste artigo, exploraremos os aspectos técnicos do FPS e como ele está relacionado às aplicações de visão computacional. Vamos começar!

O que significa FPS em visão computacional?

Digamos que você esteja jogando um jogo de corrida: a 60 FPS, cada curva parece suave e responsiva, mas a 20 FPS, os controles ficam lentos, dificultando o desvio de obstáculos. Simplificando, você pode pensar em FPS como o número de fotos estáticas que são mostradas a cada segundo. Mais fotos por segundo fazem com que o movimento pareça suave e natural, enquanto menos fotos podem fazê-lo parecer instável.

Tal como nos jogos, o FPS é uma parte fundamental das aplicações de visão por computador. Um FPS mais elevado permite track objectos utilizando a IA de visão sem problemas, enquanto um FPS mais baixo pode resultar na perda de detalhes.

Por exemplo, na análise desportiva, as câmaras alimentadas por IA necessitam de um FPS mais elevado para poderem track passes rápidos, movimentos dos jogadores e trajectórias da bola. Um FPS mais baixo pode fazer com que se perca um contacto importante entre o pé e a bola ou uma mudança rápida de direção, afectando a precisão da análise.

Da mesma forma, na monitorização do tráfego, os sistemas dependem de FPS elevados para detect veículos em excesso de velocidade e mudanças de faixa em tempo real. A escolha do FPS correto depende dos requisitos específicos de cada aplicação de visão por computador, equilibrando o desempenho, a eficiência e a clareza visual.

__wf_reserved_inherit — Fig. 1. Comparação de diferentes taxas de frames.

‍

Aspectos técnicos de FPS em visão computacional

Agora que discutimos o que é FPS e como ele é usado na visão computacional, vamos mergulhar em seus aspectos técnicos - começando com como calcular o FPS de um vídeo.

Dividindo o número total de fotogramas pela duração em segundos, obtém-se o FPS de um vídeo. Por exemplo, se um vídeo tiver 96 fotogramas em 4 segundos, calcula 24 FPS - o que significa que são apresentadas 24 imagens por segundo - enquanto que 32 fotogramas em 4 segundos resultam em 8 FPS. As bibliotecas Python como o OpenCV podem ser utilizadas para extrair metadados de vídeo, contar fotogramas e calcular automaticamente o FPS, simplificando o processo de análise de vídeo.

‍

Fatores que afetam o FPS de um vídeo

No entanto, calcular o FPS sozinho não é suficiente para tomar decisões técnicas ao desenvolver soluções de visão computacional. Também é importante considerar os vários fatores que podem afetar a taxa de quadros efetiva, como capacidades de hardware, otimizações de software e condições ambientais.

Aqui está uma análise mais detalhada desses fatores:

Capacidades de hardware: A qualidade do sensor da câmera e o poder de processamento do dispositivo podem determinar quantos quadros são capturados por segundo. Um hardware melhor geralmente significa suporte para um FPS mais alto e vídeo mais suave.
‍
Otimizações de software: Um software eficiente de codificação e processamento de vídeo ajuda a extrair e analisar frames rapidamente. Isso garante que o vídeo seja processado sem atrasos desnecessários.
‍
Condições ambientais: A iluminação e o movimento em uma cena afetam a clareza com que os quadros são capturados. Uma boa iluminação e um movimento moderado podem melhorar o FPS, enquanto condições ruins podem exigir um FPS mais alto para manter a clareza.
‍
Necessidades de armazenamento: Um FPS mais alto captura mais quadros por segundo, o que resulta em tamanhos de arquivo maiores. Isso aumenta os requisitos de armazenamento e exige um processamento de dados mais rápido para garantir uma reprodução suave.

Explorando FPS em aplicações de visão computacional

Modelos de IA como Ultralytics YOLO11 que suportam tarefas de visão computacional em tempo real podem ser utilizados para analisar vídeos com elevadas taxas de fotogramas. Esta capacidade em tempo real é fundamental para aplicações como a condução autónoma, a vigilância e a robótica, em que mesmo pequenos atrasos podem conduzir a erros significativos.

Vamos percorrer algumas aplicações de IA de Visão do mundo real onde um alto FPS é essencial para precisão e desempenho.

Uma taxa de quadros mais alta para soluções de vigilância e segurança

Sistemas de vigilância que monitoram áreas de alto tráfego, como rodovias, usam um alto FPS para capturar detalhes minuciosos, garantindo que veículos em movimento rápido sejam claramente documentados. Essa clareza é essencial para sistemas de reconhecimento automático de placas de veículos (ANPR), que dependem de filmagens de boa qualidade para identificar veículos com precisão.

Nesses sistemas, modelos como o YOLO11 podem ser utilizados para detect matrículas diretamente a partir da transmissão de vídeo. Uma vez detectada uma matrícula, o reconhecimento ótico de caracteres (OCR), que converte imagens de texto em caracteres legíveis por máquina, é utilizado para ler os detalhes da matrícula. Este processo permite uma identificação rápida e exacta do veículo, melhorando o controlo do tráfego e a segurança geral.

‍

Compreender os requisitos de FPS para sistemas autónomos

Considere um carro autónomo num sinal de stop, a analisar cuidadosamente o que o rodeia para decidir se pode avançar com segurança. Este carro deve tomar decisões quase instantâneas, o que requer a captura e o processamento de dados visuais em tempo real.

Se o veículo autónomo estiver equipado com câmaras que possam captar imagens a um FPS mais elevado, recebe um fluxo de imagens mais contínuo e detalhado. Esta entrada visual melhorada permite que o automóvel detect rapidamente obstáculos, peões e outros veículos. Torna possível que o veículo reaja prontamente a quaisquer alterações no seu ambiente.

Se as câmaras estivessem a processar imagens a um FPS mais baixo, o veículo poderia receber uma visão mais instável e menos detalhada. Isso poderia atrasar o seu tempo de resposta, aumentando o risco de perder informações críticas e potencialmente comprometendo a segurança.

A conexão entre FPS e análise esportiva

Capturar cada movimento com precisão é crucial nos esportes, onde decisões em frações de segundo podem fazer toda a diferença entre vencer e perder. A tecnologia que suporta um FPS mais alto permite gravar cada pequeno detalhe em movimento, e treinadores, analistas e atletas podem revisar jogadas em câmera lenta sem perder nada. Também ajuda os árbitros a fazerem marcações mais precisas em esportes como tênis, futebol e críquete, fornecendo uma visão clara, quadro a quadro, da ação.

Por exemplo, um estudo interessante sobre voleibol analisou como o uso de um FPS mais alto melhora a avaliação do desempenho. Aumentar o FPS de 30 para 240 melhorou significativamente a clareza do movimento e o rastreamento de objetos. A precisão da análise de ataque também melhorou, ajudando os treinadores a entender o posicionamento das mãos, os pontos de contato da bola e a mecânica do salto com mais precisão. Além disso, o estudo descobriu que um FPS mais alto reduziu o desfoque de movimento, tornando os saques e as reações defensivas mais fáceis de analisar.

‍

Quando usar um baixo FPS é eficaz na análise de vídeo

Nem todas as aplicações de visão computacional exigem a gravação de imagens com um FPS mais alto. Em muitos casos, um FPS mais baixo é suficiente para obter resultados precisos, dependendo da tarefa. Aqui estão algumas áreas-chave onde um FPS mais baixo é preferível:

Pós-processamento e análise offline: Para aplicações como monitoramento de tráfego e análise de multidões, capturar cada quadro em um alto FPS nem sempre é necessário. Um FPS mais baixo ainda pode fornecer dados suficientes para analisar padrões de movimento, como fluxo de veículos, densidade de pedestres e tendências de congestionamento. Ao reduzir quadros redundantes, essa abordagem minimiza os requisitos de armazenamento e a carga computacional, mantendo análises precisas.
‍
Monitoramento ambiental em time-lapse: Para rastrear mudanças lentas, como crescimento de plantas, progresso da construção ou movimento de geleiras, capturar um frame a cada poucos minutos ou uma vez por dia é suficiente, documentando efetivamente transformações de longo prazo e economizando armazenamento.
‍
Ambientes com recursos limitados: No monitoramento da vida selvagem e na segurança remota, um FPS mais baixo ajuda a conservar a vida útil da bateria e o armazenamento. Câmeras acionadas por movimento operando a 5–10 FPS podem capturar eventos essenciais por longos períodos, tornando-as ideais para instalações fora da rede.

Escolhendo o FPS certo para aplicações de deep learning

Selecionar o FPS ideal requer equilibrar o desempenho com as limitações do sistema. Aqui estão algumas considerações a ter em mente ao otimizar o FPS para aplicações de aprendizado profundo:

Equilibrando desempenho e recursos: Um FPS mais alto melhora a capacidade de resposta, mas também aumenta as demandas de energia e processamento. Ajustar o FPS dinamicamente, usando a interpolação de quadros e otimizando o hardware pode ajudar a manter um desempenho suave sem sobrecarregar o sistema.
‍
Necessidades específicas da aplicação: Diferentes aplicações têm diferentes requisitos de FPS. Dispositivos alimentados por bateria devem usar FPS mais baixos para conservar energia, enquanto sistemas em tempo real, como drones e veículos autónomos, precisam de FPS mais altos para respostas rápidas e precisas.
‍
Teste e otimização: As configurações de FPS devem idealmente ser testadas sob diferentes condições de iluminação e movimento. Avaliar a latência e comparar os níveis de FPS lado a lado ajuda a determinar o melhor equilíbrio entre capacidade de resposta, qualidade visual e eficiência de recursos.

Inovações futuras e otimização de FPS para modelos de IA

Os avanços em IA e otimização de hardware estão tornando taxas de quadros mais altas mais alcançáveis, mesmo em ambientes com recursos limitados. Por exemplo, setores como cinema, esportes e robótica podem se beneficiar de um gerenciamento mais inteligente da taxa de quadros, onde os sistemas ajustam dinamicamente o FPS com base na complexidade do movimento e na capacidade de processamento. A interpolação de quadros orientada por IA também melhora a suavidade do vídeo, gerando quadros adicionais em tempo real.

Entretanto, uma recente descoberta da NVIDIA está a levar o desempenho FPS ainda mais longe. O DLSS 4 (Deep Learning Super Sampling) introduz a geração de vários quadros, que usa IA para prever e criar quadros extras. Isto aumenta as taxas de fotogramas até 8 vezes, reduzindo a carga de trabalho do sistema.

Ao deixar a IA lidar com parte da renderização, o DLSS 4 torna os visuais mais suaves sem sobrecarregar o hardware, melhorando tanto o desempenho quanto a eficiência.

Principais conclusões

O FPS é mais do que apenas uma medida de suavidade visual; ele impulsiona a tomada de decisões em tempo real em IA e visão computacional. Cada fotograma de um vídeo capta dados críticos, permitindo às máquinas track objectos, analisar movimentos e responder a ambientes dinâmicos. Quer se trate de carros autónomos que evitam obstáculos ou de sistemas de vigilância que detectam ameaças instantaneamente, o FPS correto garante precisão e eficiência.

O futuro do FPS não se trata apenas de aumentar as taxas de quadros, mas também de otimizá-las de forma inteligente. Essa evolução tornará os sistemas de visão computacional mais rápidos, inovadores e eficientes em termos de recursos em vários setores.

Quer saber mais sobre IA? Explore o nosso repositório GitHub e junte-se à nossa comunidade. Pronto para começar os seus próprios projetos de visão computacional? Consulte as nossas opções de licenciamento. Saiba como a visão computacional na área da saúde está a melhorar a eficiência e explore o impacto da IA na indústria transformadora visitando as nossas páginas de soluções!

Compreendendo o papel do FPS na visão computacional

O que significa FPS em visão computacional?

Aspectos técnicos de FPS em visão computacional

Fatores que afetam o FPS de um vídeo

Explorando FPS em aplicações de visão computacional

Uma taxa de quadros mais alta para soluções de vigilância e segurança

Compreender os requisitos de FPS para sistemas autónomos

A conexão entre FPS e análise esportiva

Quando usar um baixo FPS é eficaz na análise de vídeo

Escolhendo o FPS certo para aplicações de deep learning

Inovações futuras e otimização de FPS para modelos de IA

Principais conclusões

Leia mais nesta categoria

O que é destilação de conjuntos de dados? Uma rápida visão geral

Aprendizagem auto-supervisionada para redução de ruído: uma análise passo a passo

O que é a correspondência de imagens na IA de visão? Uma breve introdução

Vamos construir o futuro
da IA juntos!

Compreendendo o papel do FPS na visão computacional

O que significa FPS em visão computacional?

Aspectos técnicos de FPS em visão computacional

Fatores que afetam o FPS de um vídeo

Explorando FPS em aplicações de visão computacional

Uma taxa de quadros mais alta para soluções de vigilância e segurança

Compreender os requisitos de FPS para sistemas autónomos

A conexão entre FPS e análise esportiva

Quando usar um baixo FPS é eficaz na análise de vídeo

Escolhendo o FPS certo para aplicações de deep learning

Inovações futuras e otimização de FPS para modelos de IA

Principais conclusões

Leia mais nesta categoria

O que é destilação de conjuntos de dados? Uma rápida visão geral

Aprendizagem auto-supervisionada para redução de ruído: uma análise passo a passo

O que é a correspondência de imagens na IA de visão? Uma breve introdução

Vamos construir o futuro da IA juntos!

Vamos construir o futuro
da IA juntos!