Veja por que o FPS na visão computacional é importante e como ele afeta a detecção de objetos em tempo real, a análise de vídeo e os aplicativos baseados em IA.
Veja por que o FPS na visão computacional é importante e como ele afeta a detecção de objetos em tempo real, a análise de vídeo e os aplicativos baseados em IA.
Assistir a uma repetição em câmara lenta do seu momento desportivo favorito, onde cada detalhe é nítido, é muito diferente de assistir a imagens de vigilância que geralmente parecem instáveis e difíceis de acompanhar. O principal detalhe técnico por trás destas diferenças é o FPS, ou Frames Per Second (fotogramas por segundo), que se refere ao número de fotogramas mostrados por segundo num vídeo. Um FPS mais alto resulta num movimento suave e realista, enquanto um FPS mais baixo pode levar a imagens instáveis e menos detalhadas.
Este conceito impacta diretamente a visão computacional, um ramo da IA que permite que as máquinas interpretem e analisem dados visuais de forma semelhante à forma como os humanos o fazem. Em visão computacional, um FPS mais alto significa que os sistemas podem capturar mais informações a cada segundo, melhorando a precisão da deteção e rastreamento de objetos em tempo real.
Neste artigo, exploraremos os aspectos técnicos do FPS e como ele está relacionado às aplicações de visão computacional. Vamos começar!
Digamos que você esteja jogando um jogo de corrida: a 60 FPS, cada curva parece suave e responsiva, mas a 20 FPS, os controles ficam lentos, dificultando o desvio de obstáculos. Simplificando, você pode pensar em FPS como o número de fotos estáticas que são mostradas a cada segundo. Mais fotos por segundo fazem com que o movimento pareça suave e natural, enquanto menos fotos podem fazê-lo parecer instável.
Tal como nos jogos, o FPS é uma parte fundamental das aplicações de visão por computador. Um FPS mais elevado permite track objectos utilizando a IA de visão sem problemas, enquanto um FPS mais baixo pode resultar na perda de detalhes.
Por exemplo, na análise desportiva, as câmaras alimentadas por IA necessitam de um FPS mais elevado para poderem track passes rápidos, movimentos dos jogadores e trajectórias da bola. Um FPS mais baixo pode fazer com que se perca um contacto importante entre o pé e a bola ou uma mudança rápida de direção, afectando a precisão da análise.
Da mesma forma, na monitorização do tráfego, os sistemas dependem de FPS elevados para detect veículos em excesso de velocidade e mudanças de faixa em tempo real. A escolha do FPS correto depende dos requisitos específicos de cada aplicação de visão por computador, equilibrando o desempenho, a eficiência e a clareza visual.

Agora que discutimos o que é FPS e como ele é usado na visão computacional, vamos mergulhar em seus aspectos técnicos - começando com como calcular o FPS de um vídeo.
Dividindo o número total de fotogramas pela duração em segundos, obtém-se o FPS de um vídeo. Por exemplo, se um vídeo tiver 96 fotogramas em 4 segundos, calcula 24 FPS - o que significa que são apresentadas 24 imagens por segundo - enquanto que 32 fotogramas em 4 segundos resultam em 8 FPS. As bibliotecas Python como o OpenCV podem ser utilizadas para extrair metadados de vídeo, contar fotogramas e calcular automaticamente o FPS, simplificando o processo de análise de vídeo.

No entanto, calcular o FPS sozinho não é suficiente para tomar decisões técnicas ao desenvolver soluções de visão computacional. Também é importante considerar os vários fatores que podem afetar a taxa de quadros efetiva, como capacidades de hardware, otimizações de software e condições ambientais.
Aqui está uma análise mais detalhada desses fatores:
Modelos de IA como Ultralytics YOLO11 que suportam tarefas de visão computacional em tempo real podem ser utilizados para analisar vídeos com elevadas taxas de fotogramas. Esta capacidade em tempo real é fundamental para aplicações como a condução autónoma, a vigilância e a robótica, em que mesmo pequenos atrasos podem conduzir a erros significativos.
Vamos percorrer algumas aplicações de IA de Visão do mundo real onde um alto FPS é essencial para precisão e desempenho.
Sistemas de vigilância que monitoram áreas de alto tráfego, como rodovias, usam um alto FPS para capturar detalhes minuciosos, garantindo que veículos em movimento rápido sejam claramente documentados. Essa clareza é essencial para sistemas de reconhecimento automático de placas de veículos (ANPR), que dependem de filmagens de boa qualidade para identificar veículos com precisão.
Nesses sistemas, modelos como o YOLO11 podem ser utilizados para detect matrículas diretamente a partir da transmissão de vídeo. Uma vez detectada uma matrícula, o reconhecimento ótico de caracteres (OCR), que converte imagens de texto em caracteres legíveis por máquina, é utilizado para ler os detalhes da matrícula. Este processo permite uma identificação rápida e exacta do veículo, melhorando o controlo do tráfego e a segurança geral.

Considere um carro autónomo num sinal de stop, a analisar cuidadosamente o que o rodeia para decidir se pode avançar com segurança. Este carro deve tomar decisões quase instantâneas, o que requer a captura e o processamento de dados visuais em tempo real.
Se o veículo autónomo estiver equipado com câmaras que possam captar imagens a um FPS mais elevado, recebe um fluxo de imagens mais contínuo e detalhado. Esta entrada visual melhorada permite que o automóvel detect rapidamente obstáculos, peões e outros veículos. Torna possível que o veículo reaja prontamente a quaisquer alterações no seu ambiente.
Se as câmaras estivessem a processar imagens a um FPS mais baixo, o veículo poderia receber uma visão mais instável e menos detalhada. Isso poderia atrasar o seu tempo de resposta, aumentando o risco de perder informações críticas e potencialmente comprometendo a segurança.
Capturar cada movimento com precisão é crucial nos esportes, onde decisões em frações de segundo podem fazer toda a diferença entre vencer e perder. A tecnologia que suporta um FPS mais alto permite gravar cada pequeno detalhe em movimento, e treinadores, analistas e atletas podem revisar jogadas em câmera lenta sem perder nada. Também ajuda os árbitros a fazerem marcações mais precisas em esportes como tênis, futebol e críquete, fornecendo uma visão clara, quadro a quadro, da ação.
Por exemplo, um estudo interessante sobre voleibol analisou como o uso de um FPS mais alto melhora a avaliação do desempenho. Aumentar o FPS de 30 para 240 melhorou significativamente a clareza do movimento e o rastreamento de objetos. A precisão da análise de ataque também melhorou, ajudando os treinadores a entender o posicionamento das mãos, os pontos de contato da bola e a mecânica do salto com mais precisão. Além disso, o estudo descobriu que um FPS mais alto reduziu o desfoque de movimento, tornando os saques e as reações defensivas mais fáceis de analisar.

Nem todas as aplicações de visão computacional exigem a gravação de imagens com um FPS mais alto. Em muitos casos, um FPS mais baixo é suficiente para obter resultados precisos, dependendo da tarefa. Aqui estão algumas áreas-chave onde um FPS mais baixo é preferível:
Selecionar o FPS ideal requer equilibrar o desempenho com as limitações do sistema. Aqui estão algumas considerações a ter em mente ao otimizar o FPS para aplicações de aprendizado profundo:
Os avanços em IA e otimização de hardware estão tornando taxas de quadros mais altas mais alcançáveis, mesmo em ambientes com recursos limitados. Por exemplo, setores como cinema, esportes e robótica podem se beneficiar de um gerenciamento mais inteligente da taxa de quadros, onde os sistemas ajustam dinamicamente o FPS com base na complexidade do movimento e na capacidade de processamento. A interpolação de quadros orientada por IA também melhora a suavidade do vídeo, gerando quadros adicionais em tempo real.
Entretanto, uma recente descoberta da NVIDIA está a levar o desempenho FPS ainda mais longe. O DLSS 4 (Deep Learning Super Sampling) introduz a geração de vários quadros, que usa IA para prever e criar quadros extras. Isto aumenta as taxas de fotogramas até 8 vezes, reduzindo a carga de trabalho do sistema.
Ao deixar a IA lidar com parte da renderização, o DLSS 4 torna os visuais mais suaves sem sobrecarregar o hardware, melhorando tanto o desempenho quanto a eficiência.
O FPS é mais do que apenas uma medida de suavidade visual; ele impulsiona a tomada de decisões em tempo real em IA e visão computacional. Cada fotograma de um vídeo capta dados críticos, permitindo às máquinas track objectos, analisar movimentos e responder a ambientes dinâmicos. Quer se trate de carros autónomos que evitam obstáculos ou de sistemas de vigilância que detectam ameaças instantaneamente, o FPS correto garante precisão e eficiência.
O futuro do FPS não se trata apenas de aumentar as taxas de quadros, mas também de otimizá-las de forma inteligente. Essa evolução tornará os sistemas de visão computacional mais rápidos, inovadores e eficientes em termos de recursos em vários setores.
Quer saber mais sobre IA? Explore o nosso repositório GitHub e junte-se à nossa comunidade. Pronto para começar os seus próprios projetos de visão computacional? Consulte as nossas opções de licenciamento. Saiba como a visão computacional na área da saúde está a melhorar a eficiência e explore o impacto da IA na indústria transformadora visitando as nossas páginas de soluções!