Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Compreendendo o papel do FPS na visão computacional

Abirami Vina

4 min de leitura

20 de março de 2025

Veja por que o FPS na visão computacional é importante e como ele afeta a detecção de objetos em tempo real, a análise de vídeo e os aplicativos baseados em IA.

Assistir a uma repetição em câmara lenta do seu momento desportivo favorito, onde cada detalhe é nítido, é muito diferente de assistir a imagens de vigilância que geralmente parecem instáveis e difíceis de acompanhar. O principal detalhe técnico por trás destas diferenças é o FPS, ou Frames Per Second (fotogramas por segundo), que se refere ao número de fotogramas mostrados por segundo num vídeo. Um FPS mais alto resulta num movimento suave e realista, enquanto um FPS mais baixo pode levar a imagens instáveis e menos detalhadas.

Este conceito impacta diretamente a visão computacional, um ramo da IA que permite que as máquinas interpretem e analisem dados visuais de forma semelhante à forma como os humanos o fazem. Em visão computacional, um FPS mais alto significa que os sistemas podem capturar mais informações a cada segundo, melhorando a precisão da deteção e rastreamento de objetos em tempo real.

Neste artigo, exploraremos os aspectos técnicos do FPS e como ele está relacionado às aplicações de visão computacional. Vamos começar!

O que significa FPS em visão computacional?

Digamos que você esteja jogando um jogo de corrida: a 60 FPS, cada curva parece suave e responsiva, mas a 20 FPS, os controles ficam lentos, dificultando o desvio de obstáculos. Simplificando, você pode pensar em FPS como o número de fotos estáticas que são mostradas a cada segundo. Mais fotos por segundo fazem com que o movimento pareça suave e natural, enquanto menos fotos podem fazê-lo parecer instável.

Tal como nos jogos, o FPS é uma parte fundamental das aplicações de visão computacional. Um FPS mais alto torna possível rastrear objetos usando a Visão de IA de forma suave, enquanto um FPS mais baixo pode resultar na perda de detalhes. 

Por exemplo, em análises esportivas, câmeras com tecnologia de IA precisam de um FPS mais alto para rastrear passes rápidos, movimentos de jogadores e trajetórias da bola. Um FPS mais baixo pode levar à perda de um contato importante do pé com a bola ou uma mudança rápida de direção, afetando a precisão da análise. 

Da mesma forma, no monitoramento de tráfego, os sistemas dependem de um alto FPS para detectar veículos em alta velocidade e mudanças de faixa em tempo real. A escolha do FPS correto depende dos requisitos específicos de cada aplicação de visão computacional, equilibrando desempenho, eficiência e clareza visual.

__wf_reserved_inherit
Fig. 1. Comparação de diferentes taxas de frames.

Aspectos técnicos de FPS em visão computacional

Agora que discutimos o que é FPS e como ele é usado na visão computacional, vamos mergulhar em seus aspectos técnicos - começando com como calcular o FPS de um vídeo. 

Dividir o número total de frames pela duração em segundos fornece o FPS de um vídeo. Por exemplo, se um vídeo tem 96 frames em 4 segundos, calcula-se 24 FPS - o que significa que 24 imagens são exibidas a cada segundo - enquanto 32 frames em 4 segundos resultam em 8 FPS. Bibliotecas Python como OpenCV podem ser usadas para extrair metadados de vídeo, contar frames e calcular automaticamente o FPS, agilizando o processo de análise de vídeo.

__wf_reserved_inherit
Fig 2. 24 FPS vs 8 FPS vs 4 FPS.

Fatores que afetam o FPS de um vídeo

No entanto, calcular o FPS sozinho não é suficiente para tomar decisões técnicas ao desenvolver soluções de visão computacional. Também é importante considerar os vários fatores que podem afetar a taxa de quadros efetiva, como capacidades de hardware, otimizações de software e condições ambientais. 

Aqui está uma análise mais detalhada desses fatores:

  • Capacidades de hardware: A qualidade do sensor da câmera e o poder de processamento do dispositivo podem determinar quantos quadros são capturados por segundo. Um hardware melhor geralmente significa suporte para um FPS mais alto e vídeo mais suave.
  • Otimizações de software: Um software eficiente de codificação e processamento de vídeo ajuda a extrair e analisar frames rapidamente. Isso garante que o vídeo seja processado sem atrasos desnecessários.
  • Condições ambientais: A iluminação e o movimento em uma cena afetam a clareza com que os quadros são capturados. Uma boa iluminação e um movimento moderado podem melhorar o FPS, enquanto condições ruins podem exigir um FPS mais alto para manter a clareza.
  • Necessidades de armazenamento: Um FPS mais alto captura mais quadros por segundo, o que resulta em tamanhos de arquivo maiores. Isso aumenta os requisitos de armazenamento e exige um processamento de dados mais rápido para garantir uma reprodução suave.

Explorando FPS em aplicações de visão computacional

Modelos de IA como o Ultralytics YOLO11 que suportam tarefas de visão computacional em tempo real podem ser usados para analisar vídeos com altas taxas de frames. Esta capacidade em tempo real é fundamental para aplicações como condução autónoma, vigilância e robótica, onde mesmo pequenos atrasos podem levar a erros significativos. 

Vamos percorrer algumas aplicações de IA de Visão do mundo real onde um alto FPS é essencial para precisão e desempenho. 

Uma taxa de quadros mais alta para soluções de vigilância e segurança

Sistemas de vigilância que monitoram áreas de alto tráfego, como rodovias, usam um alto FPS para capturar detalhes minuciosos, garantindo que veículos em movimento rápido sejam claramente documentados. Essa clareza é essencial para sistemas de reconhecimento automático de placas de veículos (ANPR), que dependem de filmagens de boa qualidade para identificar veículos com precisão.

Em tais sistemas, modelos como o YOLO11 podem ser usados para detectar placas de veículos diretamente do feed de vídeo. Uma vez que uma placa é detectada, o Reconhecimento Óptico de Caracteres (OCR), que converte imagens de texto em caracteres legíveis por máquina, é usado para ler os detalhes da placa. Este processo permite a identificação rápida e precisa de veículos, melhorando a fiscalização do trânsito e a segurança geral.

__wf_reserved_inherit
Fig. 3. Utilização do YOLO11 para detetar placas de matrícula.

Compreender os requisitos de FPS para sistemas autónomos

Considere um carro autónomo num sinal de stop, a analisar cuidadosamente o que o rodeia para decidir se pode avançar com segurança. Este carro deve tomar decisões quase instantâneas, o que requer a captura e o processamento de dados visuais em tempo real. 

Se o veículo autónomo estiver equipado com câmaras que podem captar imagens a um FPS mais elevado, recebe um fluxo de imagens mais contínuo e detalhado. Esta entrada visual melhorada permite que o carro detete rapidamente obstáculos, peões e outros veículos. Possibilita que o veículo reaja prontamente a quaisquer alterações no seu ambiente.

Se as câmaras estivessem a processar imagens a um FPS mais baixo, o veículo poderia receber uma visão mais instável e menos detalhada. Isso poderia atrasar o seu tempo de resposta, aumentando o risco de perder informações críticas e potencialmente comprometendo a segurança.

A conexão entre FPS e análise esportiva

Capturar cada movimento com precisão é crucial nos esportes, onde decisões em frações de segundo podem fazer toda a diferença entre vencer e perder. A tecnologia que suporta um FPS mais alto permite gravar cada pequeno detalhe em movimento, e treinadores, analistas e atletas podem revisar jogadas em câmera lenta sem perder nada. Também ajuda os árbitros a fazerem marcações mais precisas em esportes como tênis, futebol e críquete, fornecendo uma visão clara, quadro a quadro, da ação.

Por exemplo, um estudo interessante sobre voleibol analisou como o uso de um FPS mais alto melhora a avaliação do desempenho. Aumentar o FPS de 30 para 240 melhorou significativamente a clareza do movimento e o rastreamento de objetos. A precisão da análise de ataque também melhorou, ajudando os treinadores a entender o posicionamento das mãos, os pontos de contato da bola e a mecânica do salto com mais precisão. Além disso, o estudo descobriu que um FPS mais alto reduziu o desfoque de movimento, tornando os saques e as reações defensivas mais fáceis de analisar. 

__wf_reserved_inherit
Fig 4. Comparando FPS baixo e alto com relação à clareza do movimento.

Quando usar um baixo FPS é eficaz na análise de vídeo

Nem todas as aplicações de visão computacional exigem a gravação de imagens com um FPS mais alto. Em muitos casos, um FPS mais baixo é suficiente para obter resultados precisos, dependendo da tarefa. Aqui estão algumas áreas-chave onde um FPS mais baixo é preferível:

  • Pós-processamento e análise offline: Para aplicações como monitoramento de tráfego e análise de multidões, capturar cada quadro em um alto FPS nem sempre é necessário. Um FPS mais baixo ainda pode fornecer dados suficientes para analisar padrões de movimento, como fluxo de veículos, densidade de pedestres e tendências de congestionamento. Ao reduzir quadros redundantes, essa abordagem minimiza os requisitos de armazenamento e a carga computacional, mantendo análises precisas.
  • Monitoramento ambiental em time-lapse: Para rastrear mudanças lentas, como crescimento de plantas, progresso da construção ou movimento de geleiras, capturar um frame a cada poucos minutos ou uma vez por dia é suficiente, documentando efetivamente transformações de longo prazo e economizando armazenamento.
  • Ambientes com recursos limitados: No monitoramento da vida selvagem e na segurança remota, um FPS mais baixo ajuda a conservar a vida útil da bateria e o armazenamento. Câmeras acionadas por movimento operando a 5–10 FPS podem capturar eventos essenciais por longos períodos, tornando-as ideais para instalações fora da rede.

Escolhendo o FPS certo para aplicações de deep learning

Selecionar o FPS ideal requer equilibrar o desempenho com as limitações do sistema. Aqui estão algumas considerações a ter em mente ao otimizar o FPS para aplicações de aprendizado profundo:

  • Equilibrando desempenho e recursos: Um FPS mais alto melhora a capacidade de resposta, mas também aumenta as demandas de energia e processamento. Ajustar o FPS dinamicamente, usando a interpolação de quadros e otimizando o hardware pode ajudar a manter um desempenho suave sem sobrecarregar o sistema.
  • Necessidades específicas da aplicação: Diferentes aplicações têm diferentes requisitos de FPS. Dispositivos alimentados por bateria devem usar FPS mais baixos para conservar energia, enquanto sistemas em tempo real, como drones e veículos autónomos, precisam de FPS mais altos para respostas rápidas e precisas.
  • Teste e otimização: As configurações de FPS devem idealmente ser testadas sob diferentes condições de iluminação e movimento. Avaliar a latência e comparar os níveis de FPS lado a lado ajuda a determinar o melhor equilíbrio entre capacidade de resposta, qualidade visual e eficiência de recursos.

Inovações futuras e otimização de FPS para modelos de IA

Os avanços em IA e otimização de hardware estão tornando taxas de quadros mais altas mais alcançáveis, mesmo em ambientes com recursos limitados. Por exemplo, setores como cinema, esportes e robótica podem se beneficiar de um gerenciamento mais inteligente da taxa de quadros, onde os sistemas ajustam dinamicamente o FPS com base na complexidade do movimento e na capacidade de processamento. A interpolação de quadros orientada por IA também melhora a suavidade do vídeo, gerando quadros adicionais em tempo real.

Enquanto isso, um avanço recente da NVIDIA está impulsionando ainda mais o desempenho de FPS. O DLSS 4 (Deep Learning Super Sampling) introduz a geração multi-frame, que usa IA para prever e criar frames extras. Isso aumenta as taxas de quadros em até 8 vezes, reduzindo a carga de trabalho no sistema.

Ao deixar a IA lidar com parte da renderização, o DLSS 4 torna os visuais mais suaves sem sobrecarregar o hardware, melhorando tanto o desempenho quanto a eficiência.

Principais conclusões

O FPS é mais do que apenas uma medida de visuais suaves; ele impulsiona a tomada de decisões em tempo real em IA e visão computacional. Cada quadro em um vídeo captura dados críticos, permitindo que as máquinas rastreiem objetos, analisem o movimento e respondam a ambientes dinâmicos. Seja em carros autônomos evitando obstáculos ou em sistemas de vigilância detectando ameaças instantaneamente, o FPS correto garante precisão e eficiência.

O futuro do FPS não se trata apenas de aumentar as taxas de quadros, mas também de otimizá-las de forma inteligente. Essa evolução tornará os sistemas de visão computacional mais rápidos, inovadores e eficientes em termos de recursos em vários setores.

Quer saber mais sobre IA? Explore o nosso repositório GitHub e junte-se à nossa comunidade. Pronto para começar os seus próprios projetos de visão computacional? Consulte as nossas opções de licenciamento. Saiba como a visão computacional na área da saúde está a melhorar a eficiência e explore o impacto da IA na indústria transformadora visitando as nossas páginas de soluções!

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência