Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
IA de visão

Uma visão geral rápida da visão por IA e como funciona

Explora como a visão por IA transforma imagens e vídeo em insights em tempo real usando modelos de ponta, datasets e fluxos de trabalho completos em todas as indústrias.

ABAbirami Vina
4 min read
Visão por IA detetando objetos em dados visuais do mundo real

Todos os dias, câmeras em fábricas, hospitais, cidades, veículos e dispositivos de consumo capturam enormes quantidades de imagens e vídeos. Esse fluxo constante de dados visuais cria novas possibilidades, mas também torna difícil entender o que está acontecendo e tomar medidas rapidamente.

Por exemplo, cruzamentos movimentados ou espaços públicos lotados podem mudar de um momento para o outro. Monitorar esses ambientes manualmente é lento e muitas vezes impreciso, especialmente quando são necessárias decisões rápidas e confiáveis.

Para lidar com situações como essas, os sistemas precisam de uma maneira de entender as informações visuais à medida que aparecem e responder em tempo real. A Computer vision torna isso possível ao permitir que máquinas analisem imagens e vídeos, reconheçam padrões e extraiam informações úteis.

Os sistemas de visão computacional anteriores dependiam de regras fixas, que funcionavam em ambientes controlados, mas muitas vezes falhavam quando condições como iluminação ou ângulos de câmera mudavam. A IA de visão moderna melhora essa abordagem usando artificial intelligence e machine learning.

Em vez de apenas capturar ou armazenar visuais, esses sistemas analisam dados visuais em tempo real, aprendem com exemplos e se adaptam a ambientes em mudança. Isso torna a IA de visão mais eficaz em situações do mundo real e permite que ela melhore com o tempo conforme é usada em mais aplicações.

Neste artigo, veremos mais de perto o que é a IA de visão e como ela pode ser usada para criar fluxos de trabalho inteligentes de ponta a ponta. Vamos começar!

Link to this sectionO que é IA de visão?#

A IA de visão é um ramo da artificial intelligence que permite que máquinas entendam e interpretem imagens e vídeos. Em outras palavras, os sistemas de IA de visão analisam o que veem e usam essas informações para apoiar ações, otimizar previsões ou tomar decisões como parte de um fluxo de trabalho maior. Ao contrário da IA generativa, que cria novos conteúdos, a IA de visão concentra-se em entender e extrair informações de dados visuais existentes.

Por exemplo, monitorar a atividade no chão de fábrica ou em um espaço público por longos períodos requer velocidade e consistência que podem ser difíceis de manter manualmente. Os sistemas de IA de visão podem lidar com esse desafio aplicando técnicas de machine learning e deep learning para reconhecer padrões, identificar detalhes relevantes e responder conforme novas informações visuais aparecem.

Vision AI detectando objetos em uma imagem

Fig 1. Um exemplo de uso de IA de visão para detectar objetos em uma imagem (Source)

Como imagens e vídeos são frequentemente gerados em grandes volumes e em alta velocidade, os sistemas de IA de visão podem processar dados visuais continuamente e aplicar as mesmas regras a cada quadro. Isso torna os resultados mais consistentes e ajuda as equipes a melhorar as operações enquanto mantêm a precisão conforme as condições mudam.

No uso no mundo real, a IA de visão geralmente faz parte de um sistema de IA de ponta a ponta. Ela conecta vision AI models com lógica de decisão e outras ferramentas que agem sobre os resultados. Ao transformar a entrada visual em insights úteis, a IA de visão pode automatizar tarefas rotineiras e apoiar uma tomada de decisão mais rápida e confiante em muitas aplicações de computer vision.

Link to this sectionComo a IA de visão funciona: indo de dados visuais a insights acionáveis#

Então, como um sistema ou máquina passa de ver uma imagem ou vídeo para entender o que está acontecendo e decidir o que fazer em seguida?

O processo começa com a entrada visual do mundo real, como fotos, videoclipes, feeds de câmera ao vivo ou fluxos de sensores. Como esses dados podem variar muito em qualidade, iluminação e ângulo de câmera, geralmente precisam ser preparados antes da análise.

Essa preparação pode incluir redimensionar imagens, ajustar a iluminação e organizar quadros de vídeo em um formato consistente. Contexto adicional, como carimbos de data/hora ou localização da câmera, é frequentemente incluído para apoiar uma análise mais precisa.

Os dados preparados são então usados em uma estrutura de aprendizado que permite ao sistema reconhecer padrões visuais. Ao treinar com imagens e vídeos rotulados, um modelo de IA de visão aprende como objetos, padrões e eventos aparecem sob diferentes condições.

Esse entendimento aprendido forma a base para muitas tarefas comuns de computer vision, como object detection (identificar e localizar objetos dentro de uma imagem) e instance segmentation (separar e rotular objetos individuais no nível do pixel). Modelos de IA de visão de última geração, como o Ultralytics YOLO26, são projetados para suportar essas tarefas, mantendo a rapidez e a precisão em ambientes do mundo real.

YOLO realizando segmentação de instância em objetos

Fig 2. Uma visão sobre o uso do YOLO para instance segmentation (Source)

Uma vez que o sistema é implantado, as entradas visuais são processadas continuamente como parte de um fluxo de trabalho de ponta a ponta. O modelo analisa imagens e vídeos e envia suas saídas para painéis, ferramentas de automação ou outros sistemas de IA. Em alguns casos, vision AI agents usam esses resultados para acionar ações ou apoiar a tomada de decisão, transformando o entendimento visual em insights práticos e acionáveis.

Link to this sectionA evolução dos modelos e arquiteturas de visão#

À medida que você aprende mais sobre IA de visão, pode se perguntar por que os modelos e arquiteturas importam e como eles afetam o desempenho do sistema. Os modelos de IA de visão são cruciais para as inovações de computer vision de hoje.

A maioria dos sistemas de IA de visão é construída em torno de um modelo que determina como as imagens e vídeos são analisados. O modelo define o que o sistema consegue reconhecer em uma cena e quão bem ele funciona sob diferentes condições.

À medida que as aplicações de IA de visão se tornaram mais variadas e complexas, os modelos de IA de visão e suas arquiteturas subjacentes continuaram a evoluir para acompanhar e serem fáceis de usar. Os sistemas de computer vision iniciais exigiam que os engenheiros definissem manualmente o que o sistema deveria procurar, como bordas, cores ou formas específicas.

Essas abordagens baseadas em regras funcionavam bem em ambientes controlados, mas muitas vezes falhavam quando a iluminação mudava, a qualidade da câmera variava ou as cenas se tornavam mais complexas. Os modelos modernos de IA de visão adotam uma abordagem diferente.

Muitos modelos de código aberto aprendem padrões visuais diretamente dos dados, o que os torna mais flexíveis e mais adequados para ambientes do mundo real, onde as condições são imprevisíveis. Os avanços na arquitetura de modelos também simplificaram a forma como imagens e vídeos são processados, tornando esses sistemas mais fáceis de implantar e integrar em plataformas práticas de IA de visão.

Os modelos Ultralytics YOLO são um bom exemplo dessa mudança. Modelos como o YOLO26 são amplamente usados para tarefas de object detection que exigem velocidade e consistência, especialmente em aplicações de vídeo ao vivo.

Link to this sectionExplorando as principais tarefas de IA de visão#

Aqui estão algumas das principais computer vision tasks nas quais os sistemas de visão orientados por IA confiam para entender informações visuais e otimizar ambientes do mundo real:

  • Object detection: Esta tarefa permite que um sistema identifique quais objetos estão presentes em uma imagem ou vídeo e determine onde eles estão localizados, normalmente desenhando caixas delimitadoras ao redor de cada objeto.
  • Image classification: Com essa abordagem, uma imagem inteira é analisada e recebe um ou mais rótulos com base em seu conteúdo geral, ajudando a organizar visuais e informar decisões.
  • Instance segmentation: Para tarefas que exigem maior precisão, essa tarefa decompõe uma imagem no nível do pixel para separar objetos ou regiões dentro de uma cena.
  • Object tracking: Em aplicações baseadas em vídeo, essa funcionalidade torna possível seguir objetos entre quadros enquanto preserva sua identidade e movimento ao longo do tempo.
  • Pose estimation: Identifica pontos-chave em pessoas ou objetos, como articulações ou pontos de referência, para determinar sua posição, postura e movimento em ambientes dinâmicos.

Detectando e rastreando veículos em uma estrada usando YOLO

Fig 3. Detectando e rastreando veículos usando YOLO (Source)

Link to this sectionO papel dos datasets na IA de visão#

Por trás de todo sistema eficaz de IA de visão existe um dataset bem curado. Esses datasets de IA de visão fornecem as imagens e vídeos com os quais os modelos de IA de visão aprendem, ajudando-os a reconhecer objetos, padrões e cenas em ambientes do mundo real.

A qualidade dos dados afeta diretamente quão preciso e confiável o sistema será. Para tornar os dados visuais impactantes, os datasets são anotados. Isso significa que detalhes importantes são adicionados a cada imagem ou vídeo, como rotular objetos, destacar áreas específicas ou atribuir categorias.

Junto com os rótulos, metadados extras como hora, local ou tipo de cena podem ser incluídos para ajudar a organizar os dados e melhorar a compreensão. Os datasets também são comumente divididos em conjuntos de treinamento, validação e teste para que os sistemas possam ser avaliados em visuais que eles ainda não viram.

Popular datasets como ImageNet, COCO e Open Images desempenharam um papel importante no avanço da IA de visão, fornecendo coleções grandes e diversas de imagens rotuladas. Mesmo assim, coletar dados do mundo real ainda é difícil.

Vieses, lacunas na cobertura e ambientes em constante mudança tornam difícil criar datasets que reflitam verdadeiramente as condições reais. Obter o equilíbrio certo de dados em escala é fundamental para construir sistemas de IA de visão confiáveis.

Link to this sectionUma visão sobre vários casos de uso de IA de visão#

Agora que temos uma compreensão melhor de como a IA de visão funciona, vamos percorrer como ela é usada em aplicações do mundo real. Em muitos setores, a IA de visão ajuda as equipes a lidar com tarefas visuais em escala, levando a respostas mais rápidas e operações mais eficientes.

Aqui estão algumas formas comuns de como a IA de visão é usada em diferentes setores:

  • Manufacturing: No chão de fábrica, a IA de visão pode ser usada para monitorar produtos à medida que eles se movem por cada etapa da produção. Ela pode detectar defeitos, peças ausentes ou inconsistências precocemente, ajudando as equipes a reduzir o retrabalho, manter a qualidade e evitar paradas inesperadas.
  • Retail: Em espaços de varejo, as soluções de IA de visão podem acompanhar o estoque, verificar as condições das prateleiras e reduzir perdas. Ao analisar os visuais da loja, esses sistemas podem facilitar para a equipe entender o que está acontecendo no salão e fazer ajustes mais rápidos para manter as operações funcionando sem problemas.
  • Healthcare: A IA de visão pode apoiar profissionais de saúde auxiliando na revisão de imagens médicas, como exames ou resultados de testes. Ela pode sinalizar áreas que podem precisar de mais atenção, permitindo que os clínicos trabalhem com mais eficiência, mantendo as decisões finais nas mãos de humanos.
  • Transportation and smart cities: Nas estradas e em espaços públicos, a IA de visão ajuda as cidades a monitorar o fluxo de tráfego, detectar incidentes e melhorar a segurança para o próximo nível. A análise em tempo real dos feeds de câmera permite respostas mais rápidas às condições de mudança e apoia uma melhor gestão da infraestrutura urbana.

Monitoramento automatizado de produtos com vision AI na fabricação

Fig 4. Monitoramento automatizado de produtos usando IA de visão na manufatura (Source)

Link to this sectionPrós e contras das ferramentas de IA de visão#

Aqui estão alguns dos principais benefícios de usar IA de visão em aplicações do mundo real:

  • Scales across use cases: Uma vez treinados, os sistemas de IA de visão podem ser implantados em vários locais ou aplicações com alterações mínimas.
  • Faster AI assistance: Ao analisar imagens e vídeos à medida que são capturados, os sistemas alimentados por IA de visão podem fornecer insights em tempo real que apoiam respostas mais rápidas e uma melhor tomada de decisão.
  • Integrates easily into existing workflows: As saídas da IA de visão podem ser conectadas a sistemas downstream, painéis ou pipelines de automação.

Apesar dessas vantagens, existem limitações que podem afetar o desempenho dos sistemas de IA de visão. Aqui estão alguns fatores a serem considerados:

  • Dependence on data quality and availability: Os sistemas de IA de visão dependem fortemente de datasets grandes e bem preparados. Coletar e manter dados visuais de alta qualidade pode ser demorado e caro.
  • Sensitivity to environmental changes: O desempenho pode cair quando as câmeras se movem, a iluminação muda ou as cenas mudam significativamente sem retreinamento ou ajuste.
  • Compute and infrastructure requirements: Executar modelos de IA de visão, especialmente em tempo real ou em escala, pode exigir recursos de computação significativos e hardware especializado.

Link to this sectionPrincipais pontos#

A IA de visão transforma imagens e vídeos em informações significativas que os sistemas podem entender e usar. Isso ajuda a automatizar tarefas visuais e apoia uma tomada de decisão mais rápida e confiável. Sua eficácia depende da combinação de modelos capazes, datasets de alta qualidade e fluxos de trabalho bem projetados trabalhando juntos.

Interessado em IA de visão? Junte-se à nossa community e aprenda sobre computer vision in agriculture e vision AI in the automotive indústria. Confira nossas licensing options para começar com a computer vision. Visite nosso GitHub repository para continuar explorando a IA.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática