Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Guias

O que é computação de imagem? Uma introdução rápida

Aprende o que é computação de imagem, como funciona e como é aplicada na saúde, condução autónoma e outros sistemas inteligentes modernos.

ABAbirami Vina
7 min read
Máquinas interpretando dados visuais através de computação de imagem

Quando caminhas por um centro comercial ou por uma rua movimentada, as câmaras montadas sobre as entradas e passagens registam a atividade. Elas geram dados visuais a cada segundo e, na maioria das vezes, nem reparamos nisso.

Este fluxo constante de dados alimenta sistemas modernos impulsionados por IA, desde sistemas de segurança inteligentes até carros autónomos. Estas inovações são impulsionadas pela computação de imagem, um campo versátil que reúne ciência da computação, matemática e física.

A computação de imagem ajuda as máquinas a compreender o que veem numa imagem. Permite que os sistemas reconheçam o que está a acontecer numa cena e decidam como funcionar ou responder, tal como parar um carro autónomo quando surge um obstáculo.

Neste artigo, vamos explorar o que é a computação de imagem e como é utilizada em sistemas de inteligência artificial (IA) de ponta. Vamos começar!

Link to this sectionCompreender a computação de imagem#

A computação de imagem é o processo de capturar, processar e analisar imagens utilizando algoritmos avançados. Trata as imagens como dados que as máquinas podem compreender e processar.

Por outras palavras, cada imagem é processada como uma grelha de números. Isto é feito convertendo píxeis, as unidades mais pequenas de uma imagem, numa matriz composta por linhas e colunas. Cada píxel tem um valor numérico que indica à máquina quão brilhante ou escura é uma área específica da imagem.

A forma como estes valores estão organizados depende de a imagem ser em escala de cinzentos ou baseada em cor. Em imagens em escala de cinzentos, os valores dos píxeis variam tipicamente de 0 (preto) a 255 (branco). Em imagens a cores, são utilizadas múltiplas matrizes para representar diferentes canais de cor, como Vermelho, Verde e Azul (RGB) ou Matiz, Saturação e Valor (HSV).

Representações matriciais de imagens digitais

Fig 1. Representações matriciais de imagens (Fonte)

Além das matrizes de píxeis, uma imagem contém frequentemente informações contextuais ocultas, conhecidas como metadados. Os metadados fornecem detalhes importantes como a resolução da imagem, profundidade de bits, definições da câmara ou sensor e a hora exata em que a imagem foi capturada. As imagens são armazenadas em formatos de ficheiro específicos para preservar tanto os dados visuais quanto os metadados.

Por exemplo, na computação de imagem biomédica, as imagens são normalmente armazenadas utilizando o formato Digital Imaging and Communications in Medicine (DICOM). O DICOM combina dados visuais da imagem com informações do paciente, como detalhes de identificação e configurações do equipamento, garantindo que a análise de imagens médicas seja precisa, consistente e segura.

Link to this sectionComo funciona a computação de imagem#

Agora que temos uma melhor compreensão do que é a computação de imagem, vamos percorrer os passos utilizados para converter um feed de câmara em insights úteis.

Embora o fluxo de trabalho exato possa variar consoante a aplicação, a maioria dos sistemas de computação de imagem segue estas etapas principais:

  • Aquisição de imagem: Primeiro, os dados visuais são capturados utilizando câmaras e sensores ou recolhidos a partir de conjuntos de dados de imagem de código aberto.
  • Pré-processamento de imagem: Em seguida, as imagens adquiridas são redimensionadas, libertadas de ruído, melhoradas e convertidas para um espaço de cor específico para normalizar as entradas.
  • Extração de características: Algoritmos de deep learning são utilizados para aprender padrões importantes na imagem, como bordas, formas e texturas.
  • Interpretação: As características extraídas são analisadas para realizar tarefas como deteção de objetos, segmentação de imagem e seguimento de objetos.
  • Saída: Finalmente, o sistema gera saídas estruturadas, como etiquetas de classe ou caixas delimitadoras, e apresenta-as de uma forma que seja fácil para as pessoas ou outros sistemas compreenderem e utilizarem para visualização.

Link to this sectionComputação de imagem vs visão computacional vs processamento de imagem#

Ao encontrares o termo computação de imagem, podes também ver termos como processamento de imagem e visão computacional. Embora estes termos sejam frequentemente usados de forma intercambiável, descrevem formas diferentes de os sistemas de IA interagirem com dados visuais.

Por exemplo, o processamento de imagem foca-se na melhoria das imagens ou na otimização da qualidade das imagens de entrada utilizando operações básicas como remoção de ruído, redimensionamento e ajuste de contraste. Entretanto, a visão computacional, que é um ramo da IA, baseia-se no processamento de imagem ao permitir que as máquinas reconheçam objetos, interpretem cenas e compreendam o que está a acontecer em imagens ou vídeos.

A computação de imagem combina processamento de imagem e visão computacional para transformar dados visuais em saídas significativas e utilizáveis para sistemas inteligentes.

Comparação entre processamento de imagem, visão computacional e computação de imagem

Fig 2. Processamento de imagem vs visão computacional vs computação de imagem. Imagem do autor.

Link to this sectionComo a computação de imagem é implementada hoje#

A seguir, vamos ver como a computação de imagem é implementada hoje em dia.

Nas fases iniciais da computação de imagem, características como bordas, cantos e texturas eram definidas manualmente utilizando algoritmos baseados em regras e feitos à mão. Embora estas metodologias funcionassem razoavelmente bem em ambientes controlados, tinham dificuldade em escalar e adaptar-se a condições complexas do mundo real.

Os sistemas modernos de computação de imagem abordam estas limitações utilizando abordagens baseadas em deep learning. Modelos como redes neuronais convolucionais (CNNs) e vision transformers aprendem automaticamente características relevantes a partir de grandes conjuntos de dados de imagem. Isto permite-lhes realizar tarefas como deteção de objetos, segmentação de instâncias e seguimento de objetos com maior precisão e robustez.

Hoje, os fluxos de trabalho de computação de imagem dependem frequentemente de modelos de visão em tempo real concebidos para implementação em sistemas de IA de ponta. Por exemplo, modelos de IA de visão como o Ultralytics YOLO26 permitem capacidades de visão computacional rápidas e eficientes, como deteção de objetos e segmentação de instâncias, tanto em dispositivos de edge quanto em ambientes de nuvem.

YOLO26 detectando e segmentando objetos em uma imagem

Fig 3. Um exemplo de utilização do YOLO26 para detetar e segmentar objetos numa imagem

Link to this sectionAplicações reais da computação de imagem#

A computação de imagem está a ser amplamente utilizada em aplicações do mundo real para compreender e agir sobre dados visuais. Vamos explorar como a computação de imagem é aplicada em diferentes domínios.

Link to this sectionComputação de imagem médica para deteção precoce de doenças#

A computação de imagem pode ajudar médicos e clínicos a detetar doenças mais cedo e a analisar exames médicos de forma mais eficiente. Estes sistemas de cuidados de saúde inovadores podem processar rapidamente dados de imagiologia médica, como raios-X e exames de ressonância magnética (MRI), e frequentemente fornecem resultados mais consistentes do que a análise manual.

Por exemplo, modelos como o Ultralytics YOLO26 podem ser treinados em grandes conjuntos de imagens de raios-X torácicos para aprender padrões ligados a infeções e anomalias. Uma vez treinados, estes modelos podem ajudar a identificar se um exame parece normal ou se mostra sinais de condições como pneumonia ou COVID-19.

Link to this sectionComputação de imagem para condução autónoma#

Os veículos autónomos utilizam a computação de imagem para compreender o que se passa à sua volta e tomar decisões de condução. A tecnologia transforma imagens de câmara em bruto em informações em tempo real que ajudam o veículo a mover-se de forma segura e suave.

A computação de imagem é frequentemente utilizada em sistemas avançados de assistência ao condutor (ADAS). Em vez de apenas gravar vídeo, estes módulos analisam cada frame para identificar marcas de faixa de rodagem, outros veículos, peões e obstáculos. Isto torna possível que o carro reaja a condições variáveis da estrada com pouca intervenção humana.

Outro caso de uso comum é a combinação de imagens de várias câmaras para criar uma visão de 360 graus do que rodeia o veículo. A computação de imagem ajuda a corrigir a distorção da lente, melhorar a nitidez da imagem e equilibrar o brilho e a cor em todos os feeds das câmaras. O resultado é uma visão clara e contínua que permite ao veículo navegar em segurança, mesmo em condições meteorológicas adversas ou de baixa luminosidade.

Costura de imagens usando deep learning

Fig 4. Costura de imagem utilizando deep learning (Fonte)

Link to this sectionPrós e contras da computação de imagem#

Aqui estão algumas das vantagens da computação de imagem:

  • Escalabilidade: Uma vez treinados, os sistemas de computação de imagem podem analisar grandes volumes de dados visuais continuamente e à escala.
  • Tomada de decisão: Apoia aplicações de tempo crítico, tais como condução autónoma, triagem médica e monitorização industrial.
  • Eficiência de custos a longo prazo: Embora a configuração inicial possa ser dispendiosa, a análise visual automatizada pode reduzir os custos operacionais a longo prazo.

Embora existam muitos benefícios relacionados com a computação de imagem, existem também algumas limitações. Aqui estão alguns fatores a considerar:

  • Qualidade dos dados: Os métodos de computação de imagem dependem fortemente de rotulagem precisa e de conjuntos de dados de alta qualidade, que podem ser dispendiosos e morosos de criar.
  • Sensibilidade às condições: Alterações na iluminação, oclusão, desfocagem de movimento, clima ou ângulos de câmara podem impactar negativamente o desempenho do modelo.
  • Explicabilidade limitada: Modelos de imagem baseados em deep learning podem atuar como caixas negras, tornando difícil explicar como as decisões são tomadas.

Link to this sectionPrincipais pontos#

A computação de imagem evoluiu do processamento de imagem básico para uma tecnologia que permite aos sistemas de IA perceber e compreender o mundo real em tempo real. À medida que o deep learning continua a avançar, a computação de imagem está a tornar-se uma parte essencial da criação de conjuntos de ferramentas e aplicações mais inteligentes e práticas.

Junta-te à nossa comunidade e consulta o nosso repositório GitHub para aprenderes sobre IA. Explora as nossas páginas de soluções para leres sobre aplicações de IA na agricultura e visão computacional na logística. Descobre as nossas opções de licenciamento e começa a construir modelos de visão por IA.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática