O que é a correspondência de modelos? Uma breve visão geral

As imagens geralmente contêm muitos detalhes minuciosos que os seres humanos conseguem identificar facilmente. No entanto, para as máquinas, essa tarefa não é tão simples. As máquinas percebem uma imagem digital como uma grelha de valores de pixels, e mesmo pequenas alterações na iluminação, ângulo, escala ou nitidez podem ser confusas.

Os recursos de análise de imagens de uma máquina geralmente provêm de duas áreas da ciência da computação intimamente relacionadas: processamento de imagens e visão computacional. Embora muitas vezes trabalhem em conjunto, elas têm objetivos principais diferentes.

O processamento de imagens concentra-se nas imagens como dados brutos. Ele pode melhorar as imagens, mas não tenta compreender o seu conteúdo. É aí que a visão computacional faz a diferença. A visão computacional é um ramo da inteligência artificial (IA) que permite que as máquinas compreendam imagens e vídeos.

O processamento básico de imagens existe há muitos anos, mas as inovações de ponta em visão computacional são muito mais recentes. Uma ótima maneira de entender a história da área é relembrar como costumávamos resolver esses problemas usando métodos mais antigos e tradicionais.

Tomemos como exemplo a correspondência de imagens. Trata-se de uma tarefa comum de visão, em que um sistema precisa descobrir se um objeto ou padrão específico existe dentro de uma imagem maior.

Hoje em dia, isso pode ser feito com facilidade e precisão usando IA e deep learning. No entanto, antes do surgimento das redes neurais modernas na década de 2010, o método mais utilizado era uma técnica muito mais simples chamada correspondência de modelos.

Fig. 1. Um exemplo de correspondência de modelos (Fonte)

‍

A correspondência de modelos é uma técnica de processamento de imagens em que uma pequena imagem modelo é deslizada pixel a pixel sobre uma imagem maior. Esse processo de deslizamento semelhante à convolução permite que o algoritmo encontre o local que mais se aproxima desse padrão específico.

Neste artigo, exploraremos o que é a correspondência de padrões e como as melhorias modernas a tornam mais fiável em situações reais. Vamos começar!

O que é a correspondência de modelos?

A correspondência de modelos também pode ser referida como uma técnica clássica de visão computacional, o que significa que funciona diretamente com os pixels da imagem (a menor unidade de uma imagem digital). É utilizada para encontrar um padrão menor dentro de uma imagem maior.

Métodos como este são definidos usando geometria, ótica e regras matemáticas, em vez de treinar grandes modelos em conjuntos de dados massivos. Em outras palavras, um sistema de correspondência de modelos compara o brilho, a cor e outras informações de pixels entre duas entradas: a imagem de entrada (a imagem maior) e uma imagem modelo menor (o padrão a ser encontrado).

Fig. 2. A imagem A e a imagem B são exemplos de modelos. (Fonte)

‍

O principal objetivo da correspondência de modelos é localizar onde o modelo aparece na cena maior e medir o grau de correspondência com diferentes regiões da imagem. O algoritmo de correspondência de modelos faz isso deslizando o modelo pela imagem maior e calculando uma pontuação de similaridade em cada posição.

As regiões com pontuações mais altas são consideradas as melhores correspondências, o que significa que se assemelham bastante ao modelo. Como esse método se baseia em comparações pixel a pixel, ele funciona melhor em ambientes controlados, onde a aparência dos objetos não muda.

Por exemplo, a correspondência de modelos pode ser utilizada em tarefas de verificação de rótulos no controlo de qualidade. Ela pode facilmente comparar a imagem do modelo dos rótulos com as imagens do produto acabado para verificar se os rótulos estão presentes ou não.

Como funciona a correspondência de modelos

Aqui está uma visão geral passo a passo de como funciona a correspondência de modelos:

Passo 1 - Preparar as imagens: O processo começa carregando a imagem de entrada e a imagem modelo e, em seguida, convertendo ambas em imagens em tons de cinza. Como a correspondência de modelos depende da comparação de valores de pixels, remover as informações de cor reduz o ruído e acelera o processamento da imagem.

Passo 2 - Deslizar o modelo pela imagem: Em seguida, o algoritmo de correspondência de modelos desliza o modelo pela imagem maior, um pixel de cada vez (começando pelo canto superior esquerdo). Cada passo nesse movimento é uma iteração, na qual o algoritmo extrai um fragmento da imagem original que corresponde ao tamanho do modelo.

Passo 3 - Medir a qualidade da correspondência: Cada fragmento de imagem é comparado com o modelo usando um método matemático de correspondência para gerar uma métrica de correlação ou valor de correlação para cada posição possível. As abordagens comuns incluem diferenças quadradas (que medem a distância numérica entre as intensidades dos pixels para calcular a incompatibilidade total), correlação cruzada normalizada (multiplica os valores dos pixels para determinar o quão bem os padrões de luz e escuridão se alinham) e o coeficiente de correlação (subtrai o brilho médio para garantir que a correspondência permaneça precisa, mesmo que a iluminação mude um pouco).

Passo 4 - Identificar a melhor correspondência: Após avaliar todas as posições, o algoritmo seleciona a melhor correspondência encontrando o valor máximo ou mínimo, dependendo do método utilizado. Frequentemente, é aplicado um limite a esses resultados para garantir que apenas as correspondências com uma pontuação de confiança suficientemente alta sejam aceites, filtrando deteções fracas ou incorretas.

Passo 5 - Destacando o resultado: Por fim, a localização detetada é mapeada de volta para a imagem original. Normalmente, uma caixa delimitadora é desenhada em torno da região correspondente, mostrando claramente onde o modelo aparece.

Experimentando a correspondência de modelos

Embora a correspondência de modelos baseada em processamento de imagens não seja geralmente utilizada em implementações dinâmicas de soluções de visão computacional no mundo real devido às desvantagens que apresenta, se estiver interessado em testá-la, Python como OpenCV tornam esse processo simples e também oferecem tutoriais fáceis de seguir. Ela possui uma função matchTemplate integrada que lida com as complexas comparações matemáticas.

Além disso, ele suporta outras funções que ajudam em tarefas simples, como carregar imagens usando a função imread e converter cores usando a função cvtColor para transformar imagens em escala de cinza. A conversão de cores é uma etapa crítica, pois reduzir uma imagem a um único canal de intensidade torna a comparação matemática dentro do matchTemplate muito mais rápida e menos sensível ao ruído de cor.

Depois de gerar o mapa de similaridade, OpenCV inclui uma função minMaxLoc para finalizar a deteção. Ela pode ser usada para digitalizar todo o mapa e identificar os valores mínimos e máximos globais, juntamente com as suas coordenadas exatas. Dependendo do método de correspondência usado, o minMaxLoc permite identificar instantaneamente a localização da melhor correspondência, encontrando a correlação mais alta ou o valor de erro mais baixo nos dados.

Além do OpenCV, bibliotecas como NumPy essenciais para lidar com as matrizes de imagens e aplicar um limiar aos resultados, enquanto Matplotlib comumente usado para visualizar o mapa de similaridade e a detecção final. Juntas, essas ferramentas fornecem um ambiente completo para construir e depurar uma solução de correspondência de modelos.

Aplicações reais da correspondência de modelos

Agora que compreendemos melhor como funciona a correspondência de modelos, vamos analisar mais detalhadamente a sua aplicação em cenários reais.

Identificando estilos arquitetónicos tradicionais

Nos estudos sobre património cultural e arquitetura, os investigadores têm de analisar fotografias de edifícios históricos, templos e monumentos para compreender como os padrões de design variam entre regiões. Antes da adoção generalizada de modelos avançados de visão computacional, eles utilizavam técnicas de correspondência de imagens para estudar essas estruturas.

A correspondência de modelos permite que os investigadores se concentrem em detalhes arquitetónicos específicos, como contornos de telhados, disposições de janelas ou motivos nas paredes. Ao deslizar modelos ou imagens de referência por imagens maiores, eles podem identificar formas recorrentes e reduzir a análise manual de imagens, que pode levar horas.

Um exemplo interessante vem de um estudo relacionado com casas tradicionais indonésias. Os investigadores criaram pequenos modelos com características típicas e compararam-nos com fotografias em tamanho real. Esta abordagem foi utilizada para destacar regiões da imagem que correspondiam estreitamente ao modelo e classify estilos classify em diferentes regiões.

Fig. 3. Utilização da correspondência de modelos para classify casas classify na Indonésia (Fonte)

‍

Detecção de objetos em sistemas de visão industrial

Os ambientes industriais podem beneficiar de sistemas de visão que detect rapidamente detect , verificam montagens ou identificam defeitos. Antes do deep learning se tornar comum na indústria, muitas equipas experimentaram métodos de correspondência de imagens para automatizar essas tarefas.

Em termos simples, um modelo de referência de componente pode ser usado para digitalizar imagens de uma linha de produção e destacar regiões que correspondem ao modelo. Isso funciona bem quando as peças aparecem em posições consistentes e a iluminação é estável.

Correspondência de modelos para deteção de tumores pulmonares

Mesmo com a tecnologia de ponta a causar impacto na área da saúde, diagnosticar problemas de saúde a partir de imagens médicas, como tomografias computadorizadas, ainda é um desafio. Tradicionalmente, os radiologistas tinham de analisar manualmente cada corte da tomografia, um processo que exige extrema precisão e muito tempo.

Antes da aplicação do deep learning na área da saúde, os investigadores tentaram usar a correspondência de modelos para otimizar o fluxo de trabalho e auxiliar na identificação de anomalias. Um bom exemplo dessa técnica está relacionado à deteção de tumores ou nódulos pulmonares.

Neste método, os investigadores criam modelos de referência que representam a forma e a intensidade típicas de um tumor. Em seguida, o sistema desliza esses modelos pelas imagens dos pacientes, medindo a semelhança em cada coordenada.

Fig. 4. Detecção de tumor pulmonar utilizando correspondência de modelos (Fonte)

Prós e contras da correspondência de modelos

Aqui estão alguns dos principais benefícios da utilização da correspondência de modelos:

Intuitivo e direto: a correspondência de modelos é fácil de entender e implementar, tornando-a um ponto de partida ideal para iniciantes em IA e visão computacional.‍
Confiável em condições controladas: tem um bom desempenho em imagens em escala de cinza sob iluminação consistente, produzindo resultados precisos quando os padrões e fundos são estáveis.‍
Fácil integração: utilizando Python como OpenCV, a correspondência de modelos pode ser aplicada rapidamente a projetos reais sem configurações complexas ou cálculos pesados.

Embora a correspondência de modelos ofereça muitos benefícios, ela também tem limitações. Aqui estão alguns desafios a serem considerados:

Sensível à escala e rotação: variações no tamanho ou na orientação do modelo podem reduzir a precisão.‍
Dependência da iluminação e do contraste: alterações na iluminação ou no contraste entre o modelo e a imagem podem causar correspondências incorretas ou tornar o modelo mais difícil de detect.‍
Adaptabilidade limitada: ao contrário dos métodos baseados em IA, a correspondência de modelos não consegue aprender com os dados nem melhorar ao longo do tempo. Funciona melhor em ambientes controlados ou repetitivos.

Principais conclusões

A visão computacional é um campo vasto e abrange várias técnicas. Aprender sobre técnicas tradicionais de processamento de imagens, como a correspondência de modelos, é um ótimo ponto de partida para entender como funciona a análise de imagens. As inovações de ponta em IA de visão baseiam-se nos mesmos conceitos básicos e resolvem problemas semelhantes.

Quer saber mais sobre IA? Junte-se à nossa comunidade e confira o nosso repositório GitHub. Saiba como a IA no retalho e a Vision AI na indústria estão a impulsionar a mudança. Explore as nossas opções de licenciamento para começar a usar a Vision AI hoje mesmo!

O que é a correspondência de modelos? Um guia rápido

O que é a correspondência de modelos?

Como funciona a correspondência de modelos

Experimentando a correspondência de modelos

Aplicações reais da correspondência de modelos

Identificando estilos arquitetónicos tradicionais

Detecção de objetos em sistemas de visão industrial

Correspondência de modelos para deteção de tumores pulmonares

Prós e contras da correspondência de modelos

Principais conclusões

Leia mais nesta categoria

O que é a estimativa de profundidade monocular? Uma visão geral

O que é computação de imagens? Uma breve introdução

O que é a correspondência de modelos? Um guia rápido

Vamos construir o futuro
da IA juntos!

O que é a correspondência de modelos? Um guia rápido

O que é a correspondência de modelos?

Como funciona a correspondência de modelos

Experimentando a correspondência de modelos

Aplicações reais da correspondência de modelos

Identificando estilos arquitetónicos tradicionais

Detecção de objetos em sistemas de visão industrial

Correspondência de modelos para deteção de tumores pulmonares

Prós e contras da correspondência de modelos

Principais conclusões

Leia mais nesta categoria

O que é a estimativa de profundidade monocular? Uma visão geral

O que é computação de imagens? Uma breve introdução

O que é a correspondência de modelos? Um guia rápido

Vamos construir o futuro da IA juntos!

Vamos construir o futuro
da IA juntos!