Limiarização no Processamento de Imagens Explicada

Como seres humanos, vemos as imagens como imagens coerentes e significativas, enquanto os computadores as veem como grelhas de pequenos pixels, os menores componentes de uma imagem digital. Num processo chamado processamento de imagem, estes pixels podem ser ajustados ou analisados para melhorar a imagem e extrair informações úteis.

Uma técnica comum de processamento de imagem é chamada de limiarização de imagem. Este método converte imagens em tons de cinza (onde cada pixel representa um tom de cinza) em imagens em preto e branco, comparando cada pixel a um valor definido. Ele cria uma separação clara entre regiões importantes e o fundo.

A limiarização é frequentemente usada na segmentação de imagens, uma técnica que divide uma imagem em regiões significativas para facilitar a análise. É normalmente um dos primeiros passos para ajudar as máquinas a interpretar dados visuais. Neste artigo, veremos o que é limiarização, como funciona e onde é aplicada em cenários do mundo real. Vamos começar!

Terminologia básica em limiarização de imagem

Antes de nos aprofundarmos em como o thresholding funciona, vamos primeiro dar uma olhada mais de perto nas ideias básicas por trás dele e como ele é usado no processamento de imagem.

Limiar de imagem binária

Digamos que está a trabalhar com uma imagem e quer separar os objetos nela do fundo. Uma forma de o fazer é através da limiarização. Simplifica a imagem para que cada pixel seja completamente preto ou completamente branco. O resultado é uma imagem binária, onde cada pixel tem um valor de 0 (preto) ou 255 (branco). Este passo é frequentemente útil no processamento de imagem porque faz com que as partes importantes da imagem se destaquem claramente.

Fig 1. Uma imagem em escala de cinza e sua saída binária após a aplicação de thresholding. (Fonte)

‍

Histograma

Da mesma forma, se quiser entender como os valores de brilho são distribuídos por uma imagem, um histograma pode ajudar. É um gráfico que mostra com que frequência cada intensidade de pixel aparece, do preto (0) ao branco (255).

Ao analisar o histograma, você pode ver se a imagem está escura, clara ou algo intermediário. Isso facilita a escolha de um bom valor de limiar ao transformar a imagem em preto e branco, pois você pode identificar padrões e níveis de contraste rapidamente.

Primeiro plano e plano de fundo

Depois que uma imagem é limiarizada, ela é dividida em duas partes: o primeiro plano e o fundo. O primeiro plano, normalmente mostrado em branco, destaca os elementos importantes, como texto, formas ou objetos que você deseja detectar. O fundo, mostrado em preto, é todo o resto. Essa separação ajuda as máquinas a se concentrarem no que importa na imagem.

Segmentação

Como mencionado anteriormente, a segmentação divide uma imagem em regiões significativas com base em características como o brilho ou a textura. A limiarização é uma forma simples de o fazer e é frequentemente um dos primeiros passos num pipeline de visão computacional.

A visão computacional é um ramo da IA que permite que as máquinas processem e interpretem dados visuais, assim como os humanos. Ao usar o thresholding no início do processo, os sistemas de visão computacional podem separar objetos de seu fundo, facilitando as etapas posteriores, como detecção ou reconhecimento, para funcionar com precisão.

Limiarização global

Agora que temos uma melhor compreensão do que é thresholding, vamos percorrer como aplicar thresholding a uma imagem e os diferentes tipos de thresholding no processamento de imagem.

Por exemplo, a limiarização global é uma das formas mais fáceis de criar uma imagem binária. Aplica um único valor de intensidade em toda a imagem. Os pixels mais brilhantes do que este limiar tornam-se brancos, enquanto os mais escuros tornam-se pretos. Isto ajuda a separar o objeto do fundo.

Funciona melhor quando a imagem tem iluminação uniforme e forte contraste. Mas em iluminação irregular ou áreas de baixo contraste, um único limiar pode perder detalhes ou borrar bordas.

Para lidar com isto, são utilizados métodos como a limiarização de Otsu. Em vez de definir um valor manualmente, o método de Otsu para limiarização analisa o histograma da imagem e escolhe um limiar que melhor separa as intensidades dos pixels em primeiro plano e fundo.

Fig. 2. Uma imagem de Saturno antes e depois de aplicar a limiarização de Otsu. (Fonte)

‍

Limiarização local (adaptativa)

Ao contrário da limiarização global, a limiarização adaptativa ou local calcula o valor do limiar separadamente para diferentes partes da imagem. Isso a torna mais eficaz para imagens com iluminação irregular, como documentos digitalizados com sombras ou superfícies texturizadas.

Funciona dividindo a imagem em pequenas regiões e computando um limiar local para cada bloco, o que ajuda a manter o contraste entre o primeiro plano e o fundo. Esta abordagem é amplamente utilizada em tarefas como reconhecimento de texto, imagens médicas e inspeção de superfície, onde a iluminação varia em toda a imagem.

Algumas abordagens comuns para limiarização adaptativa no processamento de imagens incluem a limiarização adaptativa da média e a limiarização adaptativa gaussiana. Na limiarização adaptativa da média, a intensidade média do pixel em uma vizinhança local é usada como o limite para o pixel central. A limiarização adaptativa gaussiana, por outro lado, usa uma média ponderada com uma janela gaussiana, dando mais importância aos pixels mais próximos do centro.

Aplicações no mundo real da limiarização no processamento de imagens

Em seguida, vamos explorar onde o thresholding de imagem é usado em aplicações do mundo real.

Limiarização de imagem para binarização de documentos e OCR

Livros antigos e cartas manuscritas são frequentemente digitalizados para serem preservados ou convertidos em texto digital usando OCR (Reconhecimento Ótico de Caracteres), uma tecnologia que lê caracteres impressos ou manuscritos. Antes que o texto possa ser extraído, o documento geralmente precisa de limpeza ou pré-processamento. As imagens digitalizadas geralmente têm sombras, tinta desbotada ou iluminação irregular, o que pode dificultar o reconhecimento de caracteres.

Para melhorar a clareza, a limiarização é usada para converter imagens em tons de cinza em formato binário, ajudando a isolar o texto do fundo. Áreas mais escuras, como as letras, tornam-se pretas, enquanto o fundo mais claro fica branco - tornando muito mais fácil para os sistemas de OCR ler o texto.

Fig 3. Um exemplo de um documento histórico e sua imagem limiarizada. (Fonte)

‍

Usando limiarização no processamento de imagens médicas

Da mesma forma, em imagens médicas, a limiarização é comumente usada para isolar estruturas específicas em exames, como ossos ou pulmões em imagens de raios-X. Ao converter imagens em escala de cinza em formato binário, torna-se mais fácil separar as regiões de interesse do tecido circundante e preparar a imagem para análise posterior. Em casos mais complexos, a limiarização multinível pode ser aplicada para dividir a imagem em várias regiões distintas, permitindo que diferentes tipos de tecido ou estruturas sejam identificados ao mesmo tempo.

Fig 4. Usando métodos de limiarização multinível em radiografias de tórax. (Fonte)

‍

Prós e contras da limiarização no processamento de imagem

Aqui estão alguns dos principais benefícios de usar a limiarização no processamento de imagem:

Leve em recursos: O Thresholding funciona bem em dispositivos de baixa potência e não precisa de acesso à nuvem ou hardware de ponta, tornando-o adequado para sistemas embarcados e configurações offline.
‍
Fácil de interpretar: Sua lógica simples torna as saídas de limiarização fáceis de entender e depurar, o que é crucial em campos como saúde ou processamento de documentos, onde a transparência é importante.
‍
Teste rápido: O limiar permite que as equipes explorem rapidamente ideias de segmentação em projetos de estágio inicial antes de passar para modelos mais complexos.

Embora a limiarização de imagem seja útil em muitos cenários, também apresenta certas limitações. Aqui estão alguns desafios relacionados à limiarização a serem considerados:

Falta de adaptabilidade: A limiarização segue regras fixas e não se ajusta a novas condições de iluminação ou variações nos dados sem ajustes manuais.
‍
Sensível ao ruído: Pequenas mudanças no brilho devido a sombras ou reflexos podem comprometer os resultados, especialmente ao trabalhar com imagens detalhadas ou texturizadas.
‍
Estático e baseado em regras: Ao contrário dos modelos de IA, o thresholding não aprende com os dados nem melhora com o tempo. Ele só funciona dentro das condições restritas para as quais foi projetado.

Além do thresholding de imagem: quando a visão computacional é a ferramenta certa

A limiarização funciona bem para tarefas simples de segmentação em ambientes controlados. No entanto, muitas vezes tem dificuldades ao lidar com imagens complexas que possuem vários objetos ou ruído de fundo. Como depende de regras fixas, a limiarização carece da flexibilidade necessária para a maioria das aplicações do mundo real.

Para ir além desses limites, muitos sistemas de ponta agora usam visão computacional. Em contraste com a limiarização, os modelos de Visão de IA são treinados para detetar padrões e características complexas, tornando-os muito mais precisos e adaptáveis.

Por exemplo, modelos de visão computacional como o Ultralytics YOLO11 podem detectar objetos e segmentar imagens em tempo real. Isso os torna ideais para tarefas como identificar sinais de trânsito em veículos autônomos ou identificar problemas de colheita na agricultura.

Em particular, o YOLO11 suporta uma variedade de tarefas de visão computacional, como segmentação de instâncias, onde cada objeto em uma imagem é segmentado separadamente. Ele também pode executar outras tarefas baseadas em visão, incluindo estimativa de pose (determinar a posição ou postura de um objeto) e rastreamento de objetos (seguir um objeto enquanto ele se move pelos quadros de vídeo).

Fig 5. O YOLO11 facilita a detecção e segmentação de objetos. (Fonte)

Embora a limiarização funcione bem para tarefas simples ou para testar ideias iniciais, aplicações que precisam de velocidade, precisão e flexibilidade geralmente são melhor tratadas com visão computacional.

Principais conclusões

A limiarização é uma ferramenta crucial no processamento de imagens porque é rápida e fácil de usar para separar objetos do fundo. Funciona bem com documentos digitalizados, imagens médicas e verificação de defeitos de produtos em fábricas.

No entanto, à medida que as imagens e os vídeos se tornam mais complexos, os métodos básicos de processamento de imagem, como a limiarização de imagem, podem ter dificuldades. É aí que os modelos avançados de visão computacional podem entrar em ação. Modelos como o YOLO11 conseguem entender e executar mais tarefas, identificar vários objetos simultaneamente e funcionar em tempo real, tornando-os úteis para diversos casos de uso.

Quer saber mais sobre IA? Confira nossa comunidade e o repositório GitHub. Explore nossas páginas de soluções para saber mais sobre IA em robótica e visão computacional na agricultura. Descubra nossas opções de licenciamento e comece a construir com visão computacional hoje mesmo!

O que é limiarização no processamento de imagem?

Terminologia básica em limiarização de imagem

Limiar de imagem binária

Histograma

Primeiro plano e plano de fundo

Segmentação

Limiarização global

Limiarização local (adaptativa)

Aplicações no mundo real da limiarização no processamento de imagens

Limiarização de imagem para binarização de documentos e OCR

Usando limiarização no processamento de imagens médicas

Prós e contras da limiarização no processamento de imagem

Além do thresholding de imagem: quando a visão computacional é a ferramenta certa

Principais conclusões

Leia mais nesta categoria

Dos bits aos qubits: Como a otimização quântica está a remodelar a IA

Um guia rápido para principiantes sobre como treinar um modelo de IA

Explorando o aprendizado por ensemble e seu papel na IA e ML

Vamos construir o futuro
da IA juntos!

O que é limiarização no processamento de imagem?

Terminologia básica em limiarização de imagem

Limiar de imagem binária

Histograma

Primeiro plano e plano de fundo

Segmentação

Limiarização global

Limiarização local (adaptativa)

Aplicações no mundo real da limiarização no processamento de imagens

Limiarização de imagem para binarização de documentos e OCR

Usando limiarização no processamento de imagens médicas

Prós e contras da limiarização no processamento de imagem

Além do thresholding de imagem: quando a visão computacional é a ferramenta certa

Principais conclusões

Leia mais nesta categoria

Dos bits aos qubits: Como a otimização quântica está a remodelar a IA

Um guia rápido para principiantes sobre como treinar um modelo de IA

Explorando o aprendizado por ensemble e seu papel na IA e ML

Vamos construir o futuro da IA juntos!

Vamos construir o futuro
da IA juntos!