Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Guias

O que é thresholding no processamento de imagem?

Explora o thresholding no processamento de imagem com este guia. Aprende o que é thresholding e diferentes técnicas de thresholding de imagem, incluindo o thresholding de Otsu.

ABAbirami Vina
5 min read
Uma imagem em escala de cinzentos convertida para preto e branco usando thresholding

Para uma visão geral visual dos conceitos abordados neste artigo, assista ao vídeo abaixo.

Como humanos, vemos imagens como quadros coerentes e significativos, enquanto os computadores as veem como grades de pequenos pixels, os menores componentes de uma imagem digital. Em um processo chamado processamento de imagens, esses pixels podem ser ajustados ou analisados para melhorar a imagem e extrair informações úteis.

Uma técnica comum de processamento de imagem é chamada de limiarização de imagem (ou thresholding). Este método converte imagens em tons de cinza (onde cada pixel representa um tom de cinza) em imagens em preto e branco, comparando cada pixel a um valor definido. Isso cria uma separação clara entre regiões importantes e o fundo.

A limiarização é frequentemente usada em segmentação de imagem, uma técnica que divide uma imagem em regiões significativas para facilitar a análise. Geralmente, é um dos primeiros passos para ajudar máquinas a interpretar dados visuais. Neste artigo, veremos o que é a limiarização, como funciona e onde é aplicada em cenários do mundo real. Vamos começar!

Link to this sectionTerminologia básica na limiarização de imagens#

Antes de mergulharmos em como a limiarização funciona, vamos primeiro dar uma olhada mais de perto nos conceitos básicos por trás dela e em como é usada no processamento de imagens.

Link to this sectionLimiar de imagem binária#

Digamos que você esteja trabalhando com uma imagem e queira separar os objetos dela do fundo. Uma maneira de fazer isso é pela limiarização. Ela simplifica a imagem para que cada pixel seja totalmente preto ou totalmente branco. O resultado é uma imagem binária, onde cada pixel tem um valor de 0 (preto) ou 255 (branco). Esse passo é frequentemente útil no processamento de imagens porque torna as partes importantes da imagem claramente visíveis.

Uma imagem em tons de cinza e sua saída binária após a aplicação de limiar

Fig 1. Uma imagem em tons de cinza e sua saída binária após a limiarização. (Fonte: blog.devops.dev)

Link to this sectionHistograma#

Da mesma forma, se você quiser entender como os valores de brilho estão distribuídos em uma imagem, um histograma pode ajudar. É um gráfico que mostra com que frequência cada intensidade de pixel aparece, do preto (0) ao branco (255).

Ao olhar para o histograma, você pode ver se a imagem está escura, brilhante ou em algum nível intermediário. Isso torna mais fácil escolher um bom valor de limiar ao transformar a imagem em preto e branco, já que você consegue identificar padrões e níveis de contraste rapidamente.

Link to this sectionPrimeiro plano (foreground) e fundo (background)#

Uma vez que uma imagem passa pela limiarização, ela é dividida em duas partes: o primeiro plano e o fundo. O primeiro plano, geralmente exibido em branco, destaca os elementos importantes, como texto, formas ou objetos que você deseja detectar. O fundo, exibido em preto, é tudo o resto. Essa separação ajuda as máquinas a se concentrarem no que é importante na imagem.

Link to this sectionSegmentação#

Como mencionado anteriormente, a segmentação divide uma imagem em regiões significativas com base em características como brilho ou textura. A limiarização é uma maneira simples de fazer isso e costuma ser um dos primeiros passos em um pipeline de visão computacional.

Visão computacional é um ramo da IA que permite que máquinas processem e interpretem dados visuais, assim como os humanos fazem. Ao usar a limiarização logo no início do processo, os sistemas de visão computacional podem separar objetos de seus fundos, facilitando a precisão de passos posteriores, como detecção ou reconhecimento.

Link to this sectionLimiarização global#

Agora que temos uma compreensão melhor do que é a limiarização, vamos percorrer como aplicar o processo a uma imagem e os diferentes tipos de limiarização no processamento de imagens.

Por exemplo, a limiarização global é uma das maneiras mais fáceis de criar uma imagem binária. Ela aplica um único valor de intensidade em toda a imagem. Pixels mais brilhantes que esse limiar tornam-se brancos, enquanto os mais escuros tornam-se pretos. Isso ajuda a separar o objeto do fundo.

Funciona melhor quando a imagem possui iluminação uniforme e forte contraste. Porém, em áreas de iluminação irregular ou baixo contraste, um único limiar pode perder detalhes ou borrar bordas.

Para lidar com isso, métodos como a limiarização de Otsu são usados. Em vez de definir um valor manualmente, o método de Otsu analisa o histograma da imagem e escolhe um limiar que melhor separa as intensidades dos pixels entre primeiro plano e fundo.

Uma imagem de Saturno antes e depois de aplicar o limiar de Otsu

Fig 2. Uma imagem de Saturno antes e depois de aplicar a limiarização de Otsu. (Fonte)

Link to this sectionLimiarização local (adaptativa)#

Ao contrário da limiarização global, a limiarização adaptativa ou local calcula o valor do limiar separadamente para diferentes partes da imagem. Isso a torna mais eficaz para imagens com iluminação irregular, como documentos digitalizados com sombras ou superfícies texturizadas.

Ela funciona dividindo a imagem em pequenas regiões e calculando um limiar local para cada bloco, o que ajuda a manter o contraste entre o primeiro plano e o fundo. Essa abordagem é amplamente utilizada em tarefas como reconhecimento de texto, imagem médica e inspeção de superfícies, onde a iluminação varia ao longo da imagem.

Algumas abordagens comuns para limiarização adaptativa no processamento de imagens incluem a limiarização de média adaptativa e a limiarização gaussiana adaptativa. Na limiarização de média adaptativa, a intensidade média dos pixels em uma vizinhança local é usada como o limiar para o pixel central. Já a limiarização gaussiana adaptativa utiliza uma média ponderada com uma janela gaussiana, dando mais importância aos pixels próximos ao centro.

Link to this sectionAplicações reais da limiarização no processamento de imagens#

A seguir, vamos explorar onde a limiarização de imagens é usada em aplicações reais.

Link to this sectionLimiarização de imagem para binarização de documentos e OCR#

Livros antigos e cartas manuscritas são frequentemente digitalizados para preservá-los ou convertê-los em texto digital usando OCR (Reconhecimento Óptico de Caracteres), uma tecnologia que lê caracteres impressos ou manuscritos. Antes que o texto possa ser extraído, o documento geralmente precisa de limpeza ou pré-processamento. Imagens digitalizadas geralmente contêm sombras, tinta desbotada ou iluminação irregular, o que pode dificultar o reconhecimento de caracteres.

Para melhorar a clareza, a limiarização é usada para converter imagens em tons de cinza para o formato binário, ajudando a isolar o texto do fundo. Áreas mais escuras, como as letras, tornam-se pretas, enquanto o fundo mais claro torna-se branco - facilitando muito a leitura do texto pelos sistemas de OCR.

Um documento histórico e sua imagem com limiar aplicado

Fig 3. Um exemplo de um documento histórico e sua imagem limiarizada. (Fonte)

Link to this sectionUsando a limiarização no processamento de imagens médicas#

Da mesma forma, em imagens médicas, a limiarização é comumente usada para isolar estruturas específicas em exames, como ossos ou pulmões em radiografias. Ao converter imagens em tons de cinza para o formato binário, torna-se mais fácil separar regiões de interesse do tecido circundante e preparar a imagem para análises adicionais. Em casos mais complexos, pode-se aplicar a limiarização multinível para dividir a imagem em várias regiões distintas, permitindo que diferentes tipos de tecido ou estruturas sejam identificados simultaneamente.

Uso de métodos de limiar de múltiplos níveis em radiografias de tórax

Fig 4. Usando métodos de limiarização multinível em radiografias de tórax. (Fonte: sciencedirect.com)

Link to this sectionPrós e contras da limiarização no processamento de imagens#

Aqui estão alguns dos principais benefícios do uso da limiarização no processamento de imagens:

  • Leve em recursos: A limiarização funciona bem em dispositivos de baixo consumo e não precisa de acesso à nuvem ou hardware de alta performance, tornando-a adequada para sistemas embarcados e configurações offline.
  • Fácil de interpretar: Sua lógica simples torna as saídas da limiarização fáceis de entender e depurar, o que é crucial em áreas como saúde ou processamento de documentos, onde a transparência é importante.
  • Teste rápido: A limiarização permite que as equipes explorem rapidamente ideias de segmentação em projetos de estágio inicial antes de avançar para modelos mais complexos.

Embora a limiarização de imagem seja útil em muitos cenários, ela também traz certas limitações. Aqui estão alguns desafios relacionados à limiarização para considerar:

  • Falta de adaptabilidade: A limiarização segue regras fixas e não se ajusta a novas condições de iluminação ou variações nos dados sem ajustes manuais.
  • Sensível ao ruído: Pequenas mudanças no brilho causadas por sombras ou reflexos podem comprometer os resultados, especialmente ao trabalhar com imagens detalhadas ou texturizadas.
  • Estática e baseada em regras: Ao contrário dos modelos de IA, a limiarização não aprende com os dados nem melhora com o tempo. Ela só funciona dentro das condições restritas para as quais foi projetada.

Link to this sectionAlém da limiarização de imagem: Quando a visão computacional é a ferramenta certa#

A limiarização funciona bem para tarefas simples de segmentação em configurações controladas. No entanto, ela frequentemente apresenta dificuldades ao lidar com imagens complexas que possuem múltiplos objetos ou ruído de fundo. Como depende de regras fixas, a limiarização carece da flexibilidade necessária para a maioria das aplicações reais.

Para superar esses limites, muitos sistemas de ponta agora usam visão computacional. Em contraste com a limiarização, modelos de IA de visão são treinados para detectar padrões e características complexas, tornando-os muito mais precisos e adaptáveis.

Por exemplo, modelos de visão computacional como Ultralytics YOLO11 podem detectar objetos e segmentar imagens em tempo real. Isso os torna ideais para tarefas como detectar sinais de trânsito em veículos autônomos ou identificar problemas em colheitas na agricultura.

Em particular, o YOLO11 suporta uma série de tarefas de visão computacional, como a segmentação de instâncias, onde cada objeto em uma imagem é segmentado separadamente. Ele também pode realizar outras tarefas baseadas em visão, incluindo estimativa de pose (determinar a posição ou postura de um objeto) e rastreamento de objetos (seguir um objeto à medida que ele se move pelos quadros de vídeo).

YOLO11 detectando e segmentando objetos em uma imagem

Fig 5. O YOLO11 torna a detecção e a segmentação de objetos fáceis. (Fonte)

Embora a limiarização funcione bem para tarefas simples ou para testar ideias iniciais, aplicações que exigem velocidade, precisão e flexibilidade são geralmente melhor tratadas com visão computacional.

Link to this sectionPrincipais pontos#

A limiarização é uma ferramenta crucial no processamento de imagens porque é rápida e fácil de usar para separar objetos do fundo. Ela funciona bem com documentos digitalizados, imagens médicas e na verificação de defeitos em produtos em fábricas.

No entanto, à medida que as imagens e os vídeos se tornam mais complexos, métodos básicos de processamento de imagem, como a limiarização, podem ter dificuldades. É aí que modelos avançados de visão computacional podem entrar. Modelos como o YOLO11 podem entender e realizar mais tarefas, detectar muitos objetos de uma só vez e trabalhar em tempo real, tornando-os úteis para muitos casos de uso.

Queres saber mais sobre IA? Consulta a nossa comunidade e o repositório GitHub. Explora as nossas páginas de soluções para aprender sobre IA em robótica e visão computacional na agricultura. Descobre as nossas opções de licenciamento e começa a construir com visão computacional hoje!

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática