Glossário

Detectores baseados em âncoras

Descubra como os detectores baseados em âncoras revolucionam a deteção de objectos com localização precisa, adaptabilidade à escala e aplicações no mundo real.

Os detectores baseados em âncoras são uma classe fundamental de modelos de deteção de objectos na visão computacional. Estes modelos funcionam através da utilização de um conjunto predefinido de caixas, conhecidas como caixas de ancoragem, para identificar e localizar objectos numa imagem. As caixas de ancoragem são essencialmente uma grelha de modelos com vários tamanhos e rácios de aspeto que são colocados em mosaico na imagem. O modelo prevê a forma de deslocar e dimensionar estas âncoras para corresponder às caixas delimitadoras de objectos, juntamente com uma pontuação de confiança que indica a presença de um objeto. Esta abordagem simplifica o problema de encontrar objectos, transformando-o numa tarefa de regressão e classificação relativamente a estas âncoras fixas.

Exemplos proeminentes de arquitecturas baseadas em âncoras incluem a família R-CNN, como a Faster R-CNN, e os primeiros detectores de fase única, como o SSD (Single Shot MultiBox Detetor) e muitos modelos YOLO, incluindo o muito bem sucedido Ultralytics YOLOv5.

Como funcionam os detectores baseados em âncoras

A ideia central da deteção baseada em âncoras é utilizar um conjunto de caixas de referência predefinidas como ponto de partida. Durante o processo de formação do modelo, o detetor aprende a realizar duas tarefas principais para cada caixa de ancoragem:

  1. Classificação: Determinar se uma caixa de ancoragem contém um objeto de interesse ou se é apenas um fundo.
  2. Regressão: Calcular os desvios precisos (x, y, largura, altura) necessários para ajustar a caixa de ancoragem de modo a que esta envolva firmemente o objeto detectado.

Estas previsões são efectuadas pela cabeça de deteção do modelo após o processamento das caraterísticas da imagem extraídas pela espinha dorsal. Uma vez que um único objeto pode ser detectado por várias caixas de ancoragem, é utilizado um passo de pós-processamento denominado Supressão Não Máxima (NMS) para filtrar as detecções redundantes e manter apenas a caixa mais adequada. O desempenho destes modelos é frequentemente avaliado utilizando métricas como a precisão média (mAP) e a intersecção sobre a união (IoU).

Detectores com base em âncoras vs. Detectores sem âncoras

Nos últimos anos, os detectores sem âncoras surgiram como uma alternativa popular. Ao contrário dos modelos baseados em âncoras, as abordagens sem âncoras prevêem diretamente a localização e o tamanho dos objectos, muitas vezes identificando pontos-chave (como centros ou cantos de objectos) ou prevendo distâncias de um ponto aos limites do objeto, eliminando a necessidade de formas de âncora predefinidas.

As principais diferenças incluem:

  • Complexidade: Os modelos baseados em âncoras requerem uma conceção cuidadosa e a afinação dos parâmetros das âncoras (tamanhos, rácios, escalas), que podem ser dependentes do conjunto de dados. Os modelos sem âncoras simplificam a conceção da cabeça de deteção.
  • Flexibilidade: Os métodos sem âncoras podem adaptar-se melhor a objectos com rácios de aspeto invulgares ou formas não bem representadas pelo conjunto de âncoras fixas.
  • Eficiência: A eliminação das âncoras pode reduzir o número de previsões que o modelo precisa de efetuar, o que pode levar a uma inferência mais rápida e a um pós-processamento mais simples.

Embora os detectores baseados em âncoras, como o YOLOv4, tenham sido muito bem sucedidos, muitas arquitecturas modernas, incluindo o Ultralytics YOLO11, adoptaram designs sem âncoras para tirar partido das suas vantagens em termos de simplicidade e eficiência. Pode explorar as vantagens da deteção sem âncoras no YOLO11 e ver comparações entre diferentes modelos YOLO.

Aplicações no mundo real

Os detectores baseados em âncoras são amplamente utilizados em várias aplicações em que os objectos têm formas e tamanhos relativamente normalizados.

  • Condução autónoma: Em soluções para a indústria automóvel, estes detectores são excelentes para identificar veículos, peões e sinais de trânsito. As formas previsíveis destes objectos alinham-se bem com âncoras predefinidas, permitindo uma deteção fiável para empresas como a NVIDIA e a Tesla.
  • Análise de retalho: Para a gestão de inventário orientada por IA, os modelos baseados em âncoras podem digitalizar eficazmente as prateleiras para contar os produtos. O tamanho e a forma uniformes dos produtos embalados tornam-nos candidatos ideais para esta abordagem, ajudando a automatizar a monitorização do stock.
  • Segurança e vigilância: A identificação de pessoas ou veículos em imagens de câmaras de vigilância fixas é outro caso de utilização importante. Isto é fundamental para aplicações como o guia do sistema de alarme de segurança Ultralytics.

Ferramentas e formação

O desenvolvimento e a implementação de modelos de deteção de objectos, baseados ou não em âncoras, envolve a utilização de estruturas como PyTorch ou TensorFlow e bibliotecas como OpenCV. Plataformas como o Ultralytics HUB oferecem fluxos de trabalho simplificados para treinar modelos personalizados, gerir conjuntos de dados e implementar soluções, suportando várias arquitecturas de modelos. Para aprender mais, recursos como Papers With Code listam modelos de última geração, e cursos de plataformas como DeepLearning.AI cobrem conceitos fundamentais.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência