Descubra como os detectores baseados em âncoras revolucionam a deteção de objectos com localização precisa, adaptabilidade à escala e aplicações no mundo real.
Os detectores baseados em âncoras são uma classe fundamental de modelos de deteção de objectos na visão computacional. Estes modelos funcionam através da utilização de um conjunto predefinido de caixas, conhecidas como caixas de ancoragem, para identificar e localizar objectos numa imagem. As caixas de ancoragem são essencialmente uma grelha de modelos com vários tamanhos e rácios de aspeto que são colocados em mosaico na imagem. O modelo prevê a forma de deslocar e dimensionar estas âncoras para corresponder às caixas delimitadoras de objectos, juntamente com uma pontuação de confiança que indica a presença de um objeto. Esta abordagem simplifica o problema de encontrar objectos, transformando-o numa tarefa de regressão e classificação relativamente a estas âncoras fixas.
Exemplos proeminentes de arquitecturas baseadas em âncoras incluem a família R-CNN, como a Faster R-CNN, e os primeiros detectores de fase única, como o SSD (Single Shot MultiBox Detetor) e muitos modelos YOLO, incluindo o muito bem sucedido Ultralytics YOLOv5.
A ideia central da deteção baseada em âncoras é utilizar um conjunto de caixas de referência predefinidas como ponto de partida. Durante o processo de formação do modelo, o detetor aprende a realizar duas tarefas principais para cada caixa de ancoragem:
Estas previsões são efectuadas pela cabeça de deteção do modelo após o processamento das caraterísticas da imagem extraídas pela espinha dorsal. Uma vez que um único objeto pode ser detectado por várias caixas de ancoragem, é utilizado um passo de pós-processamento denominado Supressão Não Máxima (NMS) para filtrar as detecções redundantes e manter apenas a caixa mais adequada. O desempenho destes modelos é frequentemente avaliado utilizando métricas como a precisão média (mAP) e a intersecção sobre a união (IoU).
Nos últimos anos, os detectores sem âncoras surgiram como uma alternativa popular. Ao contrário dos modelos baseados em âncoras, as abordagens sem âncoras prevêem diretamente a localização e o tamanho dos objectos, muitas vezes identificando pontos-chave (como centros ou cantos de objectos) ou prevendo distâncias de um ponto aos limites do objeto, eliminando a necessidade de formas de âncora predefinidas.
As principais diferenças incluem:
Embora os detectores baseados em âncoras, como o YOLOv4, tenham sido muito bem sucedidos, muitas arquitecturas modernas, incluindo o Ultralytics YOLO11, adoptaram designs sem âncoras para tirar partido das suas vantagens em termos de simplicidade e eficiência. Pode explorar as vantagens da deteção sem âncoras no YOLO11 e ver comparações entre diferentes modelos YOLO.
Os detectores baseados em âncoras são amplamente utilizados em várias aplicações em que os objectos têm formas e tamanhos relativamente normalizados.
O desenvolvimento e a implementação de modelos de deteção de objectos, baseados ou não em âncoras, envolve a utilização de estruturas como PyTorch ou TensorFlow e bibliotecas como OpenCV. Plataformas como o Ultralytics HUB oferecem fluxos de trabalho simplificados para treinar modelos personalizados, gerir conjuntos de dados e implementar soluções, suportando várias arquitecturas de modelos. Para aprender mais, recursos como Papers With Code listam modelos de última geração, e cursos de plataformas como DeepLearning.AI cobrem conceitos fundamentais.