Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Detetores Baseados em Âncoras (Anchor-Based Detectors)

Descubra como os detetores baseados em âncoras revolucionam a detecção de objetos com localização precisa, adaptabilidade de escala e aplicações no mundo real.

Os detectores baseados em âncoras são uma classe fundamental de modelos utilizados em visão computacional (CV) para resolver o problema da deteção de objectos. Estes sistemas baseiam-se num conjunto predefinido de caixas delimitadoras, conhecidas como caixas de ancoragem, que actuam como modelos de referência de referência ao longo de uma imagem. Em vez de tentar prever a localização de um objeto a partir do zero, a rede calcula quanto a deslocar e a dimensionar estas âncoras fixas para se ajustarem aos objectos na cena. Esta abordagem converte essencialmente a tarefa complexa de localização num problema de regressão estruturado, fornecendo um ponto de partida estável para os modelos de modelos de aprendizagem profunda (DL) para aprender hierarquias hierarquias espaciais.

Mecanismos de deteção com base em âncoras

O fluxo de trabalho de um detetor baseado em âncoras envolve a geração de uma grelha densa de âncoras sobre a imagem de entrada, cada uma com cada uma com escalas e rácios de aspeto variáveis para capturar objectos de diferentes tamanhos e formas. À medida que a imagem passa pelo modelo, os mapas de caraterísticas são extraídos e analisados. Para cada localização de âncora, o cabeça de deteção efectua duas previsões simultâneas:

  1. Classificação: O modelo atribui uma pontuação de probabilidade que indica se a âncora contém uma classe específica de objeto ou é simplesmente ruído de fundo.
  2. Regressão de caixa delimitadora: O modelo prevê valores de desvio (coordenadas para o centro, largura e altura) para ajustar as dimensões da âncora de forma a corresponder à da verdade terrestre.

Durante o treino do modelo, os algoritmos utilizam uma métrica denominada Intersecção sobre União (IoU) para determinar quais as âncoras que se sobrepõem suficientemente a objectos conhecidos. Apenas as âncoras com o IoU mais elevado são tratadas como amostras positivas. Como este processo gera milhares de caixas candidatas, um passo de pós-processamento conhecido como Supressão Não Máxima (NMS) é é aplicado para remover sobreposições redundantes e reter apenas a deteção mais precisa.

Arquitecturas baseadas em âncoras vs. arquitecturas sem âncoras

É importante distinguir estes modelos da geração moderna de detectores detectores sem âncoras. Enquanto os sistemas como o Faster R-CNN original e o Ultralytics YOLOv5 dependem do ajuste manual das dimensões os modelos sem âncoras prevêem diretamente os centros dos objectos ou os pontos-chave.

  • Baseado em âncoras: Requer a definição de hiperparâmetros para tamanhos e rácios de âncoras, que podem ser sensíveis a conjuntos de dados específicos. Historicamente, são robustos para objectos padrão.
  • Sem âncora: Elimina a necessidade de caixas predefinidas, simplificando a arquitetura e reduzindo a sobrecarga computacional. O estado da arte Ultralytics YOLO11 utiliza uma abordagem sem âncoras para para alcançar uma velocidade e flexibilidade superiores, particularmente para objectos com geometrias irregulares. Pode ler mais sobre os vantagens do design sem âncoras no YOLO11 no nosso blogue.

Aplicações no Mundo Real

Apesar do surgimento de métodos mais recentes, os detectores baseados em âncoras continuam a ser predominantes em muitos pipelines estabelecidos onde as formas dos objectos são consistentes e previsíveis. formas dos objectos são consistentes e previsíveis.

  • Condução autónoma: No desenvolvimento de veículos autónomos, os sistemas devem detetar de forma fiável detect com fiabilidade carros, camiões e sinais de trânsito. Uma vez que os veículos mantêm geralmente rácios de aspeto consistentes, os modelos baseados em âncoras são eficazes para pilhas de perceção usadas por líderes do setor como Waymo e Mobileye.
  • Gestão do inventário de retalho: Para IA no retalho, as câmaras monitorizam as track para níveis de stock. Produtos como caixas de cereais ou latas de bebidas têm formas padronizadas que se alinham perfeitamente com modelos de âncora sintonizados, permitindo uma contagem de alta precisão e a identificação de produtos. modelos de âncora ajustados, permitindo uma contagem de alta precisão e e rastreio de objectos.

Implementação com Ultralytics

Pode experimentar facilmente a deteção de objectos utilizando o ultralytics pacote. Embora os modelos mais recentes sejam livres de âncoras, o framework suporta uma variedade de arquiteturas. O exemplo a seguir demonstra como executar a inferência em uma imagem usando um modelo pré-treinado:

from ultralytics import YOLO

# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

Compreender a mecânica dos detectores baseados em âncoras fornece uma base sólida para compreender a evolução da visão computacional e as escolhas de design por detrás de algoritmos avançados como o YOLO11 e futuras iterações como YOLO26.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora