Descubra como os detetores baseados em âncoras revolucionam a detecção de objetos com localização precisa, adaptabilidade de escala e aplicações no mundo real.
Os detectores baseados em âncoras são uma classe fundamental de modelos utilizados em visão computacional (CV) para resolver o problema da deteção de objectos. Estes sistemas baseiam-se num conjunto predefinido de caixas delimitadoras, conhecidas como caixas de ancoragem, que actuam como modelos de referência de referência ao longo de uma imagem. Em vez de tentar prever a localização de um objeto a partir do zero, a rede calcula quanto a deslocar e a dimensionar estas âncoras fixas para se ajustarem aos objectos na cena. Esta abordagem converte essencialmente a tarefa complexa de localização num problema de regressão estruturado, fornecendo um ponto de partida estável para os modelos de modelos de aprendizagem profunda (DL) para aprender hierarquias hierarquias espaciais.
O fluxo de trabalho de um detetor baseado em âncoras envolve a geração de uma grelha densa de âncoras sobre a imagem de entrada, cada uma com cada uma com escalas e rácios de aspeto variáveis para capturar objectos de diferentes tamanhos e formas. À medida que a imagem passa pelo modelo, os mapas de caraterísticas são extraídos e analisados. Para cada localização de âncora, o cabeça de deteção efectua duas previsões simultâneas:
Durante o treino do modelo, os algoritmos utilizam uma métrica denominada Intersecção sobre União (IoU) para determinar quais as âncoras que se sobrepõem suficientemente a objectos conhecidos. Apenas as âncoras com o IoU mais elevado são tratadas como amostras positivas. Como este processo gera milhares de caixas candidatas, um passo de pós-processamento conhecido como Supressão Não Máxima (NMS) é é aplicado para remover sobreposições redundantes e reter apenas a deteção mais precisa.
É importante distinguir estes modelos da geração moderna de detectores detectores sem âncoras. Enquanto os sistemas como o Faster R-CNN original e o Ultralytics YOLOv5 dependem do ajuste manual das dimensões os modelos sem âncoras prevêem diretamente os centros dos objectos ou os pontos-chave.
Apesar do surgimento de métodos mais recentes, os detectores baseados em âncoras continuam a ser predominantes em muitos pipelines estabelecidos onde as formas dos objectos são consistentes e previsíveis. formas dos objectos são consistentes e previsíveis.
Pode experimentar facilmente a deteção de objectos utilizando o ultralytics pacote. Embora os modelos mais recentes
sejam livres de âncoras, o framework suporta uma variedade de arquiteturas. O exemplo a seguir demonstra como executar a
inferência em uma imagem usando um modelo pré-treinado:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
Compreender a mecânica dos detectores baseados em âncoras fornece uma base sólida para compreender a evolução da visão computacional e as escolhas de design por detrás de algoritmos avançados como o YOLO11 e futuras iterações como YOLO26.