Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glossário

Caixas de ancoragem

Saiba como as caixas de ancoragem permitem a deteção de objectos com base em ancoragem, priors para classificação, regressão e NMS, com aplicações na condução autónoma e no retalho.

As caixas de ancoragem são um componente fundamental em muitos modelos de deteção de objectos baseados em ancoragem, servindo como um conjunto predefinido de caixas de referência com alturas e larguras específicas. Estas caixas actuam como priors, ou suposições educadas, sobre a potencial localização e escala dos objectos numa imagem. Em vez de procurar objectos às cegas, os modelos utilizam estas âncoras como pontos de partida, prevendo deslocamentos para refinar a sua posição e tamanho de modo a corresponder aos objectos reais. Esta abordagem transforma a tarefa complexa de localização de objectos num problema de regressão mais fácil de gerir, em que o modelo aprende a ajustar estes modelos em vez de gerar caixas a partir do zero.

Como funcionam as caixas de ancoragem

O mecanismo principal envolve a colocação de uma imagem em mosaicos com uma grelha densa de caixas de ancoragem em várias posições. Em cada posição, são utilizadas várias âncoras com diferentes escalas e proporções para garantir a deteção eficaz de objectos de diversas formas e tamanhos. Durante o processo de treino do modelo, a espinha dorsal do detetor extrai primeiro um mapa de caraterísticas da imagem de entrada. A cabeça de deteção utiliza então estas caraterísticas para realizar duas tarefas para cada caixa de ancoragem:

  • Classificação: Prevê a probabilidade de uma caixa de ancoragem conter um objeto de interesse, atribuindo uma etiqueta de classe e uma pontuação de confiança.
  • Regressão: Calcula os ajustes precisos (ou deslocamentos) necessários para transformar a caixa de ancoragem numa caixa delimitadora final que envolva firmemente o objeto.

O modelo utiliza métricas como a Intersecção sobre a União (IoU) para determinar quais as caixas de ancoragem que melhor correspondem aos objectos da verdade terrestre durante o treino. Após a previsão, é aplicado um passo de pós-processamento denominado Supressão Não Máxima (NMS) para eliminar caixas redundantes e sobrepostas para o mesmo objeto.

Caixas de ancoragem vs. outros conceitos

É importante distinguir as caixas de ancoragem de termos relacionados na visão computacional:

  • Caixa de delimitação: Uma caixa de ancoragem é um modelo pré-definido utilizado durante o processo de deteção, enquanto uma caixa delimitadora é o resultado final e refinado que localiza com precisão um objeto detectado.
  • Detectores sem âncoras: Embora os modelos baseados em âncoras, como o YOLOv5 e a família Faster R-CNN, dependam destas predefinições, as arquitecturas modernas têm vindo a mudar cada vez mais para detectores sem âncoras. Modelos como o Ultralytics YOLO11 prevêem a localização de objectos diretamente através da identificação de pontos-chave ou centros, o que simplifica a conceção do modelo e pode melhorar o desempenho em objectos com formas não convencionais. Pode ler mais sobre as vantagens de um design sem âncoras no YOLO11.

Aplicações no Mundo Real

A abordagem estruturada das caixas de ancoragem torna-as eficazes em cenários em que os objectos têm formas e tamanhos previsíveis.

  1. Condução autónoma: Em soluções para a indústria automóvel, os detectores baseados em âncoras são excelentes na identificação de carros, peões e sinais de trânsito. Os rácios de aspeto relativamente consistentes destes objectos alinham-se bem com âncoras predefinidas, permitindo uma deteção fiável para sistemas desenvolvidos por empresas como a NVIDIA e a Tesla.
  2. Análise de retalho: Para a gestão de inventário orientada por IA, estes modelos podem digitalizar eficazmente as prateleiras para contar os produtos. O tamanho e a forma uniformes dos produtos embalados tornam-nos candidatos ideais para uma abordagem baseada em âncoras, ajudando a automatizar a monitorização do stock e a reduzir o esforço manual.

Estes modelos são normalmente desenvolvidos utilizando poderosas estruturas de aprendizagem profunda, como o PyTorch e o TensorFlow. Para uma aprendizagem contínua, plataformas como DeepLearning.AI oferecem cursos abrangentes sobre os fundamentos da visão computacional.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora
Link copiado para a área de transferência