Saiba o que é a Intersecção sobre União (IoU), como é calculada e o seu papel fundamental na deteção de objectos e na avaliação de modelos de IA.
A intersecção sobre a união (IoU) é uma métrica de avaliação fundamental utilizada na visão computacional (CV), em particular para tarefas de deteção de objectos. Mede a sobreposição entre dois limites: a caixa delimitadora prevista gerada por um modelo e a caixa delimitadora da verdade no terreno, que é o contorno correto marcado à mão. A pontuação resultante, um valor entre 0 e 1, quantifica a precisão com que um modelo localizou um objeto numa imagem. Uma pontuação de 1 representa uma correspondência perfeita, enquanto uma pontuação de 0 indica que não existe qualquer sobreposição. Esta métrica é crucial para avaliar a precisão da localização de modelos como o Ultralytics YOLO11.
No seu núcleo, o IoU calcula o rácio entre a intersecção (área sobreposta) e a união (área total coberta por ambas as caixas) das caixas delimitadoras previstas e da verdade terrestre. Imagine dois quadrados sobrepostos. A "intersecção" é a área partilhada onde se sobrepõem. A "união" é a área total que ambos os quadrados cobrem combinados, contando a parte sobreposta apenas uma vez. Ao dividir a intersecção pela união, o IoU fornece uma medida padronizada de quão bem a caixa prevista se alinha com o objeto real. Este conceito simples mas poderoso é uma pedra angular da aprendizagem profunda (DL) moderna para deteção de objectos.
Uma parte fundamental da utilização do IoU é a definição de um "limiar IoU". Este limiar é um valor predefinido (por exemplo, 0,5) que determina se uma previsão está correta. Se a pontuação do IoU para uma caixa prevista estiver acima desse limite, ela será classificada como um "verdadeiro positivo". Se a pontuação for inferior, trata-se de um "falso positivo". Este limiar influencia diretamente outras métricas de desempenho como a Precisão e a Recuperação, e é um componente crítico no cálculo da Precisão Média Média (mAP), uma métrica padrão para avaliar modelos de deteção de objectos em conjuntos de dados de referência como o COCO.
A IoU é essencial para validar o desempenho de inúmeros sistemas de IA. Eis alguns exemplos:
O IoU não é apenas uma métrica de avaliação; é também parte integrante do próprio processo de formação. Muitas arquitecturas modernas de deteção de objectos, incluindo as variantes do Ultralytics YOLOv8 e YOLO11, utilizam a IoU ou as suas variações diretamente nas suas funções de perda. Essas perdas avançadas baseadas em IoU, como IoU generalizado (GIoU), IoU de distância (DIoU) ou IoU completo (CIoU), ajudam o modelo a aprender a prever caixas delimitadoras que não apenas se sobrepõem bem, mas também consideram fatores como a distância entre os centros e a consistência da proporção de aspeto. Isto leva a uma convergência mais rápida e a um melhor desempenho de localização em comparação com as perdas de regressão tradicionais. Pode encontrar comparações detalhadas entre diferentes modelos YOLO na nossa documentação.
A monitorização da IoU durante o treino do modelo e a afinação dos hiperparâmetros ajuda os programadores a aperfeiçoar os modelos para uma melhor localização. Ferramentas como o Ultralytics HUB permitem monitorizar a IoU e outras métricas, simplificando o ciclo de melhoria do modelo. Apesar da sua utilidade generalizada, o IoU padrão pode por vezes ser insensível, especialmente para caixas não sobrepostas. Essa limitação motivou o desenvolvimento das variantes de IoU mencionadas anteriormente. No entanto, a IoU continua a ser uma pedra angular da avaliação da visão computacional.
Embora a IoU seja vital, é importante compreender a sua relação com outras métricas: