Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Intersecção sobre a UniãoIoU)

Saiba o que é a Intersecção sobre a UniãoIoU), como é calculada e o seu papel fundamental na deteção de objectos e na avaliação de modelos de IA.

A intersecção sobre a uniãoIoU) é uma métrica de avaliação fundamental utilizada na visão computacional (CV) para medir a precisão de um um detetor de objectos num determinado conjunto de dados. Muitas vezes referido nos círculos académicos como o Índice de Jaccard, IoU quantifica o grau de sobreposição entre duas regiões: a caixa delimitadora prevista gerada por um modelo e a caixa delimitadora da verdade terrestre, que é a anotação manual que representa a localização real do objeto. objeto. Esta métrica produz um valor que varia entre 0 e 1, em que 0 indica que não há sobreposição e 1 representa uma perfeita entre a previsão e a realidade.

Compreender o funcionamento da IoU

O cálculo do IoU é concetualmente simples, o que o torna um padrão de referência para a deteção de objectos e e segmentação de imagens. É determinado por é determinado dividindo a área de intersecção (a região de sobreposição) pela área de união (a área total combinada de ambas as caixas). caixas). Ao normalizar a área de sobreposição em relação à área total, IoU fornece uma medida independente da escala, o que significa que avalia a qualidade do ajuste independentemente do tamanho do objeto.

Em aplicações práticas, é frequentemente aplicado um limiar à pontuação IoU para classify uma previsão como uma deteção deteção "positiva" ou "negativa". Por exemplo, em desafios padrão como os benchmarks do conjunto de dados benchmarks do conjunto de dadosCOCO , um limiar de IoU de 0,5 (ou 50%) é normalmente utilizado para determinar se uma deteção é válida. Este limiar é fundamental para calcular métricas a jusante métricas a jusante, como Precisão e Recall, que, em última análise, alimentam a precisão média (mAP) utilizada para classificar o desempenho do modelo.

Cálculo de IoU com Python

Pode calcular facilmente o IoU entre caixas utilizando as funções de utilidade fornecidas no ultralytics pacote. Isto é útil para scripts de avaliação personalizados ou para compreender o comportamento do modelo durante a inferência.

import torch
from ultralytics.utils.metrics import box_iou

# Define a ground truth box and a predicted box in (x1, y1, x2, y2) format
# Example: A 100x100 pixel box starting at (50,50) vs shifted prediction
ground_truth = torch.tensor([[50, 50, 150, 150]])
prediction = torch.tensor([[60, 60, 160, 160]])

# Calculate the Intersection over Union
iou_score = box_iou(ground_truth, prediction)

print(f"IoU Score: {iou_score.item():.4f}")
# Output represents the overlap ratio

Aplicações no Mundo Real

A precisão da localização fornecida pela IoU é vital em várias indústrias onde a segurança e a exatidão são segurança e precisão são fundamentais.

  • IA no sector automóvel: No desenvolvimento de veículos autónomos, os sistemas autónomos, os sistemas devem distinguir com precisão entre peões, outros veículos e obstáculos estáticos. Uma pontuação IoU elevada garante que o sistema de perceção sabe exatamente onde está um objeto em relação ao automóvel, e não apenas que ele existe. Esta localização localização precisa é essencial para o planeamento da trajetória e para os sistemas de prevenção de colisões utilizados por líderes como a Waymo e Tesla.
  • Análise de imagens médicas: Ao utilizar a IA para detect anomalias, como tumores em exames de RM ou TAC, o limite exato da lesão é importante para o diagnóstico e o planeamento do tratamento. Um modelo com IoU elevado garante que a IA nas ferramentas de cuidados de saúde estão a destacar com precisão destacam com precisão toda a área afetada sem incluir demasiado tecido saudável, ajudando os radiologistas a tomar decisões críticas.

IoU no treino e inferência de modelos

Para além da simples avaliação, IoU desempenha um papel ativo na mecânica interna das arquitecturas modernas, como YOLO11.

  • Otimizaçãoda função de perda: As funções de perda tradicionais têm muitas vezes dificuldades com caixas delimitadoras que não se sobrepõem. Para resolver isso, variações como IoU generalizadoGIoU), IoU de distânciaDIoU) e IoU completoCIoU) são incorporadas diretamente no processo de processo de treinamento. Essas variações fornecem gradientes mesmo quando as caixas não se tocam, ajudando o modelo a convergir mais rapidamente e e a obter uma melhor localização.
  • Supressão não máxima (NMS): Durante a inferência, um detetor de objectos pode produzir várias caixas delimitadoras para um único objeto. NMS utiliza o IoU para para filtrar estes resultados. Se duas caixas previstas tiverem um IoU superior a um limiar NMS específico (por exemplo, 0,7) e pertencerem e pertencerem à mesma classe, a que tiver a confiança é suprimida, deixando apenas a melhor melhor previsão.

IoU vs. métricas relacionadas

É importante distinguir a IoU de termos semelhantes para selecionar a métrica certa para a sua tarefa específica.

  • IoU vs. Precisão: A exatidão normalmente mede a percentagem de classificações corretas (por exemplo, "Isto é um gato?"). Não tem em conta onde se encontra o objeto. IoU mede especificamente a qualidade da localização (por exemplo, "Até que ponto a caixa a caixa encaixa no gato?"). Um modelo pode ter uma precisão de classificação elevada mas um IoU baixo se as caixas estiverem soltas ou desalinhadas.
  • IoU vs. Coeficiente de dados: Embora ambos meçam a sobreposição e estejam positivamente correlacionados, o Coeficiente de Dados (ou pontuação F1 dos pixéis) dá mais peso à intersecção. A pontuação Dice é mais comummente priorizada em tarefas de segmentação semântica, enquanto IoU é é o padrão para a deteção de objectos em caixas delimitadoras.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora