Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Área Sob a Curva (AUC)

Aprenda a importância da Área Sob a Curva (AUC) na avaliação de modelos de ML. Descubra seus benefícios, insights da curva ROC e aplicações no mundo real.

A Área Sob a Curva (AUC) é uma métrica de desempenho abrangente usada em aprendizado de máquina (ML) para avaliar o poder discriminatório de um modelo de classificação. Especificamente, ela mede a área bidimensional sob a curva Receiver Operating Characteristic (ROC), fornecendo um único valor escalar que varia de 0 a 1. Uma AUC de 1,0 indica um classificador perfeito, enquanto uma AUC de 0,5 sugere que o modelo não tem um desempenho melhor do que o acaso. Como agrega o desempenho em todos os possíveis limiares de classificação, a AUC é particularmente eficaz para avaliar as capacidades de modelação preditiva em cenários em que o limite de decisão ideal é desconhecido ou variável.

A relação entre ROC e AUC

Para compreender totalmente a AUC, é necessário entender a curva ROC subjacente. Este gráfico representa a taxa de verdadeiros positivos (recall) em relação à taxa de falsos positivos em várias configurações de limiar. A AUC essencialmente quantifica a probabilidade de que o modelo classifique uma instância positiva escolhida aleatoriamente acima de uma instância negativa escolhida aleatoriamente.

  • Separabilidade: AUC mede a capacidade do modelo distinguir entre classes (por exemplo, «cão» vs. «gato»). Uma maior separabilidade significa melhores previsões.
  • Invariante de limiar: Ao contrário do F1-score, que depende de um ponto de corte específico, o AUC fornece uma visão geral ampla da qualidade do modelo.
  • Invariante de escala: mede a qualidade da classificação das previsões, em vez dos seus valores de probabilidade absolutos. .

Aplicações no Mundo Real

AUC é uma métrica preferida em setores que lidam com tomadas de decisão críticas e conjuntos de dados desequilibrados, onde uma classe é significativamente mais rara do que a outra.

  1. Diagnósticos médicos: No campo da IA na área da saúde, os modelos são treinados para identificar patologias a partir da análise de imagens médicas. Por exemplo, um modelo que detecta tumores raros deve priorizar a sensibilidade. Um AUC alto garante que o sistema atribua pontuações de risco mais altas a pacientes reais em comparação com indivíduos saudáveis, reduzindo falsos negativos perigosos .
  2. Detecção de fraudes financeiras: As instituições financeiras utilizam IA em finanças para identificar transações fraudulentas . Como as transações legítimas superam em muito as fraudulentas, um modelo poderia atingir 99% de precisão simplesmente classificando tudo como "legítimo". O AUC evita isso avaliando a capacidade do modelo de separar tentativas reais de fraude do comportamento normal, independentemente da distribuição de classes.

Distinguindo a AUC de métricas relacionadas

É fundamental diferenciar a AUC de outras informações de avaliação de modelos para escolher a ferramenta certa para o seu projeto.

  • AUC vs. Precisão: A precisão é simplesmente a relação entre as previsões corretas e o total de previsões. Em conjuntos de dados altamente distorcidos, a precisão pode ser enganosamente alta. A AUC é robusta em relação ao desequilíbrio de classes, fornecendo uma avaliação mais honesta do desempenho do classificador.
  • AUC vs. Precisão-Recall: Embora o ROC-AUC seja padrão para resultados equilibrados, a Área sob a Curva de Precisão-Recall (AUPRC) é frequentemente preferida quando a classe "positiva" é extremamente rara e os falsos positivos são uma grande preocupação.
  • AUC vs. mAP: Em tarefas de deteção de objetos usando modelos como o YOLO26, a métrica padrão é a Precisão Média (mAP). Embora a mAP conceitualmente semelhante — calculando a área sob a curva Precisão-Recall em diferentes limiares de Intersecção sobre União (IoU) — a AUC refere-se estritamente à curva ROC na classificação binária ou multiclasse.

Exemplo de código

O exemplo a seguir demonstra como carregar um modelo de classificação YOLO26 pré-treinado e executar a validação. Embora os modelos YOLO relatem principalmente a precisão top-1 e top-5, o processo de validação gera os dados de previsão necessários para analisar métricas baseadas em curvas.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Validate the model on a standard dataset (e.g., imagenet10)
# This generates precision, recall, and accuracy metrics
results = model.val(data="imagenet10")

# Access top-1 accuracy, a key point on the ROC curve
print(f"Top-1 Accuracy: {results.top1:.4f}")
print(f"Top-5 Accuracy: {results.top5:.4f}")

Para uma gestão abrangente do ciclo de vida, incluindo anotação de conjuntos de dados e formação em nuvem, onde essas métricas são visualizadas automaticamente, os programadores podem utilizar Ultralytics . Isso simplifica o processo de interpretação de métricas complexas, como AUC, sem cálculo manual.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora