Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Área Bajo la Curva (AUC)

Aprenda la importancia del Área Bajo la Curva (AUC) en la evaluación de modelos de ML. Descubra sus beneficios, la información de la curva ROC y las aplicaciones en el mundo real.

El área bajo la curva (AUC) es una métrica de rendimiento integral utilizada en el aprendizaje automático (ML) para evaluar el poder discriminatorio de un modelo de clasificación. En concreto, mide el área bidimensional bajo la curva característica operativa del receptor (ROC), proporcionando un único valor escalar que oscila entre 0 y 1. Un AUC de 1,0 indica un clasificador perfecto, mientras que un AUC de 0,5 sugiere que el modelo no funciona mejor que el azar. Debido a que agrega el rendimiento en todos los umbrales de clasificación posibles , el AUC es particularmente eficaz para evaluar las capacidades de modelado predictivo en escenarios en los que el límite de decisión óptimo es desconocido o variable.

La relación entre ROC y AUC

Para comprender plenamente el AUC, es necesario entender la curva ROC subyacente. Este gráfico representa la tasa de verdaderos positivos (recuerdo) frente a la tasa de falsos positivos en varios ajustes de umbral. El AUC cuantifica esencialmente la probabilidad de que el modelo clasifique una instancia positiva elegida al azar por encima de una negativa elegida al azar.

  • Separabilidad: El AUC mide la capacidad del modelo para distinguir entre clases (por ejemplo, «perro» frente a «gato»). Una mayor separabilidad significa mejores predicciones.
  • Invarianza del umbral: a diferencia de la puntuación F1, que depende de un punto de corte específico, el AUC proporciona una visión general de la calidad del modelo.
  • Invarianza de escala: Mide lo bien que están clasificadas las predicciones, en lugar de sus valores de probabilidad absolutos.

Aplicaciones en el mundo real

El AUC es una métrica preferida en industrias que se ocupan de la toma de decisiones críticas y conjuntos de datos desequilibrados, donde una clase es significativamente más rara que la otra.

  1. Diagnóstico médico: En el campo de la IA en la asistencia sanitaria, los modelos se entrenan para identificar patologías a partir del análisis de imágenes médicas. Por ejemplo, un modelo que detecta tumores raros debe priorizar la sensibilidad. Un AUC alto garantiza que el sistema asigne de forma fiable puntuaciones de riesgo más altas a los pacientes reales en comparación con las personas sanas, lo que reduce los peligrosos falsos negativos.
  2. Detección de fraudes financieros: Las instituciones financieras utilizan la IA en finanzas para detectar transacciones fraudulentas . Dado que las transacciones legítimas superan ampliamente en número a las fraudulentas, un modelo podría alcanzar una precisión del 99 % simplemente calificando todo como «legítimo». El AUC evita esto evaluando la capacidad del modelo para separar los intentos de fraude reales del comportamiento normal, independientemente de la distribución de clases.

Distinguir el AUC de otras métricas relacionadas

Es fundamental diferenciar el AUC de otros datos de evaluación de modelos para elegir la herramienta adecuada para su proyecto.

  • AUC frente a precisión: La precisión es simplemente la relación entre las predicciones correctas y el total de predicciones. En conjuntos de datos muy sesgados, la precisión puede ser engañosamente alta. El AUC es robusto ante el desequilibrio de clases, lo que proporciona una evaluación más honesta del rendimiento del clasificador.
  • AUC frente a precisión-recuerdo: mientras que ROC-AUC es el estándar para resultados equilibrados, el área bajo la curva de precisión-recuerdo (AUPRC) suele ser preferible cuando la clase «positiva» es extremadamente rara y los falsos positivos son una preocupación importante.
  • AUC frente a mAP: En tareas de detección de objetos que utilizan modelos como YOLO26, la métrica estándar es la precisión media (mAP). Mientras que mAP conceptualmente similar (calcula el área bajo la curva de precisión-recuerdo a través de diferentes umbrales de intersección sobre unión (IoU)), la AUC se refiere estrictamente a la curva ROC en la clasificación binaria o multiclase.

Ejemplo de código

El siguiente ejemplo muestra cómo cargar un modelo de clasificación YOLO26 preentrenado y ejecutar la validación. Aunque los modelos YOLO informan principalmente de la precisión top-1 y top-5, el proceso de validación genera los datos de predicción necesarios para analizar métricas basadas en curvas.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Validate the model on a standard dataset (e.g., imagenet10)
# This generates precision, recall, and accuracy metrics
results = model.val(data="imagenet10")

# Access top-1 accuracy, a key point on the ROC curve
print(f"Top-1 Accuracy: {results.top1:.4f}")
print(f"Top-5 Accuracy: {results.top5:.4f}")

Para una gestión integral del ciclo de vida, incluyendo la anotación de conjuntos de datos y el entrenamiento en la nube, donde estas métricas se visualizan automáticamente, los desarrolladores pueden utilizar Ultralytics . Esto simplifica el proceso de interpretación de métricas complejas como el AUC sin necesidad de realizar cálculos manuales.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora