Confusion Matrix
Aprende cómo una matriz de confusión evalúa el rendimiento de clasificación. Explora TP, FP, TN y FN para optimizar tus modelos de Ultralytics YOLO26 para una mayor precisión.
Una matriz de confusión es una herramienta de medición del rendimiento para problemas de clasificación de machine learning en los que el resultado puede ser dos o más clases. Es una tabla con cuatro combinaciones diferentes de valores previstos y reales, que sirve como elemento fundamental para la visualización de datos en la evaluación de modelos. A diferencia de la precisión simple, que puede llevar a engaño si el conjunto de datos no está equilibrado, una matriz de confusión proporciona un desglose granular de dónde comete errores un modelo de visión artificial (CV). Al comparar las predicciones con las etiquetas de verdad fundamental, los desarrolladores pueden determinar si el sistema está confundiendo dos clases específicas o si no está detectando un objeto en absoluto.
Link to this sectionComponentes principales de la matriz#
La matriz en sí se divide normalmente en cuatro cuadrantes para la clasificación binaria, aunque se expande para problemas multiclase como los que maneja Ultralytics YOLO26. Estos cuatro componentes representan la intersección de lo que el modelo predijo frente a lo que realmente existe en la imagen.
- Verdaderos Positivos (TP): El modelo predice correctamente la clase positiva. Por ejemplo, en una tarea de detección de objetos, el modelo dibuja correctamente una caja delimitadora alrededor de una persona que realmente está en el encuadre.
- Verdaderos Negativos (TN): El modelo predice correctamente la clase negativa. Esto es crucial en escenarios como la detección de anomalías, donde el sistema identifica correctamente que una pieza fabricada no tiene defectos.
- Falsos Positivos (FP): El modelo predice incorrectamente la clase positiva. A menudo llamado "error de tipo I", esto ocurre cuando el sistema detecta un objeto que no está ahí, como una cámara de seguridad que marca una sombra como un intruso.
- Falsos Negativos (FN): El modelo predice incorrectamente la clase negativa. Conocido como "error de tipo II", esto ocurre cuando el modelo no logra detectar un objeto que está presente, básicamente "perdiendo" el objetivo.
Link to this sectionMétricas derivadas y significado#
Los números brutos en una matriz de confusión se utilizan para calcular métricas más avanzadas que describen el rendimiento del modelo. Entender estos derivados es esencial para optimizar las redes neuronales.
- Precisión: Calculada como TP / (TP + FP), esta métrica revela cuán precisas son las predicciones positivas. Una alta precisión significa menos falsas alarmas.
- Sensibilidad (Recall): Calculada como TP / (TP + FN), esta mide la capacidad del modelo para encontrar todas las instancias positivas. Una alta sensibilidad es vital cuando no detectar un objeto tiene consecuencias graves.
- Puntuación F1: La media armónica de la precisión y la sensibilidad. Proporciona una única puntuación que equilibra el compromiso entre ambas, útil para comparar diferentes modelos YOLO26.
Link to this sectionAplicaciones en el mundo real#
El coste específico de los errores definido por la matriz de confusión dicta cómo se ajustan los modelos para diferentes industrias.
En el campo de la IA en la atención sanitaria, la matriz de confusión es una cuestión de seguridad. Al entrenar un modelo para el análisis de imágenes médicas para detectar tumores, un falso negativo (no detectar un tumor) es mucho peor que un falso positivo (marcar un punto benigno para que el médico lo revise). Por lo tanto, los ingenieros priorizan la sensibilidad sobre la precisión en estas matrices para garantizar que no se pasen por alto posibles riesgos para la salud.
Por el contrario, en el control de calidad de fabricación, la eficiencia es clave. Si un sistema que clasifica piezas en una línea de montaje genera demasiados falsos positivos (marcar piezas buenas como defectuosas), causa residuos innecesarios y ralentiza la producción. Aquí, la matriz de confusión ayuda a los ingenieros a ajustar el modelo para maximizar la precisión, asegurando que lo que se rechaza es verdaderamente defectuoso, agilizando los flujos de trabajo de machine learning automatizado.
Link to this sectionGenerar una matriz de confusión con YOLO26#
Al usar frameworks modernos, generar esta matriz suele ser parte del proceso estándar de validación. El siguiente ejemplo demuestra cómo validar un modelo YOLO26 y acceder a los datos de la matriz de confusión utilizando el paquete ultralytics.
from ultralytics import YOLO
# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on the COCO8 dataset
# This automatically generates and plots the confusion matrix
metrics = model.val(data="coco8.yaml")
# Access the confusion matrix object directly
print(metrics.confusion_matrix.matrix)Link to this sectionDiferenciación de conceptos relacionados#
Es importante distinguir la matriz de confusión de otros términos de evaluación similares.
- Vs. Exactitud: La exactitud es simplemente la proporción de predicciones correctas respecto al total de predicciones. Aunque es útil, la exactitud puede ser muy engañosa en conjuntos de datos desequilibrados. Por ejemplo, si el 95% de los correos electrónicos no son spam, un modelo que predice "no spam" para todos los correos tiene una exactitud del 95% pero es inútil. La matriz de confusión revela este fallo al mostrar cero verdaderos positivos para la clase de spam.
- Vs. Curva ROC: La matriz de confusión proporciona una instantánea del rendimiento en un umbral de confianza específico. Por el contrario, la curva de Característica Operativa del Receptor (ROC) visualiza cómo cambian la tasa de verdaderos positivos y la tasa de falsos positivos a medida que se varía ese umbral. Herramientas como la Plataforma Ultralytics permiten a los usuarios explorar ambas visualizaciones para elegir el punto operativo óptimo para su despliegue.






