Glosario

Precisión media (mAP)

Descubra la importancia de la precisión media (mAP) en la evaluación de modelos de detección de objetos para aplicaciones de IA como la conducción autónoma y la asistencia sanitaria.

La Precisión Media Promedio (mAP) es una métrica de evaluación crítica muy utilizada en visión por ordenador, especialmente para tareas de detección de objetos. Proporciona una puntuación única y completa que resume el rendimiento de un modelo midiendo la precisión de sus predicciones en todas las categorías de objetos. La puntuación mAP tiene en cuenta tanto la exactitud de la clasificación (¿es el objeto lo que el modelo dice que es?) como la calidad de la localización ( ¿coincide la predicción con la ubicación real del objeto?). Dado que ofrece una evaluación equilibrada, mAP se ha convertido en la métrica estándar para comparar el rendimiento de diferentes modelos de detección de objetos como Ultralytics YOLO.

Cómo funciona mAP

Para entender el mAP, es útil comprender primero sus componentes básicos: Precisión, Recall e Intersección sobre Unión (IoU).

  • Precisión: Mide la exactitud de las predicciones del modelo. Responde a la pregunta "De todos los objetos que detectó el modelo, ¿qué fracción fue correcta?".
  • Recordar: Mide lo bien que el modelo encuentra todos los objetos reales. Responde a la pregunta "De todos los objetos verdaderos presentes en la imagen, ¿qué fracción detectó con éxito el modelo?".
  • Intersección sobre Unión (IoU): Medida que cuantifica el grado de solapamiento de un cuadro delimitador previsto con un cuadro delimitador real (etiquetado manualmente). Normalmente, una detección se considera un verdadero positivo si la IoU supera un determinado umbral (por ejemplo, 0,5).

El cálculo del mAP sintetiza estos conceptos. Para cada clase de objeto, se genera una curva Precisión-Recuperación trazando la precisión frente a la recuperación en varios umbrales de puntuación de confianza. La Precisión Media (PA) para esa clase es el área bajo esta curva, proporcionando un único número que representa el rendimiento del modelo en esa clase específica. Por último, la mAP se calcula tomando la media de las puntuaciones AP de todas las clases de objetos. Algunos esquemas de evaluación, como el del popular conjunto de datos COCO, van un paso más allá y promedian el mAP entre varios umbrales de IoU para proporcionar una evaluación aún más sólida.

Diferenciar el mAP de otras métricas

Aunque está relacionada con otras métricas de evaluación, la mAP tiene un propósito distinto.

  • Precisión: La precisión mide la relación entre las predicciones correctas y el número total de predicciones. Generalmente se utiliza para tareas de clasificación y es poco adecuada para la detección de objetos, donde una predicción debe estar correctamente clasificada y localizada.
  • Puntuación F1: La puntuación F1 es la media armónica de Precision y Recall. Aunque es útil, suele calcularse con un único umbral de confianza. En cambio, mAP proporciona una evaluación más completa al promediar el rendimiento en todos los umbrales.
  • Confianza: No se trata de una métrica de evaluación del modelo en su conjunto, sino de una puntuación asignada a cada predicción individual, que indica el grado de certeza del modelo sobre esa detección. El cálculo del mAP utiliza estas puntuaciones de confianza para crear la curva Precisión-Recuperación.

Herramientas y puntos de referencia

Los conjuntos de datos de referencia normalizados son cruciales para avanzar en el campo de la detección de objetos. Conjuntos de datos como PASCAL VOC y COCO utilizan mAP como métrica principal para clasificar las presentaciones en tablas de clasificación públicas. Esto permite a investigadores y profesionales comparar objetivamente distintos modelos, como YOLOv8 y YOLO11.

Plataformas como Ultralytics HUB incluyen mAP de forma destacada para ayudar a los usuarios a realizar un seguimiento del rendimiento durante la formación y validación de modelos. Los marcos de aprendizaje profundo subyacentes que impulsan estos modelos, como PyTorch y TensorFlow, proporcionan las herramientas necesarias para crear y entrenar modelos que, en última instancia, se evalúan mediante mAP.

Aplicaciones reales

La métrica mAP es fundamental para desarrollar sistemas de IA fiables.

  1. Vehículos autónomos: En la IA para vehículos autónomos, un modelo de percepción debe detectar con precisión diversos objetos como coches, peatones, ciclistas y señales de tráfico. Una puntuación mAP alta en un conjunto de datos difícil como Argoverse indica que el modelo es sólido y fiable en todas las clases críticas, lo que es esencial para garantizar la seguridad. Las empresas líderes en este ámbito, como Waymo, dependen en gran medida de evaluaciones rigurosas que utilizan métricas como mAP.
  2. Análisis de imágenes médicas: Cuando se entrena un modelo para detectar anomalías como tumores o lesiones a partir de escáneres utilizando un conjunto de datos como el de tumores cerebrales, el mAP se utiliza para evaluar su precisión diagnóstica global. Un mAP alto garantiza que el modelo no sólo es bueno para detectar el tipo más común de anomalía, sino que también es eficaz para identificar afecciones más raras, pero igualmente importantes. Esta evaluación exhaustiva es un paso clave antes de considerar la implantación de un modelo en entornos sanitarios.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles