¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Precisión Media Promedio (mAP)

Descubra la importancia de la precisión media promedio (mAP) en la evaluación de modelos de detección de objetos para aplicaciones de IA como la conducción autónoma y la atención médica.

La Precisión Media Promedio (mAP) es una métrica de evaluación crítica utilizada ampliamente en la visión artificial, especialmente para tareas de detección de objetos. Proporciona una puntuación única y completa que resume el rendimiento de un modelo midiendo la precisión de sus predicciones en todas las categorías de objetos. La puntuación mAP tiene en cuenta tanto la corrección de la clasificación (¿es el objeto lo que el modelo dice que es?) como la calidad de la localización (¿cuán bien coincide el cuadro delimitador predicho con la ubicación real del objeto?). Debido a que ofrece una evaluación equilibrada, mAP se ha convertido en la métrica estándar para comparar el rendimiento de diferentes modelos de detección de objetos como Ultralytics YOLO.

¿Cómo funciona mAP?

Para entender la mAP, es útil comprender primero sus componentes principales: Precisión, Exhaustividad e Intersección sobre Unión (IoU).

  • Precisión: Mide la precisión de las predicciones del modelo. Responde a la pregunta: "De todos los objetos que detectó el modelo, ¿qué fracción fue correcta?"
  • Recall: Mide lo bien que el modelo encuentra todos los objetos reales. Responde a la pregunta: "De todos los objetos verdaderos presentes en la imagen, ¿qué fracción detectó el modelo con éxito?"
  • Intersección sobre Unión (IoU): Una métrica que cuantifica cuánto se superpone un cuadro delimitador predicho con un cuadro delimitador de verdad fundamental (etiquetado manualmente). Una detección se considera típicamente un verdadero positivo si el IoU está por encima de un cierto umbral (por ejemplo, 0,5).

El cálculo de mAP sintetiza estos conceptos. Para cada clase de objeto, se genera una curva de precisión-recuperación trazando la precisión frente a la recuperación en varios umbrales de puntuación de confianza. La precisión media (AP) para esa clase es el área bajo esta curva, lo que proporciona un único número que representa el rendimiento del modelo en esa clase específica. Finalmente, el mAP se calcula tomando la media de las puntuaciones AP en todas las clases de objetos. Algunos esquemas de evaluación, como el del popular conjunto de datos COCO, van un paso más allá promediando el mAP en múltiples umbrales de IoU para proporcionar una evaluación aún más robusta.

Diferenciación de mAP de otras métricas

Aunque está relacionada con otras métricas de evaluación, mAP tiene un propósito distinto.

  • Precisión (Accuracy): La precisión mide la relación entre las predicciones correctas y el número total de predicciones. Generalmente se utiliza para tareas de clasificación y no es adecuada para la detección de objetos, donde una predicción debe estar correctamente clasificada y localizada.
  • F1-Score: El F1-score es la media armónica de Precisión y Recall. Si bien es útil, normalmente se calcula en un único umbral de confianza. En cambio, mAP proporciona una evaluación más completa al promediar el rendimiento en todos los umbrales.
  • Confianza: Esto no es una métrica de evaluación para el modelo en su conjunto, sino una puntuación asignada a cada predicción individual, que indica cuán seguro está el modelo acerca de esa detección. El cálculo de mAP utiliza estas puntuaciones de confianza para crear la curva Precisión-Recall.

Herramientas y Benchmarks

Los conjuntos de datos de referencia estandarizados son cruciales para avanzar en el campo de la detección de objetos. Conjuntos de datos como PASCAL VOC y COCO utilizan mAP como su métrica principal para clasificar las presentaciones en las tablas de clasificación públicas. Esto permite a los investigadores y profesionales comparar objetivamente diferentes modelos, como YOLOv8 y YOLO11.

Plataformas como Ultralytics HUB destacan prominentemente el mAP para ayudar a los usuarios a rastrear el rendimiento durante el entrenamiento del modelo y la validación. Los marcos subyacentes de aprendizaje profundo que impulsan estos modelos, como PyTorch y TensorFlow, proporcionan las herramientas necesarias para construir y entrenar modelos que finalmente se evalúan utilizando mAP.

Aplicaciones en el mundo real

La métrica mAP es fundamental en el desarrollo de sistemas de IA fiables.

  1. Vehículos Autónomos: En la IA para coches autónomos, un modelo de percepción debe detectar con precisión varios objetos como coches, peatones, ciclistas y señales de tráfico. Una alta puntuación mAP en un conjunto de datos desafiante como Argoverse indica que el modelo es robusto y fiable en todas las clases críticas, lo cual es esencial para garantizar la seguridad. Las empresas líderes en este espacio, como Waymo, dependen en gran medida de evaluaciones rigurosas utilizando métricas como mAP.
  2. Análisis de Imágenes Médicas: Al entrenar un modelo para detectar anomalías como tumores o lesiones a partir de escaneos utilizando un conjunto de datos como el conjunto de datos de tumores cerebrales, se utiliza mAP para evaluar su precisión diagnóstica general. Un mAP alto asegura que el modelo no solo sea bueno para detectar el tipo más común de anomalía, sino que también sea eficaz para identificar condiciones más raras, pero igualmente importantes. Esta evaluación exhaustiva es un paso clave antes de que un modelo pueda ser considerado para su implementación en entornos sanitarios.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles