Glosario

Supresión no máxima (NMS)

Descubra la supresión no máxima (NMS) para la detección de objetos. Descubra cómo perfecciona los resultados, mejora la precisión y potencia aplicaciones de IA como YOLO.

La supresión no máxima (NMS) es una técnica crucial de posprocesamiento muy utilizada en visión por ordenador (VC), especialmente en los procesos de detección de objetos. Su función principal es perfeccionar los resultados brutos generados por los modelos de detección, que a menudo identifican varios recuadros delimitadores superpuestos para el mismo objeto. Al filtrar de forma inteligente estos recuadros redundantes, NMS garantiza que cada objeto distinto de una imagen o un fotograma de vídeo esté representado por un único recuadro delimitador óptimo. Esto mejora significativamente la claridad y precisión de los resultados finales de detección, haciéndolos más útiles para tareas posteriores.

Cómo funciona la supresión no máxima

Los modelos de detección de objetos, como las distintas versiones de Ultralytics YOLO, suelen escanear una imagen y proponer numerosos recuadros potenciales alrededor de los objetos detectados. Cada cuadro propuesto tiene una puntuación de confianza, que indica la certeza del modelo de que el cuadro contiene un objeto y pertenece a una clase específica. NMS funciona reduciendo sistemáticamente estas propuestas en función de sus puntuaciones de confianza y su solapamiento espacial.

El proceso suele seguir estos pasos:

  1. Todos los recuadros delimitadores propuestos se clasifican en función de sus puntuaciones de confianza, normalmente en orden descendente.
  2. El cuadro delimitador con la puntuación de confianza más alta se selecciona como detección definitiva.
  3. Todas las demás cajas delimitadoras que tengan un solapamiento significativo con esta caja seleccionada se suprimen o eliminan. El solapamiento se mide utilizando la métrica Intersección sobre Unión (IoU), y la supresión se produce si la IoU supera un umbral predefinido (por ejemplo, 0,5). Se puede encontrar una explicación detallada de este concepto básico en recursos como la guía NMS de PyImageSearch.
  4. El proceso se repite iterativamente: se selecciona la siguiente casilla con mayor puntuación entre las restantes y se suprimen las casillas que se solapan.
  5. Esto continúa hasta que todas las casillas han sido seleccionadas como detecciones finales o suprimidas.

Esto garantiza que sólo queden los recuadros más seguros y no superpuestos, proporcionando un resultado mucho más limpio e interpretable, como se visualiza en muchos tutoriales de visión por ordenador.

Importancia en la IA y el aprendizaje automático

En los campos más amplios de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM), el NMS es fundamental para lograr un rendimiento fiable en la detección de objetos. Sin NMS, la salida de un detector como YOLO11 estaría abarrotada de múltiples casillas para objetos individuales. Esta redundancia puede provocar errores en aplicaciones posteriores, como el recuento de objetos(guía de recuento de objetos), el seguimiento de objetos o la comprensión de escenas complejas en robótica.

Al eliminar estas detecciones redundantes (que a menudo contribuyen a los falsos positivos), NMS mejora significativamente la precisión de las predicciones del modelo. Este refinamiento es fundamental para las aplicaciones que exigen una gran fiabilidad y precisión. El impacto de NMS se refleja en métricas de evaluación como la Precisión Media Promedio (mAP), que suelen calcularse después de aplicar NMS, tal y como se detalla en la guía de métricas de rendimiento de YOLO.

Aplicaciones reales

NMS es una tecnología fundamental que permite numerosas aplicaciones prácticas de IA:

Comparación con técnicas afines

El NMS es específicamente un paso de postprocesamiento que se aplica después de que un modelo de detección de objetos haya generado su conjunto inicial de cajas delimitadoras candidatas. No debe confundirse con la propia arquitectura de detección, como la diferencia entre detectores basados en anclas y detectores sin anclas. Estas arquitecturas definen cómo se proponen los recuadros potenciales, mientras que NMS refina estas propuestas.

Curiosamente, el coste computacional y los posibles cuellos de botella asociados a los NMS han impulsado la investigación sobre detectores de objetos sin NMS. Modelos como YOLOv10 integran mecanismos durante el entrenamiento (como asignaciones duales coherentes) para evitar de forma inherente la predicción de cajas redundantes, con el objetivo de reducir la latencia de la inferencia y permitir una detección realmente de extremo a extremo(enfoque sin NMS de YOLOv10). Esto contrasta con enfoques tradicionales como Ultralytics YOLOv8 o YOLOv5, en los que NMS sigue siendo una parte estándar y esencial del proceso de inferencia. En nuestra documentación encontrará comparaciones técnicas, como YOLOv10 frente a YOLOv8. Variantes como Soft-NMS(artículo sobre Soft-NMS) ofrecen enfoques alternativos que decaen las puntuaciones de las cajas solapadas en lugar de eliminarlas por completo.

Integración con herramientas Ultralytics

NMS está perfectamente integrado en el ecosistema de Ultralytics. Los modelos YOLO de Ultralytics aplican automáticamente NMS durante la predicción (predict) y validación (val) lo que garantiza que los usuarios reciban resultados de detección limpios y precisos por defecto. Los parámetros que controlan el comportamiento del NMS (como el umbral IoU y el umbral de confianza) a menudo pueden ajustarse a las necesidades específicas de la aplicación.

Plataformas como Ultralytics HUB abstraen aún más estos detalles, permitiendo a los usuarios entrenar modelos(guía de entrenamiento en la nube) y desplegarlos donde NMS se gestiona automáticamente como parte del pipeline optimizado. Esta integración garantiza que los usuarios, independientemente de sus profundos conocimientos técnicos en MLOps, puedan beneficiarse de resultados de detección de objetos de última generación para diversas tareas de visión por ordenador. Los detalles específicos de implementación en el marco de Ultralytics pueden explorarse en la referencia de utilidades de Ultralytics. Para más definiciones, consulte el glosario principal de Ultralytics.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles