Glosario

Supresión no máxima (NMS)

Descubra la supresión no máxima (NMS) para la detección de objetos. Descubra cómo perfecciona los resultados, mejora la precisión y potencia aplicaciones de IA como YOLO.

La supresión no máxima (NMS) es un algoritmo fundamental de posprocesamiento utilizado en visión por ordenador, especialmente en tareas de detección de objetos. Su objetivo principal es limpiar la salida de un modelo de detección filtrando los cuadros delimitadores redundantes y superpuestos para garantizar que cada objeto se identifique una sola vez. Cuando un modelo de detección de objetos, como Ultralytics YOLO, realiza predicciones, a menudo genera múltiples cajas candidatas alrededor del mismo objeto, cada una con una puntuación de confianza diferente. NMS selecciona de forma inteligente el mejor cuadro delimitador para cada objeto y suprime, o elimina, todos los demás cuadros superpuestos que se consideran no máximos.

Cómo funciona la supresión no máxima

El algoritmo NMS funciona iterando a través de los cuadros delimitadores predichos y tomando decisiones basadas en dos métricas clave: las puntuaciones de confianza y el umbral de intersección sobre unión (IoU). El proceso puede resumirse en estos pasos:

  1. Ordenar por confianza: Todos los cuadros delimitadores pronosticados se ordenan primero en orden descendente en función de sus puntuaciones de confianza. El recuadro con la puntuación más alta se considera el más probable.
  2. Seleccionar la mejor casilla: Se selecciona el cuadro delimitador con la puntuación de confianza más alta y se eliminan de la lista todos los demás cuadros que tengan un IoU alto con este cuadro seleccionado (es decir, que se solapen significativamente).
  3. Repetir: El proceso se repite con los cuadros delimitadores restantes hasta que todos los cuadros hayan sido seleccionados o suprimidos.

El umbral IoU es un hiperparámetro crítico definido por el usuario. Un umbral IoU bajo dará lugar a menos detecciones, ya que suprimirá las cajas que tengan incluso un pequeño solapamiento, mientras que un umbral alto podría permitir múltiples detecciones para el mismo objeto. El ajuste fino de este umbral suele formar parte de la optimización del rendimiento de un modelo en un conjunto de datos específico.

Aplicaciones de la supresión no máxima

NMS es un componente crucial en muchas aplicaciones de IA del mundo real que dependen de la detección precisa de objetos.

  • Vehículos autónomos: En los coches autónomos, los sistemas de detección de objetos deben identificar con precisión a peatones, ciclistas y otros vehículos a partir de diversas entradas de cámaras y LiDAR. NMS garantiza que un único peatón no se detecte como varios individuos, lo que proporciona una entrada limpia para los sistemas de planificación de trayectorias y toma de decisiones del vehículo. Así se evitan comportamientos erráticos, como frenazos innecesarios causados por detecciones redundantes. Encontrará más información en la investigación sobre detección de objetos 3D para conducción autónoma.
  • Imágenes médicas: En el análisis de imágenes médicas, NMS se utiliza para perfeccionar la detección de anomalías como tumores o lesiones en tomografías computarizadas o resonancias magnéticas. Por ejemplo, cuando se utiliza un modelo como YOLO11 para detectar tumores, NMS ayuda a garantizar que un único tumor se localice con un cuadro delimitador, lo que mejora la precisión de los diagnósticos y la planificación de tratamientos, tal y como se explora en la investigación de imágenes médicas.

Comparación con técnicas afines

El NMS es específicamente un paso de postprocesamiento que se aplica después de que un modelo de detección de objetos haya generado su conjunto inicial de cajas delimitadoras candidatas. No debe confundirse con la propia arquitectura de detección, como la diferencia entre detectores basados en anclas y detectores sin anclas. Estas arquitecturas definen cómo se proponen los recuadros potenciales, mientras que NMS refina estas propuestas.

Curiosamente, el coste computacional y los posibles cuellos de botella asociados a los NMS han impulsado la investigación sobre detectores de objetos sin NMS. Modelos como YOLOv10 integran mecanismos durante el entrenamiento para evitar de forma inherente la predicción de cajas redundantes, con el objetivo de reducir la latencia de la inferencia y permitir una detección verdaderamente integral. Esto contrasta con enfoques tradicionales como Ultralytics YOLOv8 o YOLOv5, en los que NMS sigue siendo una parte estándar y esencial del proceso de inferencia. Puede explorar comparaciones técnicas, como YOLOv10 frente a YOLOv8, en nuestra documentación. Variantes como Soft-NMS ofrecen enfoques alternativos que decaen las puntuaciones de las cajas solapadas en lugar de eliminarlas por completo.

Integración con herramientas Ultralytics

NMS está perfectamente integrado en el ecosistema de Ultralytics. Los modelos YOLO de Ultralytics aplican automáticamente NMS durante la predicción (predict) y validación (val) lo que garantiza que los usuarios reciban resultados de detección limpios y precisos por defecto. Los parámetros que controlan el comportamiento del NMS (como el umbral IoU y el umbral de confianza) a menudo pueden ajustarse a las necesidades específicas de la aplicación.

Plataformas como Ultralytics HUB abstraen aún más estos detalles, permitiendo a los usuarios entrenar modelos y desplegarlos donde NMS se gestiona automáticamente como parte del pipeline optimizado. Esta integración garantiza que los usuarios, independientemente de sus profundos conocimientos técnicos en MLOps, puedan beneficiarse de los resultados más avanzados en detección de objetos para diversas tareas de visión por ordenador. Los detalles específicos de implementación en el marco de Ultralytics pueden explorarse en la referencia de utilidades de Ultralytics. Para más definiciones, consulte el glosario principal de Ultralytics.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles