Glossaire

Suppression non maximale (NMS)

Découvrez la suppression non maximale (NMS) pour la détection d'objets. Apprenez comment elle affine les résultats, améliore la précision et alimente des applications d'IA telles que YOLO.

La suppression non maximale (NMS) est une technique de post-traitement cruciale largement utilisée dans le domaine de la vision artificielle (CV), en particulier dans les pipelines de détection d'objets. Son rôle principal est d'affiner les résultats bruts générés par les modèles de détection, qui identifient souvent plusieurs boîtes de délimitation se chevauchant pour la même instance d'objet. En filtrant intelligemment ces boîtes redondantes, NMS garantit que chaque objet distinct d'une image ou d'une séquence vidéo est représenté par une seule boîte englobante optimale. Cela améliore considérablement la clarté et la précision des résultats de détection finaux, les rendant plus utiles pour les tâches ultérieures.

Comment fonctionne la suppression non maximale

Les modèles de détection d'objets, tels que les différentes versions d'Ultralytics YOLO, analysent généralement une image et proposent de nombreuses boîtes de délimitation potentielles autour des objets détectés. Chaque boîte proposée est assortie d'un score de confiance, indiquant la certitude du modèle que la boîte contient un objet et appartient à une classe spécifique. Le NMS réduit systématiquement ces propositions en fonction de leur score de confiance et de leur chevauchement spatial.

Le processus suit généralement les étapes suivantes :

  1. Toutes les boîtes englobantes proposées sont triées en fonction de leur indice de confiance, généralement dans l'ordre décroissant.
  2. La boîte englobante présentant le score de confiance le plus élevé est sélectionnée comme détection définitive.
  3. Toutes les autres boîtes de délimitation qui présentent un chevauchement significatif avec la boîte sélectionnée sont supprimées ou éliminées. Le chevauchement est mesuré à l'aide de la métrique Intersection over Union (IoU ), et la suppression intervient si l'IoU dépasse un seuil prédéfini (par exemple, 0,5). Une explication détaillée de ce concept de base peut être trouvée dans des ressources telles que le guide NMS de PyImageSearch.
  4. Le processus se répète de manière itérative : la case suivante ayant obtenu le meilleur score parmi les cases restantes est sélectionnée, et les cases qui se chevauchent sont supprimées.
  5. Cette opération se poursuit jusqu'à ce que toutes les cases aient été sélectionnées comme détections finales ou supprimées.

Cela permet de ne conserver que les boîtes les plus sûres et qui ne se chevauchent pas, ce qui donne un résultat beaucoup plus propre et plus facile à interpréter, comme le montrent de nombreux tutoriels sur la vision par ordinateur.

Importance de l'IA et de l'apprentissage automatique

Dans les domaines plus larges de l'intelligence artificielle (IA) et de l'apprentissage automatique (ML), le NMS est fondamental pour obtenir des performances fiables en matière de détection d'objets. Sans NMS, la sortie d'un détecteur comme YOLO11 serait encombrée de multiples cases pour des objets uniques. Cette redondance peut entraîner des erreurs dans les applications en aval, telles que le comptage d'objets(guide de comptage d'objets), le suivi d'objets ou la compréhension de scènes complexes en robotique.

En éliminant ces détections redondantes (qui contribuent souvent aux faux positifs), le NMS améliore considérablement la précision des prédictions du modèle. Ce raffinement est essentiel pour les applications exigeant une fiabilité et une précision élevées. L'impact du NMS se reflète dans les mesures d'évaluation telles que la précision moyenne (mAP), qui sont généralement calculées après l'application du NMS, comme indiqué dans le guide des mesures de performance de YOLO.

Applications dans le monde réel

Le NMS est une technologie de base qui permet de nombreuses applications pratiques de l'IA :

Comparaison avec des techniques connexes

Le NMS est spécifiquement une étape de post-traitement appliquée après qu' un modèle de détection d'objets a généré son ensemble initial de boîtes de délimitation candidates. Il ne doit pas être confondu avec l'architecture de détection proprement dite, comme la différence entre les détecteurs basés sur les ancres et les détecteurs sans ancres. Ces architectures définissent la manière dont les boîtes potentielles sont proposées, tandis que le NMS affine ces propositions.

Il est intéressant de noter que le coût de calcul et les goulets d'étranglement potentiels associés au NMS ont stimulé la recherche sur les détecteurs d'objets sans NMS. Des modèles comme YOLOv10 intègrent des mécanismes au cours de l'apprentissage (comme des affectations doubles cohérentes) pour éviter de manière inhérente de prédire des boîtes redondantes, dans le but de réduire la latence de l'inférence et de permettre une détection véritablement de bout en bout(approche sans NMS de YOLOv10). Cela contraste avec les approches traditionnelles comme Ultralytics YOLOv8 ou YOLOv5, où le NMS reste une partie standard et essentielle du pipeline d'inférence. Vous pouvez explorer les comparaisons techniques, telles que YOLOv10 vs YOLOv8, dans notre documentation. Des variantes comme Soft-NMS(article sur Soft-NMS) offrent des approches alternatives qui diminuent les scores des boîtes qui se chevauchent au lieu de les éliminer complètement.

Intégration avec les outils Ultralytics

NMS est intégré de manière transparente dans l'écosystème Ultralytics. Les modèles YOLO d'Ultralytics appliquent automatiquement le SGN pendant la période de prédiction (predict) et validation (val) Les utilisateurs reçoivent ainsi des résultats de détection propres et précis par défaut. Les paramètres contrôlant le comportement du NMS (comme le seuil d'intégrité et le seuil de confiance) peuvent souvent être ajustés en fonction des besoins spécifiques de l'application.

Des plateformes comme Ultralytics HUB font abstraction de ces détails, permettant aux utilisateurs d'entraîner des modèles(guide d'entraînement dans le nuage) et de les déployer où le NMS est géré automatiquement dans le cadre du pipeline optimisé. Cette intégration garantit que les utilisateurs, quelle que soit leur expertise technique approfondie en matière de MLOps, peuvent bénéficier de résultats de pointe en matière de détection d'objets pour diverses tâches de vision par ordinateur. Les détails de l'implémentation spécifique dans le cadre d'Ultralytics peuvent être explorés dans la référence des utilitaires Ultralytics. Pour plus de définitions, consultez le glossaire principal d'Ultralytics.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers