Découvrez la suppression non maximale (NMS) pour la détection d'objets. Apprenez comment elle affine les résultats, améliore la précision et alimente des applications d'IA telles que YOLO.
La suppression non maximale (NMS) est une technique de post-traitement cruciale largement utilisée dans le domaine de la vision artificielle (CV), en particulier dans les pipelines de détection d'objets. Son rôle principal est d'affiner les résultats bruts générés par les modèles de détection, qui identifient souvent plusieurs boîtes de délimitation se chevauchant pour la même instance d'objet. En filtrant intelligemment ces boîtes redondantes, NMS garantit que chaque objet distinct d'une image ou d'une séquence vidéo est représenté par une seule boîte englobante optimale. Cela améliore considérablement la clarté et la précision des résultats de détection finaux, les rendant plus utiles pour les tâches ultérieures.
Dans les domaines plus larges de l'intelligence artificielle (IA) et de l'apprentissage automatique (ML), le NMS est fondamental pour obtenir des performances fiables en matière de détection d'objets. Sans NMS, la sortie d'un détecteur comme YOLO11 serait encombrée de multiples cases pour des objets uniques. Cette redondance peut entraîner des erreurs dans les applications en aval, telles que le comptage d'objets(guide de comptage d'objets), le suivi d'objets ou la compréhension de scènes complexes en robotique.
En éliminant ces détections redondantes (qui contribuent souvent aux faux positifs), le NMS améliore considérablement la précision des prédictions du modèle. Ce raffinement est essentiel pour les applications exigeant une fiabilité et une précision élevées. L'impact du NMS se reflète dans les mesures d'évaluation telles que la précision moyenne (mAP), qui sont généralement calculées après l'application du NMS, comme indiqué dans le guide des mesures de performance de YOLO.
Le NMS est une technologie de base qui permet de nombreuses applications pratiques de l'IA :
Le NMS est spécifiquement une étape de post-traitement appliquée après qu' un modèle de détection d'objets a généré son ensemble initial de boîtes de délimitation candidates. Il ne doit pas être confondu avec l'architecture de détection proprement dite, comme la différence entre les détecteurs basés sur les ancres et les détecteurs sans ancres. Ces architectures définissent la manière dont les boîtes potentielles sont proposées, tandis que le NMS affine ces propositions.
Il est intéressant de noter que le coût de calcul et les goulets d'étranglement potentiels associés au NMS ont stimulé la recherche sur les détecteurs d'objets sans NMS. Des modèles comme YOLOv10 intègrent des mécanismes au cours de l'apprentissage (comme des affectations doubles cohérentes) pour éviter de manière inhérente de prédire des boîtes redondantes, dans le but de réduire la latence de l'inférence et de permettre une détection véritablement de bout en bout(approche sans NMS de YOLOv10). Cela contraste avec les approches traditionnelles comme Ultralytics YOLOv8 ou YOLOv5, où le NMS reste une partie standard et essentielle du pipeline d'inférence. Vous pouvez explorer les comparaisons techniques, telles que YOLOv10 vs YOLOv8, dans notre documentation. Des variantes comme Soft-NMS(article sur Soft-NMS) offrent des approches alternatives qui diminuent les scores des boîtes qui se chevauchent au lieu de les éliminer complètement.
NMS est intégré de manière transparente dans l'écosystème Ultralytics. Les modèles YOLO d'Ultralytics appliquent automatiquement le SGN pendant la période de prédiction (predict
) et validation (val
) Les utilisateurs reçoivent ainsi des résultats de détection propres et précis par défaut. Les paramètres contrôlant le comportement du NMS (comme le seuil d'intégrité et le seuil de confiance) peuvent souvent être ajustés en fonction des besoins spécifiques de l'application.
Des plateformes comme Ultralytics HUB font abstraction de ces détails, permettant aux utilisateurs d'entraîner des modèles(guide d'entraînement dans le nuage) et de les déployer où le NMS est géré automatiquement dans le cadre du pipeline optimisé. Cette intégration garantit que les utilisateurs, quelle que soit leur expertise technique approfondie en matière de MLOps, peuvent bénéficier de résultats de pointe en matière de détection d'objets pour diverses tâches de vision par ordinateur. Les détails de l'implémentation spécifique dans le cadre d'Ultralytics peuvent être explorés dans la référence des utilitaires Ultralytics. Pour plus de définitions, consultez le glossaire principal d'Ultralytics.
Comment fonctionne la suppression non maximale
Les modèles de détection d'objets, tels que les différentes versions d'Ultralytics YOLO, analysent généralement une image et proposent de nombreuses boîtes de délimitation potentielles autour des objets détectés. Chaque boîte proposée est assortie d'un score de confiance, indiquant la certitude du modèle que la boîte contient un objet et appartient à une classe spécifique. Le NMS réduit systématiquement ces propositions en fonction de leur score de confiance et de leur chevauchement spatial.
Le processus suit généralement les étapes suivantes :
Cela permet de ne conserver que les boîtes les plus sûres et qui ne se chevauchent pas, ce qui donne un résultat beaucoup plus propre et plus facile à interpréter, comme le montrent de nombreux tutoriels sur la vision par ordinateur.