Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Non-Maximum Suppression (NMS)

Entdecken Sie Non-Maximum Suppression (NMS) für die Objekterkennung. Erfahren Sie, wie sie Ergebnisse verfeinert, die Genauigkeit verbessert und KI-Anwendungen wie YOLO unterstützt.

Non-Maximum Suppression (NMS) ist ein grundlegender Post-Processing-Algorithmus, der im Bereich Computer Vision, insbesondere bei Objekterkennungsaufgaben, eingesetzt wird. Sein Hauptzweck ist es, die Ausgabe eines Erkennungsmodells zu bereinigen, indem redundante und überlappende Bounding Boxes herausgefiltert werden, um sicherzustellen, dass jedes Objekt nur einmal identifiziert wird. Wenn ein Objekterkennungsmodell, wie z. B. Ultralytics YOLO, Vorhersagen trifft, generiert es oft mehrere Kandidaten-Boxen um dasselbe Objekt, jede mit einer anderen Konfidenzbewertung. NMS wählt auf intelligente Weise die beste Bounding Box für jedes Objekt aus und unterdrückt oder eliminiert alle anderen überlappenden Boxen, die als nicht-maximal angesehen werden.

Wie Non-Maximum Suppression funktioniert

Der NMS-Algorithmus arbeitet, indem er die vorhergesagten Bounding Boxes durchläuft und Entscheidungen auf der Grundlage von zwei Schlüsselmetriken trifft: Konfidenzwerte und den Intersection over Union (IoU)-Schwellenwert. Der Prozess lässt sich in folgenden Schritten zusammenfassen:

  1. Sortieren nach Konfidenz: Alle vorhergesagten Begrenzungsrahmen werden zuerst in absteigender Reihenfolge basierend auf ihren Konfidenzwerten sortiert. Der Rahmen mit dem höchsten Wert wird als der wahrscheinlichste betrachtet, korrekt zu sein.
  2. Wählen Sie die beste Box aus: Die Bounding Box mit der höchsten Konfidenzbewertung wird ausgewählt, und alle anderen Boxen, die eine hohe IoU mit dieser ausgewählten Box haben (d. h. sie überlappen sich erheblich), werden aus der Liste entfernt.
  3. Wiederholung: Der Prozess wird mit den verbleibenden Begrenzungsrahmen wiederholt, bis alle Rahmen entweder ausgewählt oder unterdrückt wurden.

Der IoU-Schwellenwert ist ein kritischer, benutzerdefinierter Hyperparameter. Ein niedriger IoU-Schwellenwert führt zu weniger Erkennungen, da er Boxen unterdrückt, die auch nur eine geringe Überlappung aufweisen, während ein hoher Schwellenwert möglicherweise mehrere Erkennungen für dasselbe Objekt zulässt. Die Feinabstimmung dieses Schwellenwerts ist oft Teil der Optimierung der Leistung eines Modells auf einem bestimmten Datensatz.

Anwendungen von Non-Maximum Suppression

NMS ist eine entscheidende Komponente in vielen realen KI-Anwendungen, die auf einer genauen Objekterkennung basieren.

  • Autonome Fahrzeuge: In selbstfahrenden Autos müssen Objekterkennungssysteme Fußgänger, Radfahrer und andere Fahrzeuge anhand verschiedener Kamera- und LiDAR-Eingaben genau identifizieren. NMS stellt sicher, dass ein einzelner Fußgänger nicht als mehrere Personen erkannt wird, wodurch eine saubere Eingabe für die Pfadplanungs- und Entscheidungssysteme des Autos bereitgestellt wird. Dies verhindert ein unregelmäßiges Verhalten wie unnötiges Bremsen, das durch redundante Erkennungen verursacht wird. Weitere Details finden Sie in der Forschung zur 3D-Objekterkennung für autonomes Fahren.
  • Medizinische Bildgebung: In der medizinischen Bildanalyse wird NMS verwendet, um die Erkennung von Anomalien wie Tumoren oder Läsionen in CT- oder MRT-Scans zu verfeinern. Wenn beispielsweise ein Modell wie YOLO11 zur Erkennung von Tumoren verwendet wird, hilft NMS sicherzustellen, dass ein einzelner Tumor mit einem Bounding Box genau lokalisiert wird, wodurch die Genauigkeit von Diagnosen und Behandlungsplanung verbessert wird, wie in der medizinischen Bildgebungsforschung untersucht wurde.

Vergleich mit verwandten Techniken

NMS ist spezifisch ein Post-Processing-Schritt, der nachdem ein Objekterkennungsmodell seinen ersten Satz von Kandidaten-Bounding-Boxes generiert hat, angewendet wird. Es sollte nicht mit der Erkennungsarchitektur selbst verwechselt werden, wie z. B. dem Unterschied zwischen ankerbasierten Detektoren und ankerfreien Detektoren. Diese Architekturen definieren, wie potenzielle Boxen vorgeschlagen werden, während NMS diese Vorschläge verfeinert.

Interessanterweise haben die Rechenkosten und potenziellen Engpässe, die mit NMS verbunden sind, die Forschung an NMS-freien Objektdetektoren angeregt. Modelle wie YOLOv10 integrieren während des Trainings Mechanismen, um von Natur aus die Vorhersage redundanter Boxen zu vermeiden, mit dem Ziel, die Inferenzlatenz zu reduzieren und eine echte End-to-End-Erkennung zu ermöglichen. Dies steht im Gegensatz zu traditionellen Ansätzen wie Ultralytics YOLOv8 oder YOLOv5, bei denen NMS ein Standard- und wesentlicher Bestandteil der Inferenz-Pipeline bleibt. Sie können technische Vergleiche, wie z. B. YOLOv10 vs. YOLOv8, in unserer Dokumentation einsehen. Varianten wie Soft-NMS bieten alternative Ansätze, die die Scores überlappender Boxen verringern, anstatt sie vollständig zu eliminieren.

Integration mit Ultralytics-Tools

NMS ist nahtlos in das Ultralytics-Ökosystem integriert. Ultralytics YOLO-Modelle wenden NMS automatisch während der Vorhersage (predict) und Validierung (val) Modi an, um sicherzustellen, dass Benutzer standardmäßig saubere und genaue Erkennungsergebnisse erhalten. Die Parameter, die das NMS-Verhalten steuern (wie der IoU-Schwellenwert und der Konfidenzschwellenwert), können oft für spezifische Anwendungsbedürfnisse angepasst werden.

Plattformen wie Ultralytics HUB abstrahieren diese Details weiter und ermöglichen es Benutzern, Modelle zu trainieren und bereitzustellen, wobei NMS automatisch als Teil der optimierten Pipeline behandelt wird. Diese Integration stellt sicher, dass Benutzer, unabhängig von ihrer tiefgreifenden technischen Expertise in MLOps, von modernsten Objekterkennungsergebnissen für verschiedene Computer-Vision-Aufgaben profitieren können. Die spezifischen Implementierungsdetails innerhalb des Ultralytics-Frameworks können in der Ultralytics-Utilities-Referenz erkundet werden. Weitere Definitionen finden Sie im Haupt-Ultralytics-Glossar.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert