Glossar

Nicht-Maximum-UnterdrückungNMS)

Entdecken Sie Non-Maximum SuppressionNMS) für die Objekterkennung. Erfahren Sie, wie es die Ergebnisse verfeinert, die Genauigkeit erhöht und KI-Anwendungen wie YOLO unterstützt.

Non-Maximum SuppressionNMS) ist eine wichtige Nachbearbeitungstechnik, die in der Computer Vision zur Verfeinerung der Ergebnisse von Objekterkennungsalgorithmen zu verfeinern. Wenn ein Modell ein Bild analysiert ein Bild analysiert, sagt es häufig mehrere überlappende Bounding Boxes für ein einzelnes Objekt, jedes mit einer bestimmten Wahrscheinlichkeit. NMS filtert diese redundanten Vorhersagen, um sicherzustellen, dass jedes einzigartige Objekt genau einmal identifiziert wird. identifiziert wird, wobei nur die genaueste Box beibehalten und der Rest verworfen wird. Dieser Prozess ist entscheidend für eine hohe Präzision in realen Anwendungen und verhindert, dass Systeme verhindern, dass Systeme "Geister"-Duplikate desselben Ziels erkennen.

Mechanismen der Unterdrückung

Der NMS funktioniert wie ein Filter, der die Rohausgabe eines Deep-Learning-Modells bereinigt. Er stützt sich stark auf zwei Schlüssel Metriken: dem Konfidenzwert, der angibt, wie sicher wie sicher das Modell ist, dass eine Box ein Objekt enthält, und die Intersection over Union (IoU), die die die räumliche Überlappung zwischen zwei Boxen misst.

Der Standard-Greedy-Algorithmus für NMS folgt im Allgemeinen diese Schritte:

Schwellenwertbildung: Alle Kandidatenboxen mit einem Konfidenzwert unter einem bestimmten Schwellenwert werden sofort verworfen, um schwache Vorhersagen zu entfernen.
Sortieren: Die verbleibenden Kästchen werden in absteigender Reihenfolge auf der Grundlage ihrer Vertrauenswerte sortiert.
Auswahl: Das Kästchen mit der höchsten Punktzahl wird als gültiger Nachweis ausgewählt.
Unterdrückung: Der Algorithmus vergleicht das ausgewählte Feld mit allen anderen verbleibenden Feldern. Wenn der IoU zwischen dem ausgewählten Kästchen und einem anderen Kästchen einen bestimmten Grenzwert (z. B. 0,5) überschreitet, wird das Kästchen mit dem niedrigeren Wert unterdrückt (gelöscht), da davon ausgegangen wird, dass es das gleiche Objekt darstellt.
Iteration: Dieser Vorgang wird für das nächste Feld mit der höchsten Punktzahl wiederholt, bis alle Kandidaten bearbeitet wurden.

Fortgeschrittene Varianten, wie NMS, verringern die Erkennungsergebnisse von überlappenden Boxen ab, anstatt sie ganz zu eliminieren, was in belebten Szenen, in denen sich die Objekte gegenseitig verdecken, von Vorteil sein kann. sich gegenseitig verdecken.

Anwendungsfälle in der Praxis

NMS ist allgegenwärtig in Systemen, die sich auf künstliche Intelligenz zur Interpretation visueller Daten angewiesen sind. Seine Rolle ist besonders wichtig in sicherheitskritischen und hochpräzisen Umgebungen.

KI in der Automobilindustrie: In den Wahrnehmungsstacks von selbstfahrenden Autos ist die genaue Erkennung von anderen Fahrzeugen und Fußgängern nicht verhandelbar. Ohne NMS könnte ein Fahrzeugwahrnehmungssystem einen einzigen Fußgänger aufgrund von überlappenden Vorhersagen als drei oder vier verschiedene Personen detect . überlappenden Vorhersagen. Dies könnte die Algorithmen zur Bewegungsplanung verwirren, was zu fehlerhaftem Bremsen oder Lenkung. NMS sorgt für eine saubere, eindeutige Darstellung von Hindernissen, wie sie in Technologien wie NVIDIA DRIVE.
Medizinische Bildanalyse: Bei der Verwendung von KI zur Identifizierung von Tumoren oder Läsionen in Röntgenbildern und MRT-Scans ist Präzision das A und O. KI in Gesundheitssystemen nutzt NMS , um sicherzustellen, dass dass eine einzige Anomalie nicht mehrere Alarme auslöst, damit sich Radiologen auf bestimmte Befunde konzentrieren können. Zuverlässige Erkennung reduziert falsch-positive Ergebnisse und rationalisiert den diagnostischen Arbeitsablauf, der in der Forschung zur medizinischen Bildgebung.

NMS in Ultralytics YOLO

In der Ultralytics YOLO11 Rahmenwerk ist NMS direkt in die direkt in die Vorhersage-Pipeline integriert. Die Benutzer können NMS wie den IoU leicht anpassen, um ein Gleichgewicht zwischen zwischen dem Entfernen von Duplikaten und dem Trennen eng beieinander liegender Objekte.

Das folgende Codeschnipsel zeigt, wie die Inferenz ausgeführt und die NMS mithilfe der ultralytics Paket:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
# 'iou=0.5' sets the NMS threshold; boxes with >50% overlap are suppressed
# 'conf=0.25' filters out boxes with low confidence before NMS runs
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Display the number of detected objects after NMS
print(f"Objects detected: {len(results[0].boxes)}")

Vergleich mit verwandten Konzepten

Es ist wichtig, NMS von anderen Begriffen zu unterscheiden, die in Detektionspipelines vorkommen.

NMS vs. Ankerkästen: Verankerungen sind vordefinierte Formen, die während der Verarbeitung des Modells als Startpunkte für Vorhersagen verwendet werden. NMS ist ein Nachbearbeitungsschritt, der erfolgt, nachdem das Modell seine endgültigen Vorhersagen ausgegeben hat.
NMS vs. Vertrauensschwelle: A Konfidenzschwelle filtert Boxen ausschließlich auf der Grundlage ihrer individuellen Wahrscheinlichkeitswerte. NMS filtert Boxen auf der Grundlage ihrer Beziehung (Überschneidung) mit anderen Boxen.
NMS vs. End-to-End-Detektion: Traditionelle NMS fügt Latenzzeit, da es sich um einen sequentiellen Prozess ist. Zukünftige Architekturen, wie YOLO26, gehen bewegen sich in Richtung nativer Ende-zu-Ende-Designs. Diese Modelle zielen darauf ab, den endgültigen Satz eindeutiger Objekte direkt aus dem neuronalen Netz auszugeben. aus dem neuronalen Netz auszugeben, wodurch externe NMS in künftigen Generationen von Modellen für maschinelles Lernen.

Für Entwickler, die diese Modelle effizient einsetzen wollen, ist das Verständnis der Auswirkungen von NMS auf Echtzeit-Inferenz entscheidend. Tools wie TensorRT enthalten oft optimierte NMS , um diesen Schritt Schritt während der Modellbereitstellung zu beschleunigen.

Nicht-Maximum-UnterdrückungNMS)

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Mechanismen der Unterdrückung

Anwendungsfälle in der Praxis

NMS in Ultralytics YOLO

Vergleich mit verwandten Konzepten

Mehr in dieser Kategorie lesen

Verstehen, warum Annotationen durch Menschen entscheidend sind

Was ist Datensatzdestillation? Ein kurzer Überblick

Die Oakley Meta AI-Brille definiert mit Vision AI die Welt der Brillen neu.

Werden Sie Mitglied der Ultralytics