Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Ankerboxen

Erfahren Sie, wie Ankerboxen als Referenzvorlagen für die Objekterkennung dienen. Entdecken Sie, wie sie die Genauigkeit verbessern und wie Modelle wie Ultralytics ankerfreie Designs nutzen.

Ankerboxen sind vordefinierte Referenzrechtecke mit bestimmten Seitenverhältnissen und Maßstäben, die über ein Bild gelegt werden , um Objektdetektionsmodelle bei der Lokalisierung und Klassifizierung von Objekten zu unterstützen. Anstatt ein neuronales Netzwerk zu beauftragen, die genaue Größe und Position eines Objekts von Grund auf vorherzusagen – was aufgrund der großen Vielfalt an Objektformen instabil sein kann –, verwendet das Modell diese festen Vorlagen als Ausgangspunkt. Indem das System lernt, vorherzusagen, um wie viel diese anfänglichen Boxen angepasst oder „regressiert” werden müssen, um der tatsächlichen Situation zu entsprechen, kann es eine schnellere Konvergenz und höhere Genauigkeit erzielen. Diese Technik hat den Bereich der Computervision (CV) grundlegend verändert, indem sie die komplexe Aufgabe der Lokalisierung zu einem besser handhabbaren Optimierungsproblem vereinfacht hat.

Der Mechanismus von Ankerkästen

Bei klassischen ankerbasierten Detektoren wird das Eingabebild in ein Raster aus Zellen unterteilt. An jeder Zellenposition generiert das Netzwerk mehrere Ankerboxen mit unterschiedlichen Geometrien. Um beispielsweise gleichzeitig detect großen Fußgänger und ein breites Auto detect , könnte das Modell eine hohe, schmale Box und eine kurze, breite Box am gleichen Mittelpunkt vorschlagen.

Während des Modelltrainings werden diese Anker anhand einer Metrik namens Intersection over Union (IoU) mit tatsächlichen Objekten abgeglichen. Anker, die sich erheblich mit einem gekennzeichneten Objekt überschneiden, werden als „positive“ Beispiele bezeichnet. Das Netzwerk lernt dann zwei parallele Aufgaben:

  1. Klassifizierung: Der Anker erhält einen Wahrscheinlichkeitswert, der angibt, wie wahrscheinlich es ist, dass er eine bestimmte Klasse enthält (z. B. „Hund” oder „Fahrrad”). Dabei werden standardmäßige überwachte Lernziele wie Kreuzentropieverlust verwendet.
  2. Box-Regression: Berechnet die genauen Offset-Werte (Koordinatenverschiebungen und Skalierungsfaktoren), die erforderlich sind, um den generischen Anker in einen passgenauen Begrenzungsrahmen umzuwandeln.

Dieser Ansatz ermöglicht es dem Modell, mehrere Objekte unterschiedlicher Größe zu verarbeiten, die sich nahe beieinander befinden, da jedes Objekt dem Anker zugeordnet werden kann, der seiner Form am besten entspricht.

Anwendungsfälle in der Praxis

Obwohl neuere Architekturen zunehmend auf ankerfreie Designs setzen, bleiben Ankerboxen in vielen etablierten Produktionssystemen, in denen die Objekteigenschaften vorhersehbar sind, unverzichtbar.

  • Einzelhandels- und Bestandsmanagement: Bei KI-gesteuerten Einzelhandelslösungen überwachen Kameras den Lagerbestand . Da Produkte wie Müslischachteln oder Getränkedosen standardisierte Abmessungen haben, können Ankerboxen auf diese spezifischen Seitenverhältnisse abgestimmt werden. Dieses Vorwissen hilft dem Modell, auch in unübersichtlichen Umgebungen eine hohe Erinnerungsrate aufrechtzuerhalten.
  • Autonomes Fahren: Wahrnehmungsstapel in autonomen Fahrzeugen basieren auf der Erkennung von Fußgängern, Fahrzeugen und Verkehrszeichen. Da ein aus der Ferne gesehenes Auto im Vergleich zur Straße ein relativ gleichmäßiges Formprofil aufweist, gewährleistet die Verwendung von auf diese Formen zugeschnittenen Ankern eine robuste Objektverfolgung und Entfernungsschätzung.

Verankerungsbasiert vs. verankerungsfrei

Es ist wichtig, zwischen herkömmlichen ankerbasierten Methoden und modernen ankerfreien Detektoren zu unterscheiden.

  • Ankerbasiert: Modelle wie das ursprüngliche Faster R-CNN oder frühe YOLO (z. B. YOLOv5) verwenden diese vordefinierten Vorlagen. Sie sind robust, erfordern jedoch häufig eine manuelle Anpassung der Hyperparameter (Ankergrößen/Verhältnisse) oder Clustering-Algorithmen wie k-Means-Clustering, um sich an neue Datensätze anzupassen.
  • Ankerfrei: Fortgeschrittene Modelle, darunter YOLO26, verwenden häufig ankerfreie oder End-to-End-Ansätze. Diese Netzwerke sagen Objektzentren oder Schlüsselpunkte direkt voraus, wodurch die manuelle Ankerkonfiguration entfällt. Dies vereinfacht die Architektur und beschleunigt die Inferenz, indem die Berechnung entfällt, die zur Verarbeitung Tausender leerer Hintergrundanker erforderlich ist.

Beispiel: Zugriff auf Ankerinformationen

Während moderne High-Level-APIs wie die Ultralytics diese Details während des Trainings abstrahieren, ist das Verständnis von Ankern nützlich, wenn Sie mit älteren Modellarchitekturen arbeiten oder Modellkonfigurationsdateien analysieren. Der folgende Ausschnitt zeigt, wie Sie ein Modell laden und dessen Konfiguration überprüfen können, wo Anker-Einstellungen (falls vorhanden) normalerweise definiert werden.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO26 is anchor-free, but legacy configs act similarly)
model = YOLO("yolo26n.pt")

# Inspect the model's stride, which relates to grid cell sizing in detection
print(f"Model strides: {model.model.stride}")

# For older anchor-based models, anchors might be stored in the model's attributes
# Modern anchor-free models calculate targets dynamically without fixed boxes
if hasattr(model.model, "anchors"):
    print(f"Anchors: {model.model.anchors}")
else:
    print("This model architecture is anchor-free.")

Herausforderungen und Überlegungen

Ankerboxen sind zwar effektiv, führen jedoch zu Komplexität. Die große Anzahl der generierten Anker – oft Zehntausende pro Bild – verursacht ein Problem der Klassenungleichheit, da die meisten Anker nur den Hintergrund abdecken. Techniken wie Focal Loss werden eingesetzt, um dies durch eine geringere Gewichtung einfacher Hintergrundbeispiele zu mildern. Darüber hinaus erfordert die endgültige Ausgabe in der Regel eine Non-Maximum Suppression (NMS), um redundante, sich überlappende Boxen herauszufiltern und sicherzustellen, dass nur die sicherste Erkennung für jedes Objekt übrig bleibt.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten