Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Objekt Re-Identifizierung (Re-ID)

Erfahren Sie, wie die Objekt-Re-Identifizierung (Re-ID) Identitäten über verschiedene Kameraansichten hinweg abgleicht. Entdecken Sie, wie Sie Ultralytics und BoT-SORT für eine robuste visuelle Verfolgung einsetzen können.

Die Objekt-Reidentifizierung (Re-ID) ist eine spezielle Aufgabe im Bereich Computer Vision (CV), die darauf abzielt, ein bestimmtes Objekt oder eine bestimmte Person über verschiedene, sich nicht überlappende Kameraansichten oder über längere Zeiträume hinweg abzugleichen. Während sich die Standard-Objekterkennung Objekterkennung auf die Erkennung der Klasse eines Objekts konzentriert – also darauf, festzustellen, ob ein Bild eine „Person” oder ein „Auto” enthält –, geht die Re-ID einen Schritt weiter, indem sie anhand des Aussehens bestimmt, um welche bestimmte Person oder welches bestimmte Auto es sich handelt. Diese Fähigkeit ist unerlässlich, um eine zusammenhängende Bewegungserzählung in großflächigen Umgebungen zu erstellen, in denen eine einzelne Kamera nicht den gesamten Bereich abdecken kann, und um so die Punkte zwischen isolierten visuellen Beobachtungen effektiv miteinander zu verbinden.

Wie die Re-Identifizierung funktioniert

Die zentrale Herausforderung von Re-ID besteht darin, die Konsistenz der Identität trotz unterschiedlicher Beleuchtung, Kamerawinkel, Posen und Hintergrundunordnung aufrechtzuerhalten. Um dies zu erreichen, verwendet das System in der Regel eine mehrstufige Pipeline mit tiefen neuronalen Netzwerken.

  • Merkmalsextraktion: Sobald ein Objekt erkannt wurde, analysiert ein Convolutional Neural Network (CNN) den Bildausschnitt, um einen Merkmalsvektor zu generieren, der allgemein als Embedding bezeichnet wird. Dieser Vektor ist eine dichte numerische Darstellung der einzigartigen visuellen Merkmale des Objekts, wie beispielsweise die Textur der Kleidung oder die Farbe des Fahrzeugs.
  • Metrisches Lernen: Die zugrunde liegenden Modelle werden mithilfe von metrischen Lerntechniken trainiert. Das Ziel besteht darin, sicherzustellen, dass die Einbettungen desselben Objekts im Vektorraum mathematisch nahe beieinander liegen, während die Einbettungen verschiedener Objekte weit voneinander entfernt sind. Spezielle Architekturen wie siamesische neuronale Netze werden häufig verwendet, um diese Beziehungen zu lernen.
  • Ähnlichkeitsabgleich: Während der Bereitstellung vergleicht das System die Einbettung eines Abfrageobjekts mit einer Galerie gespeicherter Identitäten. Dieser Vergleich umfasst in der Regel die Berechnung der Kosinusähnlichkeit oder der euklidischen Distanz. Wenn der Ähnlichkeitswert einen vordefinierten Schwellenwert überschreitet, bestätigt das System eine Übereinstimmung.

Re-ID vs. Objektverfolgung

Es ist wichtig, Re-ID von der Objektverfolgung zu unterscheiden, da sie komplementäre, aber unterschiedliche Rollen in einer Bildverarbeitungskette spielen.

  • Objektverfolgung: Dieser Prozess basiert auf zeitlicher Kontinuität. Algorithmen wie der Kalman-Filter sagen die zukünftige Position eines Objekts im nächsten Bild anhand seiner aktuellen Geschwindigkeit und Flugbahn voraus. Oft wird dabei Intersection over Union (IoU) verwendet, um Erkennungen in benachbarten Bildern miteinander zu verknüpfen.
  • Re-Identifizierung: Re-ID ist entscheidend, wenn die zeitliche Kontinuität unterbrochen wird. Dies geschieht bei Okklusion – wenn ein Objekt hinter einem Hindernis verborgen ist – oder wenn ein Objekt das Sichtfeld einer Kamera verlässt und in das einer anderen eintritt. Re-ID stellt die Identität auf der Grundlage des Aussehens und nicht des Standortverlaufs wieder her und ermöglicht so eine robuste Multi-Objekt-Verfolgung (MOT).

Anwendungsfälle in der Praxis

Die Möglichkeit, die Identität über unzusammenhängende Ansichten hinweg aufrechtzuerhalten, ermöglicht anspruchsvolle Analysen in verschiedenen Branchen.

  • Intelligentes Verkehrsmanagement in Smart Cities: Im Zusammenhang mit KI in Smart Cities ermöglicht Re-ID kommunalen Systemen track Fahrzeugs, während es sich durch ein stadtweites Netz von Kreuzungen bewegt. Dies hilft bei der Berechnung der durchschnittlichen Fahrzeiten und der Optimierung der Ampelschaltungen, ohne sich ausschließlich auf die Kennzeichenerkennung zu verlassen.
  • Analyse von Einzelhandelskunden: Einzelhändler nutzen Re-ID, um das Verhalten von Käufern zu verstehen. Durch die Verknüpfung von Sichtungen eines Kunden in verschiedenen Gängen können Geschäfte Heatmaps beliebter Wege erstellen. Dies hilft bei der Optimierung der Ladengestaltung und des Personalbedarfs und liefert Einblicke in die gesamte Customer Journey und nicht nur in einzelne Interaktionen.

Implementierung von Tracking mit Re-ID-Funktionen

Moderne Vision-KI-Workflows kombinieren häufig leistungsstarke Detektoren mit Trackern, die Re-ID-Konzepte nutzen. Das YOLO26-Modell lässt sich nahtlos in Tracker wie BoT-SORT integrieren, das Erscheinungsmerkmale nutzt, um track aufrechtzuerhalten. Für Benutzer, die ihre Datensätze und Trainingspipelines effizient verwalten möchten, bietet Ultralytics eine einheitliche Schnittstelle für die Annotation und Bereitstellung.

Das folgende Beispiel zeigt, wie die Objektverfolgung mit demPython durchgeführt wird, das die Identitätspersistenz automatisch verwaltet:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Track objects in a video file
# The 'persist=True' argument is vital for maintaining IDs across frames
# BoT-SORT is a tracker that can utilize appearance features for Re-ID
results = model.track(
    source="https://www.ultralytics.com/blog/ultralytics-yolov8-for-speed-estimation-in-computer-vision-projects",
    tracker="botsort.yaml",
    persist=True,
)

# Print the unique ID assigned to the first detected object in the first frame
if results[0].boxes.id is not None:
    print(f"Tracked Object ID: {results[0].boxes.id[0].item()}")

Für eine robuste Leistung erfordert das Training dieser Modelle hochwertige Trainingsdaten. Techniken wie der Triplet-Verlust werden häufig beim Training spezifischer Re-ID-Submodule eingesetzt, um die Unterscheidungskraft der Einbettungen zu verfeinern. Das Verständnis der Nuancen von Präzision und Recall ist ebenfalls entscheidend, wenn es darum geht, zu bewerten, wie gut ein Re-ID-System falsche Übereinstimmungen vermeidet.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten