Verbesserung von Computer Vision Anwendungen

Jede Minute werden riesige Datenmengen erzeugt, von Flughafenterminals und Bahnhöfen bis hin zu Einkaufszentren. Da KI immer häufiger eingesetzt wird, werden viele dieser Daten jetzt analysiert und aufgeschlüsselt. Aber manchmal können die Ergebnisse dieser KI-Modelle es erschweren, Muster zu erkennen oder Trends auf einen Blick zu verstehen. Hier hilft die Datenvisualisierung - sie verwandelt komplexe Ausgaben in klare, leicht verständliche Erkenntnisse.

Dies gilt insbesondere für Anwendungen der Computer Vision. Computervision ist ein Teilgebiet der künstlichen Intelligenz (KI), das Maschinen hilft, visuelle Informationen aus der Umgebung, wie Bilder und Videos, zu interpretieren und zu verstehen. Während Vision AI-Modelle, wie Ultralytics YOLO11bei der Analyse solcher visuellen Daten helfen können, um Informationen zu gewinnen, hilft die Datenvisualisierung dabei, diese Informationen in ein leicht verständliches Format zu bringen.

Einfach ausgedrückt, die Datenvisualisierung schlägt eine Brücke zwischen Rohdaten und echtem Verständnis, indem sie aussagekräftige analytische Diagramme verwendet. In der heutigen datengesteuerten Welt ist dies von entscheidender Bedeutung, denn es reicht nicht aus, dass Maschinen nur Aufgaben ausführen - wir müssen sie dazu bringen, eine Geschichte zu erzählen.

Dieser Bedarf an Geschichten ist genau der Grund, warum die Datenvisualisierung auf dem Vormarsch ist und der Markt bis 2030 ein Volumen von 18,36 Milliarden Dollar erreichen wird. Zuvor haben wir uns damit beschäftigt, wie Computer Vision wertvolle Geschäftseinblicke liefern kann. Heute gehen wir noch einen Schritt weiter und zeigen Ihnen, wie Sie mit dem Ultralytics klare, aufschlussreiche Analysegrafiken für Computer-Vision-Anwendungen erstellen können. Fangen wir an!

Abb. 1. Ein Beispiel für die Visualisierung von Daten auf der Grundlage der Ergebnisse von YOLO11.

‍

Ein Überblick über die Datenvisualisierung in Anwendungen der Computer Vision

Die Datenvisualisierung in Anwendungen der Computer Vision umfasst die Umwandlung der Ergebnisse von Computer-Vision-Aufgaben, wie Objekterkennung und -verfolgung, in leicht verständliche Diagramme oder Dashboards. Diese Visualisierungen helfen, Muster und Trends zu erkennen, insbesondere bei der Arbeit mit großen Mengen an Videomaterial.

Anstatt beispielsweise stundenlang Überwachungsvideos manuell zu überprüfen, kann ein einfaches Liniendiagramm, das die Anzahl der erkannten Autos oder Personen im Zeitverlauf darstellt, schnell Spitzenzeiten oder ungewöhnlich ruhige Perioden hervorheben.

Hier sind einige Hauptgründe, warum Datenvisualisierung nützlich ist:

Vereinfacht komplexe Daten: Tausende von Objekterkennungen können überwältigend sein, aber Visualisierungen wie Balken- oder Kreisdiagramme erleichtern es, das Gesamtbild zu erkennen, z. B. welche Objekte am häufigsten vorkommen.

Deckt Trends auf: Linien- und Balkendiagramme helfen, Muster im Zeitverlauf zu erkennen, z. B. wann und wo der Fußgängerverkehr tendenziell zunimmt.

Spart Zeit: Anstatt jedes einzelne Videoframe zu überprüfen, können Diagramme schnell wichtige Details hervorheben, wie z. B. plötzliche Spitzen bei der Fahrzeugaktivität oder ungewöhnliche Objektdarstellungen in Sperrzonen.

Verbessert die Kommunikation: Visualisierungen erleichtern es, Erkenntnisse mit nicht-technischen Zielgruppen zu teilen, sodass jeder die Ergebnisse klarer verstehen kann.

Verschiedene Arten von Datenvisualisierungen

Verschiedene Arten von analytischen Diagrammen können Computer-Vision-Ergebnisse in klare, leicht verständliche Visualisierungen verwandeln. Nehmen wir an, Sie arbeiten an einer Computer-Vision-Anwendung, die Personen und Fahrzeuge in Überwachungsvideos erkennt. In diesem Fall eignet sich ein Liniendiagramm hervorragend, um zu zeigen, wie sich die Anzahl der Erkennungen im Laufe der Zeit verändert, z. B. um Spitzen im Fußgängerverkehr im Laufe des Tages zu verfolgen.

In ähnlicher Weise sind Balkendiagramme hilfreich, wenn Sie die Anzahl der verschiedenen erkannten Objekttypen vergleichen möchten, z. B. um zu sehen, ob mehr Autos, Fahrräder oder Fußgänger im Video vorkommen. Kreisdiagramme hingegen zeigen, welchen Prozentsatz jeder Objekttyp an den gesamten Erkennungen ausmacht. Jedes Diagramm hat seinen eigenen Nutzen und hilft, komplexe Computer-Vision-Daten leichter zu interpretieren und zu teilen.

Abb. 2. Beispiele für analytische Diagramme.

‍

Generieren von analytischen Diagrammen, um Einblicke in die Computer Vision zu erhalten

Nachdem wir nun untersucht haben, was Datenvisualisierung ist und warum verschiedene Arten von analytischen Diagrammen wichtig sind, wollen wir uns genauer ansehen, wie Sie die Ultralytics Analytics-Lösung verwenden können, um die Ergebnisse Ihrer Computer Vision-Modellvorhersagen zu visualisieren. Bevor wir den Prozess Schritt für Schritt durchgehen, werfen wir einen Blick auf die Tools und Einrichtungsoptionen für das Training und die Verwendung des Ultralytics und Modelle wie YOLO11.

Das Ultralytics Python erleichtert das Trainieren von Modellen, die detect Objekten, die Durchführung von Vorhersagen und die Visualisierung der Ergebnisse. Um damit zu beginnen, benötigen Sie eine Programmierumgebung. Hier sind drei einfache Optionen:

Befehlszeilenschnittstelle (CLI): Es handelt sich um ein einfaches, rein textbasiertes Werkzeug, in das Sie Befehle eingeben können, um Ihren Code auszuführen. Es hat keine visuelle Schnittstelle, und Sie interagieren mit ihm, indem Sie Anweisungen in ein Terminal oder eine Eingabeaufforderung eingeben.

Jupyter Notebooks: Es ist eine interaktive Programmierumgebung, in der Sie kleine Codeblöcke (sogenannte "Zellen") einzeln schreiben, ausführen und testen können. Es zeigt die Ergebnisse direkt unter jeder Zelle an, sodass Sie leicht verstehen können, was Schritt für Schritt passiert. Es ist besonders nützlich zum Lernen und Experimentieren.

Google Colab: Diese Option ist eine kostenlose, cloudbasierte Version von Jupyter Notebooks, die in Ihrem Webbrowser läuft. Es erfordert keine Einrichtung auf Ihrem Computer und bietet Ihnen Zugang zu kostenlosen GPUs für eine schnellere Verarbeitung.

Diese Tools eignen sich hervorragend für den schnellen Einstieg, aber Benutzer können Ultralytics auch in integrierte Entwicklungsumgebungen (IDEs) wie Visual Studio Code (VS Code) oder in Produktionspipelines integrieren. Weitere Optionen finden Sie in der offiziellen Ultralytics .

Schritt 1: Einrichten der Umgebung

Sobald Sie Ihre bevorzugte Umgebung ausgewählt haben, besteht der nächste Schritt darin, sie für die Ausführung von Vorhersagen und die Visualisierung der Ergebnisse einzurichten. Sie können jede der oben genannten Umgebungen verwenden, je nachdem, womit Sie sich am wohlsten fühlen.

Wenn Sie in Google Colab arbeiten, denken Sie daran, dass es standardmäßig eine CPU verwendet, was die Leistung verlangsamen kann. Um die Dinge zu beschleunigen, wechseln Sie zu einem GPU , indem Sie im Menü "Laufzeit" die Option "Laufzeittyp ändern" auswählen und den Hardware-Beschleuniger auf GPU (idealerweise einen T4) einstellen.

Um Ihre Umgebung vorzubereiten, müssen Sie das Python mit dem unten genannten Befehl installieren. In notebookbasierten Tools wie Colab oder Jupyter müssen Sie dem Befehl ein Ausrufezeichen (!) voranstellen.

pip install ultralytics

Schritt 2: Herunterladen einer Videodatei

Als Nächstes brauchen wir ein Video, mit dem wir arbeiten können. Sie können es einfach von einer kostenlosen Website wie Pexels herunterladen. Achten Sie darauf, ein Video zu wählen, das Objekte enthält, die YOLO11 detect kann. Da das Modell mit dem COCO trainiert wurde, kann es gängige Objekte wie Menschen, Autos und Fahrräder erkennen.

Für dieses Tutorial verwenden wir ein Video von der Gepäckabfertigung in einem belebten Flughafenterminal. Sie können dasselbe Video verwenden oder ein anderes auswählen, das zu Ihrem Projekt passt.

Abb. 3. Ein Frame aus dem Eingangsvideo, das die Gepäckabfertigung in einem Flughafenterminal zeigt.

‍

Schritt 3: Importieren von Paketen

Als Nächstes können wir die notwendigen Bibliotheken importieren und das Eingangsvideo laden.

Wir beginnen mit dem Import von OpenCV (cv2), einer weit verbreiteten Bibliothek für die Arbeit mit Bildern und Videos in der Computer Vision. Außerdem importieren wir die Ultralytics , die uns bei der Objekterkennung und der Erstellung von Analysen aus dem Video hilft.

Dann versuchen wir, die Videodatei zu öffnen, indem wir ihren Pfad angeben. Achten Sie darauf, "path/to/video.mp4" durch den tatsächlichen Speicherort Ihrer heruntergeladenen Videodatei zu ersetzen.

Außerdem enthält der folgende Code-Schnipsel eine einfache Überprüfung, um sicherzustellen, dass das Video korrekt geladen wird. Wenn der Pfad falsch ist oder die Datei beschädigt ist, stoppt das Programm und zeigt eine Fehlermeldung an: "Fehler beim Lesen der Videodatei."

import cv2

from ultralytics import solutions

cap = cv2.VideoCapture("path/to/video.mp4")
assert cap.isOpened(), "Error reading video file"

Schritt 4: Vorbereiten des Video-Writers

Dann richten wir einen Video-Writer ein, um die Ausgabe zu speichern. Wenn wir die Analysen ausführen, erstellt dieser Teil des Codes eine neue Videodatei, die die aktualisierten Diagramme aufzeichnet, die aus jedem Frame des Originalvideos generiert werden.

Im folgenden Code-Schnipsel extrahieren wir zunächst wichtige Eigenschaften aus dem Eingangsvideo – seine Breite, Höhe und Frames pro Sekunde (fps). Diese Werte werden direkt aus dem Video entnommen und in ganze Zahlen umgewandelt, um sicherzustellen, dass sie im richtigen Format für das Schreiben der Ausgabe vorliegen.

Als Nächstes verwenden wir die Funktion cv2.VideoWriter, um eine neue Videodatei mit dem Namen "analytics_output.avi" zu erstellen (Sie können sie bei Bedarf umbenennen). Das Video wird im MJPG-Format gespeichert, einer gängigen Videokomprimierungsmethode. Die Ausgaberauflösung ist auf 1280×720 Pixel eingestellt, unabhängig von der Größe des Originalvideos.

w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))
out = cv2.VideoWriter(
    "analytics_output.avi",
    cv2.VideoWriter_fourcc(*"MJPG"),
    fps,
    (1280, 720), 
)

Schritt 5: Einrichten der Ultralytics Analytics-Lösung

Nun werden wir die Ultralytics Analytics-Lösung so einrichten, dass sie aus dem Video Diagramme erstellt. Sie können wählen, wie die Daten angezeigt werden sollen, z. B. als Linien-, Torten-, Flächen- oder Balkendiagramm, und welches YOLO verwendet werden soll. In diesem Beispiel verwenden wir das leichtgewichtige Modell "yolo11n.pt" und zeigen die Ergebnisse als Flächendiagramm an.

analytics = solutions.Analytics(
    show=True, 
    analytics_type="area", 
    model="yolo11n.pt",   
)

Schritt 6: Verarbeiten des Eingangsvideos

Der letzte Teil des Codes führt eine Schleife aus, die das Video Frame für Frame verarbeitet. Jeder Frame wird an das Analysetool übergeben, das das Diagramm in Echtzeit aktualisiert. Das aktualisierte Diagramm wird dann in das Ausgabevideo geschrieben. Wenn ein Frame nicht gelesen werden kann, stoppt die Schleife. Nachdem alle Frames verarbeitet wurden, wird das Video gespeichert und alle offenen Fenster werden geschlossen.

frame_count = 0
while cap.isOpened():
    success, im0 = cap.read()
    if success:
        frame_count += 1
        results = analytics(im0, frame_count) 

        out.write(results.plot_im) 
    else:
        break
cap.release()
out.release()
cv2.destroyAllWindows()

Schritt 7: Alles zusammenfügen

Zum Schluss wollen wir alles zusammenfügen. Mit nur wenigen zusätzlichen Codezeilen können wir zwei Ausgabevideos erzeugen: eines mit denYOLO11-Objekterkennungsergebnissen mit Begrenzungsrahmen und Beschriftungen und ein weiteres mit den Echtzeit-Analysegraphen.

Dazu richten wir zwei VideoWriter-Instanzen ein – eine zum Speichern des Vorhersagevideos und eine weitere für die Analysen. Diese Version des Codes beinhaltet sowohl Objekterkennung als auch Diagrammerstellung, sodass Sie Erkennungsergebnisse zusammen mit den visuellen Erkenntnissen sehen können.

Hier ist der umfassende Code zusammen mit Beispielen für sowohl die Vorhersage- als auch die Analyseausgaben.

import cv2
from ultralytics import YOLO, solutions

# Load model and video
model = YOLO('yolo11n.pt')
cap = cv2.VideoCapture('path/to/video.mp4')
assert cap.isOpened(), "Error opening video"

# Get properties
w, h = int(cap.get(3)), int(cap.get(4))
fps = cap.get(5)
analytics_res = (1280, 720)

# Writers for prediction and analytics videos
out_pred = cv2.VideoWriter('output_predictions.avi', cv2.VideoWriter_fourcc(*'MJPG'), fps, (w, h))
out_ana = cv2.VideoWriter('output_analytics.avi', cv2.VideoWriter_fourcc(*'MJPG'), fps, analytics_res)

# Analytics setup
analytics = solutions.Analytics(show=True, analytics_type="area", model='yolo11n.pt')

# Process frames
frame_count = 0
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    frame_count += 1
    pred_frame = model.track(frame, persist=True)[0].plot()
    out_pred.write(pred_frame)

    resized = cv2.resize(pred_frame, analytics_res)
    out_ana.write(analytics(resized, frame_count).plot_im)

cap.release(), out_pred.release(), out_ana.release(), cv2.destroyAllWindows()

Wenn der obige Code erfolgreich ausgeführt wird, werden zwei Ausgabevideos generiert. Die Datei "output_predictions.avi" zeigt die Objekterkennungsergebnisse mit Begrenzungsrahmen und Beschriftungen, während "output_analytics.avi" die Echtzeit-Analyse-Diagramme basierend auf den Erkennungen anzeigt.

Abb. 4. Ein Frame aus der Datei "output_predictions.avi".

‍

Hier ist ein Frame aus der Analyseausgabe basierend auf den Vorhersagen. Mithilfe des Flächendiagramms können wir Einblicke gewinnen, wie z. B. Schwankungen der Kofferanzahl im Zeitverlauf, wie z. B. ein Anstieg um Frame 268 herum, der auf Kofferbewegung oder -aktivität in diesem Teil des Videos hindeutet.

Abb. 5. YOLO11 , dargestellt als Flächendiagramm.

‍

Verwendung von Diagrammen in realen Computer-Vision-Anwendungen

Hier sind einige reale Anwendungsfälle für Computer Vision, bei denen die Datenvisualisierung eine bedeutende Rolle spielt:

Gesundheitswesen: Computer-Vision-Systeme können Patientenaktivitäten, Personalbewegungen und Gerätenutzung in Echtzeit überwachen. Dies erzeugt große Mengen an visuellen Daten, die, wenn sie visualisiert werden, Muster aufdecken können - wie z. B. Spitzenzeiten der Patientenauslastung oder Reaktionsverzögerungen.

Einzelhandel und E-Commerce: Mit Vision AI lassen sich Kundenbewegungen, Verweildauer vor den Regalen und Produktinteraktionen track . Visuelle Analysen wie Balken- oder Tortendiagramme können aufzeigen, welche Ladenbereiche oder Artikel die meiste Aufmerksamkeit erhalten, und Einzelhändlern helfen, die Produktplatzierung zu optimieren und die Umsätze zu verbessern.

Fertigung: Mit Computer-Vision-Modellen ausgestattete Kameras können Fertigungsstraßen auf Defekte, Sicherheitsverstöße oder den Zustand von Geräten überwachen. Die Datenvisualisierung kann Trends bei den häufigsten Defekttypen aufzeigen oder Zeiträume mit den höchsten Fehlerraten hervorheben, was eine schnellere Entscheidungsfindung und vorbeugende Wartung ermöglicht.

Wesentliche Erkenntnisse

Mit dem Ultralytics können Sie Videomaterial mühelos in klare, aufschlussreiche Diagramme umwandeln, die Aufschluss über das Geschehen geben, z. B. darüber, wie viele Personen oder Objekte im Laufe der Zeit erscheinen. Anstatt stundenlanges Videomaterial manuell auszuwerten, können Sie visuelle Zusammenfassungen erstellen, die wichtige Muster und Trends hervorheben und so ein schnelles Handeln erleichtern. Ganz gleich, ob in Krankenhäusern, Einzelhandelsgeschäften oder Produktionsstätten - diese Diagramme verwandeln komplexe KI-Ergebnisse in Erkenntnisse, die jeder verstehen und nutzen kann.

Möchten Sie mehr über KI erfahren? Erkunden Sie unser GitHub-Repository, vernetzen Sie sich mit unserer Community und informieren Sie sich über unsere Lizenzoptionen, um Ihr Computer-Vision-Projekt zu starten. Erfahren Sie mehr über Innovationen wie KI in der Fertigung und Computer Vision in der Logistik auf unseren Lösungsseiten.

Verbesserung von Computer-Vision-Anwendungen mit Visualisierungen

Ein Überblick über die Datenvisualisierung in Anwendungen der Computer Vision

Verschiedene Arten von Datenvisualisierungen

Generieren von analytischen Diagrammen, um Einblicke in die Computer Vision zu erhalten

Schritt 1: Einrichten der Umgebung

Schritt 2: Herunterladen einer Videodatei

Schritt 3: Importieren von Paketen

Schritt 4: Vorbereiten des Video-Writers

Schritt 5: Einrichten der Ultralytics Analytics-Lösung

Schritt 6: Verarbeiten des Eingangsvideos

Schritt 7: Alles zusammenfügen

Verwendung von Diagrammen in realen Computer-Vision-Anwendungen

Wesentliche Erkenntnisse

Mehr in dieser Kategorie lesen

Was ist Datensatzdestillation? Ein kurzer Überblick

Selbstüberwachtes Lernen zur Rauschunterdrückung: Eine schrittweise Aufschlüsselung

Was bedeutet Bildabgleich bei Vision AI? Eine kurze Einführung

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Verbesserung von Computer-Vision-Anwendungen mit Visualisierungen

Ein Überblick über die Datenvisualisierung in Anwendungen der Computer Vision

Verschiedene Arten von Datenvisualisierungen

Generieren von analytischen Diagrammen, um Einblicke in die Computer Vision zu erhalten

Schritt 1: Einrichten der Umgebung

Schritt 2: Herunterladen einer Videodatei

Schritt 3: Importieren von Paketen

Schritt 4: Vorbereiten des Video-Writers

Schritt 5: Einrichten der Ultralytics Analytics-Lösung

Schritt 6: Verarbeiten des Eingangsvideos

Schritt 7: Alles zusammenfügen

Verwendung von Diagrammen in realen Computer-Vision-Anwendungen

Wesentliche Erkenntnisse

Mehr in dieser Kategorie lesen

Was ist Datensatzdestillation? Ein kurzer Überblick

Selbstüberwachtes Lernen zur Rauschunterdrückung: Eine schrittweise Aufschlüsselung

Was bedeutet Bildabgleich bei Vision AI? Eine kurze Einführung

Lasst uns gemeinsam die Zukunft der KI gestalten!

Lasst uns gemeinsam die Zukunft
der KI gestalten!