Ultralytics YOLO Datenerweiterung mit Albumentationen

Beim Aufbau einer Computer-Vision-Lösung kann das Sammeln eines vielfältigen Satzes von Bildern zum Trainieren von Vision-KI-Modellen ein entscheidender Teil des Prozesses sein. Es erfordert oft viel Zeit und Geld, und manchmal sind die gesammelten Bilder immer noch nicht vielfältig genug, damit die Modelle effektiv lernen können.

Zum Beispiel können Computer-Vision-Modelle wie Ultralytics YOLO11 können anhand von Bilddatensätzen für verschiedene Bildverarbeitungsaufgaben im Zusammenhang mit unterschiedlichen Anwendungen individuell trainiert werden. Vielfältige Daten sind der Schlüssel, denn sie helfen dem Modell, besser zu verallgemeinern und Objekte und Muster in einer Vielzahl von realen Szenarien zu erkennen.

Wenn Sie mit einem Mangel an diversen Daten zu kämpfen haben, können Techniken zur Augmentierung von Bilddaten eine großartige Lösung sein. Methoden wie Drehen, Spiegeln und Anpassen der Helligkeit können dazu beitragen, die Vielfalt Ihres Datensatzes zu erhöhen und die Fähigkeit des Modells zu verbessern, mit einem breiteren Spektrum von Bedingungen umzugehen.

Aus diesem Grund unterstützt Ultralytics eine Integration zur Erweiterung von Bilddaten. Mit Albumentations, einem beliebten Tool, das eine Sammlung von Transformationen bietet, können Sie verschiedene visuelle Daten erstellen. Diese Integration vereinfacht den Trainingsprozess YOLO11 durch die automatische Erweiterung von Trainingsbildern, was zu einer verbesserten Modellleistung führt.

In diesem Artikel werden wir untersuchen, wie Sie die Albumentations-Integration nutzen können, welche Vorteile sie bietet und welche Auswirkungen sie auf das Modelltraining hat.

Was ist Albumentations?

Computer-Vision-Modelle können aus einer breiten Palette hochwertiger Bilder lernen, um Objekte in verschiedenen Umgebungen zu erkennen. Das Sammeln großer Datensätze aus realen Quellen kann langsam, kostspielig und ineffizient sein. Um diese Aufgabe zu rationalisieren, können Sie Bilddatenaugmentation verwenden, um neue Variationen bestehender Bilder zu erstellen, sodass Modelle aus verschiedenen Szenarien lernen können, ohne mehr Daten zu sammeln.

Insbesondere können Sie Albumentations nutzen, eine Open-Source-Bibliothek, die 2018 für die effiziente Augmentierung von Bilddaten eingeführt wurde. Sie unterstützt eine Vielzahl von Operationen, von einfachen geometrischen Änderungen wie Drehungen und Spiegelungen bis hin zu komplexeren Anpassungen wie Helligkeit, Kontrast und Rauschaddition.

__wf_reserved_inherit — Abb. 1. Beispiele für verschiedene Arten von Bilddatenaugmentierungen.

‍

Hauptmerkmale von Albumentations

Albumentations ist bekannt für seine hohe Leistung, d.h. es kann Bilder schnell und effizient verarbeiten. Es basiert auf optimierten Bibliotheken wie OpenCV und NumPy aufbaut, verarbeitet es große Datensätze mit minimaler Verarbeitungszeit und ist damit ideal für eine schnelle Datenerweiterung während des Modelltrainings.

Hier sind einige weitere wichtige Funktionen von Albumentations:

Große Auswahl an Transformationen: Albumentations bietet über 70 Arten von Augmentierungen. Diese Variationen helfen den Modellen zu lernen, Objekte trotz veränderter Beleuchtung, Winkel oder Hintergründe detect .
‍
Für Geschwindigkeit optimiert: Es verwendet fortschrittliche Optimierungstechniken wie SIMD (Single Instruction, Multiple Data), die mehrere Datenpunkte gleichzeitig verarbeitet, um die Bildaugmentation zu beschleunigen und große Datensätze effizient zu verarbeiten.
‍
Drei Stufen der Augmentierung: Die Daten werden auf drei Arten verbessert. Zum Beispiel passen Augmentierungen auf Pixelebene Helligkeit und Farbe an, ohne Objekte zu verändern. Augmentierungen auf räumlicher Ebene verändern die Objektpositionierung, wobei wichtige Details erhalten bleiben, und Augmentierungen auf Mischungsebene vermischen Teile verschiedener Bilder, um neue Stichproben zu erstellen.

Warum sollten Sie die Albumentations-Integration verwenden?

Sie fragen sich vielleicht: Es gibt viele Möglichkeiten, Augmentierungen auf einen Datensatz anzuwenden, und Sie könnten sogar Ihre eigenen mit Tools wie OpenCV erstellen. Warum also eine Integration wählen, die eine Bibliothek wie Albumentations unterstützt?

Die manuelle Erstellung von Augmentierungen mit Tools wie OpenCV kann viel Zeit in Anspruch nehmen und erfordert einiges an Fachwissen. Es kann auch schwierig sein, die Transformationen fein abzustimmen, um die besten Ergebnisse zu erzielen. Die Albumentations-Integration macht diesen Prozess einfacher. Sie bietet viele gebrauchsfertige Transformationen, mit denen Sie bei der Vorbereitung Ihres Datensatzes Zeit und Mühe sparen können.

Ein weiterer Grund, sich für die Albumentations-Integration zu entscheiden, ist die reibungslose Zusammenarbeit mit derUltralytics-Modelltrainings-Pipeline. Sie macht es viel einfacher, YOLO11 individuell zu trainieren, da die Erweiterungen während des Trainings automatisch angewendet werden. Dies vereinfacht den Prozess, so dass Sie sich mehr auf die Verbesserung Ihres Modells als auf die Datenvorbereitung konzentrieren können.

Erste Schritte mit der Albumentations-Integration

Interessanterweise ist die Verwendung der Albumentations-Integrationen für das Training von YOLO11 unkomplizierter als es scheint. Sobald die richtigen Bibliotheken eingerichtet sind, wendet die Integration beim Training automatisch Bilddatenerweiterungen an. So kann das Modell aus verschiedenen Bildvarianten mit demselben Datensatz lernen.

Als Nächstes möchten wir Ihnen zeigen, wie Sie die Albumentations-Integration installieren und nutzen können, wenn Sie YOLO11 individuell trainieren.

Installation desPython und von Albumentations

Vor der Anwendung von Erweiterungen müssen sowohl das Ultralytics Python als auch Albumentations installiert werden. Die Integration wurde so konzipiert, dass beide Bibliotheken standardmäßig nahtlos zusammenarbeiten, so dass Sie sich nicht um komplexe Konfigurationen kümmern müssen.

Der gesamte Installationsvorgang kann mit einem einzigen pip-Befehl in wenigen Minuten abgeschlossen werden. pip ist ein Paketverwaltungsprogramm für die Installation von Python , wie in der Abbildung unten dargestellt.

Sobald Albumentations installiert ist, wendet der Ultralytics während des Trainings automatisch Bildvergrößerungen an. Wenn Albumentations nicht installiert ist, werden diese Erweiterungen nicht angewendet. Weitere Einzelheiten finden Sie in der offiziellen Ultralytics .

Ausbildung YOLO11 mit Hilfe der Albumentations-Integration

Lassen Sie uns ein besseres Verständnis dafür bekommen, was unter der Haube der Albumentations-Integration vor sich geht.

Hier ein genauerer Blick auf die Erweiterungen, die während der YOLO11 eingesetzt werden:

Unschärfe: Diese Transformation fügt dem Bild eine leichte Unschärfe hinzu. Sie hilft dem Modell, Objekte detect , auch wenn sie unscharf sind.
‍
Mediane Unschärfe: Sie reduziert zufälliges Rauschen und bewahrt gleichzeitig die Objektkanten in einem Bild. Dies erleichtert es dem Modell, Objekte in komplexen Umgebungen detect .
‍
Graustufen: Durch die Konvertierung eines Bildes in Schwarzweiß kann diese Augmentierung dem Modell helfen, sich auf Formen und Texturen anstelle von Farben zu konzentrieren.
‍
CLAHE (Contrast Limited Adaptive Histogram Equalization): Diese Augmentierung verstärkt den Kontrast in Bildern, insbesondere in Bereichen, die zu dunkel oder schwer zu erkennen sind, wie z. B. bei schlechten Lichtverhältnissen oder Dunst. Dadurch werden Objekte in diesen Bereichen klarer und für das Modell leichter zu identifizieren.

‍

Anwendungen von YOLO11 und der Integration von Albumentations

Wenn Sie YOLO11 für eine bestimmte Anwendung trainieren, kann die Albumentations-Integration dazu beitragen, die Leistung des Modells zu verbessern, indem es sich an verschiedene Bedingungen anpasst. Lassen Sie uns einige reale Anwendungen und die Herausforderungen diskutieren, die diese Integration lösen kann.

Verbesserung der medizinischen Bildgebung

Vision AI im Gesundheitswesen hilft Ärzten, medizinische Bilder genauer zu analysieren, um Diagnosen zu unterstützen und die Patientenversorgung zu verbessern. Tatsächlich nutzen bereits etwa ein Fünftel der Gesundheitsorganisationen KI-Lösungen.

Die Entwicklung dieser Computer-Vision-Lösungen bringt jedoch auch einige Herausforderungen mit sich. Medizinische Scans können zwischen Krankenhäusern stark variieren, was auf Faktoren wie unterschiedliche Geräte, Einstellungen und sogar die Erfahrung der Techniker zurückzuführen ist. Schwankungen in Helligkeit, Kontrast und Belichtung können die Konsistenz und Genauigkeit von Vision-AI-Modellen beeinträchtigen, was es ihnen erschwert, in verschiedenen Umgebungen zuverlässig zu arbeiten.

An dieser Stelle wird die Integration von Tools wie Albumentations unerlässlich. Durch die Erstellung mehrerer erweiterter Versionen desselben Scans ermöglicht Albumentations dem Modell, aus einer Vielzahl von Bildqualitäten zu lernen. Dadurch wird das Modell robuster und kann Krankheiten sowohl auf Bildern mit hoher als auch mit niedriger Qualität genau detect .

‍

Verbesserung der Sicherheit und Überwachung

Eine weitere interessante Anwendung von Vision AI liegt im Bereich Sicherheit und Überwachung. Die Echtzeit-Objekterkennung kann Sicherheitsteams helfen, potenzielle Bedrohungen schnell zu identifizieren.

Ein Hauptproblem bei dieser Anwendung besteht darin, dass Sicherheitskameras den ganzen Tag über Aufnahmen unter verschiedenen Lichtverhältnissen machen, die sich erheblich darauf auswirken können, wie ein Modell solche Bilder versteht. Faktoren wie schlechte Lichtverhältnisse, Blendung oder schlechte Sicht können es für Computer-Vision-Modelle schwierig machen, Objekte detect oder potenzielle Bedrohungen konsistent zu erkennen.

Die Albumentations-Integration hilft durch die Anwendung von Transformationen, um unterschiedliche Lichtverhältnisse zu imitieren. So kann das Modell lernen, Objekte sowohl in hellen als auch in schwach beleuchteten Umgebungen detect . Das macht es zuverlässiger und verbessert die Reaktionszeiten unter schwierigen Bedingungen.

Neudefinition von Einzelhandels-Workflows und Kundenerlebnissen

Eine verschüttete Flüssigkeit in einem Supermarktg gang, ein Hund, der durch ein Geschäft läuft, oder ein Kind, das eine Produktauslage umwirft, sind nur einige Beispiele für alltägliche Ereignisse, die Grenzfälle für Vision AI im Einzelhandel darstellen können. Computer Vision wird zunehmend eingesetzt, um das Kundenerlebnis zu verbessern, indem das Einkäuferverhalten verfolgt, der Kundenverkehr überwacht und Produkte in den Regalen identifiziert werden. Diese realen Situationen können jedoch für KI-Systeme schwierig zu verstehen und genau zu verarbeiten sein.

Obwohl nicht jedes Szenario in einem Computer-Vision-Datensatz dargestellt werden kann, hilft die Albumentations-Integration, indem sie Daten erweitert, um viele mögliche Situationen abzudecken, wie z. B. unerwartete Beleuchtung, ungewöhnliche Winkel oder Hindernisse. Dies hilft Computer-Vision-Modellen, sich an verschiedene Bedingungen anzupassen, wodurch ihre Fähigkeit verbessert wird, Randfälle zu behandeln und genaue Vorhersagen in dynamischen Einzelhandelsumgebungen zu treffen.

Wesentliche Erkenntnisse

Das Sammeln vielfältiger realer Daten für das Modelltraining kann kompliziert sein, aber Albumentations vereinfacht dies durch die Erstellung von Bildvariationen, die Modellen helfen, sich an unterschiedliche Bedingungen anzupassen.

Die von Ultralytics unterstützte Albumentations-Integration vereinfacht den Prozess der Anwendung dieser Erweiterungen beim individuellen Training YOLO11. Dies führt zu einer besseren Datensatzqualität, die einer Vielzahl von Branchen zugutekommt, indem sie genauere und zuverlässigere Vision-KI-Modelle erzeugt.

Treten Sie unserer Community bei und erkunden Sie unser GitHub-Repository, um mehr über KI zu erfahren, und sehen Sie sich unsere Lizenzoptionen an, um Ihre Vision AI-Projekte zu starten. Interessieren Sie sich für Innovationen wie KI in der Fertigung oder Computer Vision im Bereich des autonomen Fahrens? Besuchen Sie unsere Lösungsseiten, um mehr zu erfahren.

Verwendung von Albumentations-Augmentierungen zur Diversifizierung Ihrer Daten

Was ist Albumentations?

Hauptmerkmale von Albumentations

Warum sollten Sie die Albumentations-Integration verwenden?

Erste Schritte mit der Albumentations-Integration

Installation desPython und von Albumentations

Ausbildung YOLO11 mit Hilfe der Albumentations-Integration

Anwendungen von YOLO11 und der Integration von Albumentations

Verbesserung der medizinischen Bildgebung

Verbesserung der Sicherheit und Überwachung

Neudefinition von Einzelhandels-Workflows und Kundenerlebnissen

Wesentliche Erkenntnisse

Mehr in dieser Kategorie lesen

Einsatz von Ultralytics YOLO unter Verwendung der ExecuTorch-Integration

Ein Leitfaden zur U-Net-Architektur und ihren Anwendungen

Beliebte Open-Source-OCR-Modelle und ihre Funktionsweise

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Verwendung von Albumentations-Augmentierungen zur Diversifizierung Ihrer Daten

Was ist Albumentations?

Hauptmerkmale von Albumentations

Warum sollten Sie die Albumentations-Integration verwenden?

Erste Schritte mit der Albumentations-Integration

Installation desPython und von Albumentations

Ausbildung YOLO11 mit Hilfe der Albumentations-Integration

Anwendungen von YOLO11 und der Integration von Albumentations

Verbesserung der medizinischen Bildgebung

Verbesserung der Sicherheit und Überwachung

Neudefinition von Einzelhandels-Workflows und Kundenerlebnissen

Wesentliche Erkenntnisse

Mehr in dieser Kategorie lesen

Einsatz von Ultralytics YOLO unter Verwendung der ExecuTorch-Integration

Ein Leitfaden zur U-Net-Architektur und ihren Anwendungen

Beliebte Open-Source-OCR-Modelle und ihre Funktionsweise

Lasst uns gemeinsam die Zukunft der KI gestalten!

Lasst uns gemeinsam die Zukunft
der KI gestalten!