Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Integrationen

Nutzung von Albumentations-Augmentierungen zur Diversifizierung deiner Daten

Lerne, wie du Albumentations für Augmentierungen beim individuellen Training von Ultralytics YOLO11 verwendest, um die Modellleistung mit vielfältigen Trainingsdaten zu verbessern.

ABAbirami Vina
5 min read
Albumentations Datenaugmentierungen diversifizieren YOLO11 Trainingsbilder

Wenn du eine Computer-Vision-Lösung entwickelst, ist das Sammeln eines vielfältigen Satzes von Bildern für das Training von Vision-KI-Modellen oft ein entscheidender Teil des Prozesses. Dies erfordert häufig viel Zeit und Geld, und manchmal sind die gesammelten Bilder dennoch nicht abwechslungsreich genug, damit die Modelle effektiv lernen können.

Zum Beispiel können Computer-Vision-Modelle wie Ultralytics YOLO11 auf Bilddatensätze für verschiedene Computer-Vision-Aufgaben trainiert werden, die sich auf unterschiedliche Anwendungen beziehen. Vielfältige Daten sind der Schlüssel, da sie dem Modell helfen, besser zu generalisieren und Objekte sowie Muster in einer Vielzahl von realen Szenarien zu erkennen.

Wenn du mit einem Mangel an vielfältigen Daten zu kämpfen hast, können Techniken zur Bilddatenaugmentierung eine großartige Lösung sein. Methoden wie Drehen, Spiegeln und das Anpassen der Helligkeit können dazu beitragen, die Vielfalt deines Datensatzes zu erhöhen und die Fähigkeit des Modells zu verbessern, mit einer breiteren Palette an Bedingungen umzugehen.

Deshalb unterstützt Ultralytics eine Integration für Bilddatenaugmentierung. Mit Albumentations, einem beliebten Tool, das eine Sammlung von Transformationen bietet, kannst du vielfältige visuelle Daten erstellen. Diese Integration vereinfacht den Trainingsprozess von YOLO11 durch die automatische Augmentierung von Trainingsbildern, was zu einer verbesserten Modellleistung führt.

In diesem Artikel untersuchen wir, wie du die Albumentations-Integration nutzen kannst, welche Vorteile sie bietet und welchen Einfluss sie auf das Modelltraining hat.

Link to this sectionWas ist Albumentations?#

Computer-Vision-Modelle können aus einer breiten Menge hochwertiger Bilder lernen, um Objekte in verschiedenen Umgebungen zu erkennen. Das Sammeln großer Datensätze aus realen Quellen kann langsam, kostspielig und ineffizient sein. Um diese Aufgabe zu optimieren, kannst du Bilddatenaugmentierung verwenden, um neue Variationen bestehender Bilder zu erstellen und Modellen zu helfen, aus verschiedenen Szenarien zu lernen, ohne mehr Daten sammeln zu müssen.

Konkret kannst du Albumentations nutzen, eine Open-Source-Bibliothek, die 2018 für eine effiziente Bilddatenaugmentierung eingeführt wurde. Sie unterstützt eine Vielzahl von Operationen, von einfachen geometrischen Änderungen wie Rotationen und Spiegelungen bis hin zu komplexeren Anpassungen wie Helligkeit, Kontrast und dem Hinzufügen von Rauschen.

Beispiele für verschiedene Arten von Bilddatenerweiterungen

Abb. 1. Beispiele für verschiedene Arten von Bilddatenaugmentierungen.

Link to this sectionHauptfunktionen von Albumentations#

Albumentations ist für seine hohe Leistung bekannt, was bedeutet, dass es Bilder schnell und effizient verarbeiten kann. Basierend auf optimierten Bibliotheken wie OpenCV und NumPy bewältigt es große Datensätze mit minimaler Verarbeitungszeit, was es ideal für die schnelle Datenaugmentierung während des Modelltrainings macht.

Hier sind einige weitere Hauptfunktionen von Albumentations:

  • Breite Palette an Transformationen: Albumentations bietet über 70 Arten von Augmentierungen. Diese Variationen helfen Modellen dabei, Objekte trotz Änderungen in Beleuchtung, Winkeln oder Hintergründen zu erkennen.
  • Auf Geschwindigkeit optimiert: Es verwendet fortschrittliche Optimierungstechniken wie SIMD (Single Instruction, Multiple Data), das mehrere Datenpunkte gleichzeitig verarbeitet, um die Bildaugmentierung zu beschleunigen und große Datensätze effizient zu handhaben.
  • Drei Ebenen der Augmentierung: Es verbessert Daten auf drei Arten. Beispielsweise passen Pixel-Ebenen-Augmentierungen Helligkeit und Farbe an, ohne die Objekte zu verändern. Währenddessen verändern räumliche Augmentierungen die Positionierung von Objekten, während wichtige Details erhalten bleiben, und Mixing-Ebenen-Augmentierungen vermischen Teile verschiedener Bilder, um neue Stichproben zu erstellen.

Link to this sectionWarum solltest du die Albumentations-Integration verwenden?#

Du fragst dich vielleicht: Es gibt viele Möglichkeiten, Augmentierungen auf einen Datensatz anzuwenden, und du könntest sogar eigene mit Tools wie OpenCV erstellen. Warum also eine Integration wählen, die eine Bibliothek wie Albumentations unterstützt?

Das manuelle Erstellen von Augmentierungen mit Tools wie OpenCV kann viel Zeit in Anspruch nehmen und erfordert einiges an Fachwissen. Es kann auch schwierig sein, die Transformationen fein abzustimmen, um die besten Ergebnisse zu erzielen. Die Albumentations-Integration macht diesen Prozess einfacher. Sie bietet viele sofort einsatzbereite Transformationen, die dir Zeit und Mühe bei der Vorbereitung deines Datensatzes sparen können.

Ein weiterer Grund für die Wahl der Albumentations-Integration ist, dass sie reibungslos mit der Modelltrainings-Pipeline von Ultralytics zusammenarbeitet. Sie macht das benutzerdefinierte Training von YOLO11 wesentlich einfacher, da die Augmentierungen während des Trainings automatisch angewendet werden. Dies vereinfacht den Prozess, sodass du dich mehr auf die Verbesserung deines Modells konzentrieren kannst, anstatt dich um die Datenvorbereitung zu kümmern.

Link to this sectionErste Schritte mit der Albumentations-Integration#

Interessanterweise ist die Nutzung der Albumentations-Integration zum Trainieren von YOLO11 einfacher, als es scheinen mag. Sobald die richtigen Bibliotheken eingerichtet sind, wendet die Integration automatisch Bilddatenaugmentierungen während des Trainings an. Dies hilft dem Modell, aus verschiedenen Bildvariationen unter Verwendung desselben Datensatzes zu lernen.

Gehen wir als Nächstes durch, wie man die Albumentations-Integration installiert und verwendet, wenn man YOLO11 benutzerdefiniert trainiert.

Link to this sectionInstallation des Ultralytics Python-Pakets und Albumentations#

Bevor Augmentierungen angewendet werden können, müssen sowohl das Ultralytics Python-Paket als auch Albumentations installiert sein. Die Integration wurde so aufgebaut, dass beide Bibliotheken standardmäßig nahtlos zusammenarbeiten, sodass du dir keine Sorgen um komplexe Konfigurationen machen musst.

Der gesamte Installationsprozess kann in nur wenigen Minuten mit einem einzigen pip-Befehl abgeschlossen werden, einem Paketverwaltungstool zur Installation von Python-Bibliotheken, wie im Bild unten dargestellt.

Installation von Ultralytics und Albumentations mit pip

Abb. 2. Installation von Ultralytics und Albumentations.

Sobald Albumentations installiert ist, wendet der Modelltrainingsmodus von Ultralytics automatisch Bildaugmentierungen während des Trainings an. Wenn Albumentations nicht installiert ist, werden diese Augmentierungen nicht angewendet. Weitere Details findest du in der offiziellen Ultralytics-Dokumentation.

Link to this sectionTraining von YOLO11 mit Hilfe der Albumentations-Integration#

Lass uns ein besseres Verständnis dafür bekommen, was im Hintergrund der Albumentations-Integration passiert.

Hier ist ein genauerer Blick auf die Augmentierungen, die während des YOLO11-Trainings angewendet werden:

  • Weichzeichnung: Diese Transformation fügt einem Bild eine leichte Unschärfe hinzu. Sie hilft dem Modell, Objekte auch dann zu erkennen, wenn sie nicht im Fokus sind.
  • Median-Weichzeichnung: Sie reduziert zufälliges Rauschen, während Objektkanten in einem Bild erhalten bleiben. Dies erleichtert es dem Modell, Objekte in komplexen Umgebungen zu erkennen.
  • Graustufen: Durch die Konvertierung eines Bildes in Schwarz-Weiß kann diese Augmentierung dem Modell helfen, sich auf Formen und Texturen anstatt auf Farben zu konzentrieren.
  • CLAHE (Contrast Limited Adaptive Histogram Equalization): Diese Augmentierung verstärkt den Kontrast in Bildern, insbesondere in Bereichen, die zu dunkel oder schwer erkennbar sind, wie etwa bei schlechten Lichtverhältnissen oder nebligen Bedingungen. Dies macht Objekte in diesen Bereichen deutlicher und für das Modell leichter identifizierbar.

Graustufen-Augmentierung angewendet auf das Bild einer Katze

Abb. 3. Ein Beispiel für eine Graustufen-Augmentierung, die auf ein Bild einer Katze angewendet wurde.

Link to this sectionAnwendungen von YOLO11 und der Albumentations-Integration#

Wenn du YOLO11 für eine spezifische Anwendung benutzerdefiniert trainierst, kann die Albumentations-Integration dazu beitragen, die Leistung des Modells durch Anpassung an verschiedene Bedingungen zu verbessern. Lass uns einige reale Anwendungen und die Herausforderungen besprechen, die diese Integration lösen kann.

Link to this sectionVerbesserung der medizinischen Bildgebung#

Vision-KI im Gesundheitswesen hilft Ärzten dabei, medizinische Bilder genauer zu analysieren, um Diagnosen zu unterstützen und die Patientenversorgung zu verbessern. Tatsächlich nutzen etwa ein Fünftel der Gesundheitsorganisationen bereits KI-Lösungen.

Die Erstellung dieser Computer-Vision-Lösungen bringt jedoch ihre eigenen Herausforderungen mit sich. Medizinische Scans können zwischen Krankenhäusern stark variieren, beeinflusst durch Faktoren wie unterschiedliche Ausrüstung, Einstellungen und sogar die Erfahrung des Personals. Schwankungen in Helligkeit, Kontrast und Belichtung können die Konsistenz und Genauigkeit von Vision-KI-Modellen beeinträchtigen, was es schwierig macht, über verschiedene Umgebungen hinweg zuverlässig zu funktionieren.

Hier wird die Integration von Tools wie Albumentations unerlässlich. Durch das Erstellen mehrerer augmentierter Versionen desselben Scans ermöglicht Albumentations es dem Modell, aus einer Vielzahl von Bildqualitäten zu lernen. Dies trägt dazu bei, das Modell robuster zu machen, sodass es Krankheiten sowohl in qualitativ hochwertigen als auch in minderwertigen Bildern präzise erkennen kann.

Augmentierte Röntgenbilder

Abb. 4. Augmentierte Röntgenbilder.

Link to this sectionVerbesserung von Sicherheit und Überwachung#

Eine weitere interessante Anwendung von Vision-KI liegt in Sicherheit und Überwachung. Echtzeit-Objekterkennung kann Sicherheitsteams dabei helfen, potenzielle Bedrohungen schnell zu identifizieren.

Ein Hauptanliegen in Bezug auf diese Anwendung ist, dass Überwachungskameras Filmmaterial unter verschiedenen Lichtverhältnissen über den Tag hinweg aufnehmen, und diese Bedingungen können drastisch beeinflussen, wie ein Modell solche Bilder versteht. Faktoren wie Umgebungen bei schlechtem Licht, Blendung oder schlechte Sichtbarkeit können es Computer-Vision-Modellen erschweren, Objekte konsistent zu erkennen oder potenzielle Bedrohungen zu identifizieren.

Die Albumentations-Integration hilft, indem sie Transformationen anwendet, um unterschiedliche Lichtverhältnisse zu imitieren. Dies ermöglicht es dem Modell, Objekte sowohl in hellen als auch in schwach beleuchteten Umgebungen zu erkennen, was es zuverlässiger macht und die Reaktionszeiten unter herausfordernden Bedingungen verbessert.

Link to this sectionNeudefinition von Abläufen im Einzelhandel und Kundenerfahrung#

Ein verschüttetes Produkt im Supermarktgang, ein durch den Laden rennender Hund oder ein Kind, das ein Warenregal umstößt, sind nur einige Beispiele für alltägliche Ereignisse, die zu Edge Cases für Vision-KI im Einzelhandel werden können. Computer Vision wird zunehmend eingesetzt, um die Kundenerfahrung durch das Nachverfolgen von Kundenverhalten, die Überwachung der Kundenströme und die Identifizierung von Produkten in Regalen zu verbessern. Diese realen Situationen können jedoch für KI-Systeme schwer zu verstehen und präzise zu verarbeiten sein.

Obwohl nicht jedes Szenario in einem Computer-Vision-Datensatz dargestellt werden kann, hilft die Albumentations-Integration, indem sie Daten augmentiert, um viele mögliche Situationen abzudecken, wie z. B. unerwartete Beleuchtung, ungewöhnliche Winkel oder Hindernisse. Dies hilft Computer-Vision-Modellen, sich an verschiedene Bedingungen anzupassen, verbessert ihre Fähigkeit, mit Edge Cases umzugehen und in dynamischen Einzelhandelsumgebungen genaue Vorhersagen zu treffen.

Link to this sectionWichtige Erkenntnisse#

Das Sammeln vielfältiger, realer Daten für das Modelltraining kann kompliziert sein, aber Albumentations macht es einfacher, indem es Bildvariationen erzeugt, die Modellen helfen, sich an unterschiedliche Bedingungen anzupassen.

Die von Ultralytics unterstützte Albumentations-Integration vereinfacht den Prozess der Anwendung dieser Augmentierungen während des benutzerdefinierten Trainings von YOLO11. Dies führt zu einer besseren Datensatzqualität, was einer Vielzahl von Branchen zugutekommt, indem genauere und zuverlässigere Vision-KI-Modelle erstellt werden.

Tritt unserer Community bei und erkunde unser GitHub-Repository, um mehr über KI zu erfahren, und sieh dir unsere Lizenzoptionen an, um deine Vision-KI-Projekte zu starten. Interessiert an Innovationen wie KI in der Fertigung oder Computer Vision beim autonomen Fahren? Besuche unsere Lösungsseiten, um mehr zu entdecken.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens