Die Bedeutung hochwertiger Datensätze für die Computer Vision

Abirami Vina

4 Minuten lesen

16. Dezember 2024

Erforschen Sie mit uns die Notwendigkeit qualitativ hochwertiger Daten bei der Erstellung von Computer-Vision-Modellen. Entdecken Sie, wie sich die Datenqualität auf die Modellleistung auswirken kann.

Im Jahr 2019 ist der Einsatz von künstlicher Intelligenz (KI) in Unternehmen in den letzten vier Jahren um 270 % gestiegen. Dieses Wachstum hat die schnelle Integration von Computer-Vision-Anwendungen (CV) vorangetrieben - KI-Systeme, die es Maschinen ermöglichen, visuelle Daten aus ihrer Umgebung zu interpretieren und zu analysieren. Diese Anwendungen ermöglichen eine Vielzahl von Technologien, von der Erkennung von Krankheiten in der medizinischen Bildgebung über autonome Fahrzeuge bis hin zur Optimierung des Verkehrsflusses im Transportwesen und zur Verbesserung der Überwachung in Sicherheitssystemen. 

Die bemerkenswerte Genauigkeit und unübertroffene Leistung modernster Computer-Vision-Modelle wie Ultralytics YOLO11 haben dieses exponentielle Wachstum maßgeblich vorangetrieben. Die Leistung dieser Modelle hängt jedoch stark von der Qualität und Quantität der Daten ab, die zum Trainieren, Validieren und Testen der Modelle verwendet werden. 

Ohne ausreichend hochwertige Daten ist es schwierig, Bildverarbeitungsmodelle zu trainieren und sie so zu optimieren, dass sie den Industriestandards entsprechen. In diesem Artikel werden wir die entscheidende Rolle von Daten bei der Erstellung von Bildverarbeitungsmodellen untersuchen und erläutern, warum qualitativ hochwertige Daten in der Bildverarbeitung so wichtig sind. Außerdem geben wir Ihnen einige Tipps, wie Sie bei der Erstellung qualitativ hochwertiger Datensätze vorgehen können, während Sie an der Ausbildung benutzerdefinierter Computer-Vision-Modelle arbeiten. Fangen wir an!

Die Rolle der Daten bei der Erstellung von Computer-Vision-Modellen

Computer-Vision-Modelle können auf großen Bild- und Videodatensätzen trainiert werden, um Muster zu erkennen und genaue Vorhersagen zu treffen. So kann beispielsweise ein Objekterkennungsmodell auf Hunderten oder sogar Tausenden von markierten Bildern und Videos trainiert werden, um Objekte genau zu identifizieren. 

Die Qualität und Quantität dieser Trainingsdaten beeinflussen die Leistung des Modells

Da Computer-Vision-Modelle nur aus den Daten lernen können, denen sie ausgesetzt sind, ist die Bereitstellung von qualitativ hochwertigen Daten und vielfältigen Beispielen entscheidend für ihren Erfolg. Ohne ausreichende und vielfältige Datensätze können diese Modelle reale Szenarien nicht genau analysieren und könnten verzerrte oder ungenaue Ergebnisse liefern. 

Aus diesem Grund ist es wichtig, die Rolle der Daten bei der Modellschulung genau zu verstehen. Bevor wir uns mit den Merkmalen hochwertiger Daten befassen, sollten wir die Arten von Datensätzen verstehen, die beim Training von Computer-Vision-Modellen auftreten können.

Arten von Computer-Vision-Datensätzen

In der Computer Vision werden die im Trainingsprozess verwendeten Daten in drei Kategorien eingeteilt, die jeweils einem bestimmten Zweck dienen. Hier ist ein kurzer Überblick über jeden Typ:

  • Daten zur Ausbildung: Dies ist der primäre Datensatz, der verwendet wird, um das Modell von Grund auf zu trainieren. Er besteht aus Bildern und Videos mit vordefinierten Bezeichnungen, die es dem Modell ermöglichen, Muster zu lernen und Objekte zu erkennen.
  • Validierungsdaten: Hierbei handelt es sich um einen Datensatz, mit dem überprüft wird, wie gut ein Modell funktioniert, während es trainiert wird. Sie helfen sicherzustellen, dass das Modell bei neuen, ungesehenen Daten korrekt funktioniert.
  • Daten prüfen: Ein separater Datensatz, der verwendet wird, um die endgültige Leistung eines trainierten Modells zu bewerten. Es wird geprüft, wie gut das Modell Vorhersagen für völlig neue, unbekannte Daten machen kann.
__wf_reserved_inherit
Abb. 1. Wie Daten in der Computer Vision kategorisiert werden.

Die 5 wichtigsten Merkmale hochwertiger Computer-Vision-Datensätze

Unabhängig von der Art des Datensatzes sind qualitativ hochwertige Daten für die Erstellung erfolgreicher Computer-Vision-Modelle unerlässlich. Im Folgenden sind einige der wichtigsten Merkmale aufgeführt, die einen hochwertigen Datensatz ausmachen:

  • Genauigkeit: Im Idealfall sollten die Daten reale Situationen genau widerspiegeln und korrekte Bezeichnungen enthalten. Wenn es zum Beispiel um Vision AI im Gesundheitswesen geht, müssen Bilder von Röntgenaufnahmen oder Scans genau beschriftet sein, damit das Modell richtig lernen kann.
  • Vielfältigkeit: Ein guter Datensatz enthält eine Vielzahl von Beispielen, damit das Modell in verschiedenen Situationen gut funktioniert. Wenn ein Modell beispielsweise lernt, Autos zu erkennen, sollte der Datensatz Autos verschiedener Formen, Größen und Farben in unterschiedlichen Situationen (Tag, Nacht, Regen usw.) enthalten.
  • Konsistenz: Hochwertige Datensätze folgen einem einheitlichen Format und Qualitätsstandards. Zum Beispiel sollten die Bilder ähnliche Auflösungen haben (nicht einige unscharf und andere scharf) und die gleichen Vorverarbeitungsschritte durchlaufen, wie Größen- oder Farbanpassungen, damit das Modell aus konsistenten Informationen lernt.
  • Aktualität: Datensätze, die regelmäßig aktualisiert werden, können mit den Veränderungen in der realen Welt Schritt halten. Nehmen wir an, Sie trainieren ein Modell zur Erkennung aller Arten von Fahrzeugen. Wenn neue Fahrzeuge, wie z. B. Elektroroller, eingeführt werden, sollten sie dem Datensatz hinzugefügt werden, um sicherzustellen, dass das Modell genau und aktuell bleibt.
  • Datenschutz: Enthält ein Datensatz sensible Informationen, wie z. B. Fotos von Personen, muss er den Datenschutzbestimmungen entsprechen. Techniken wie Anonymisierung (Entfernen identifizierbarer Details) und Datenmaskierung (Ausblenden sensibler Teile) können die Privatsphäre schützen und gleichzeitig eine sichere Nutzung der Daten ermöglichen.

Herausforderungen durch minderwertige Daten

Es ist zwar wichtig, die Merkmale qualitativ hochwertiger Daten zu verstehen, aber ebenso wichtig ist es, zu bedenken, wie sich minderwertige Daten auf Ihre Computer-Vision-Modelle auswirken können.

Probleme wie Überanpassung und Unteranpassung können die Modellleistung erheblich beeinträchtigen. Eine Überanpassung liegt vor, wenn ein Modell bei den Trainingsdaten gut abschneidet, aber bei neuen oder unbekannten Daten Schwierigkeiten hat, oft weil der Datensatz nicht abwechslungsreich genug ist. Eine Unteranpassung liegt hingegen vor, wenn der Datensatz nicht genügend Beispiele oder nicht genügend Qualität bietet, damit das Modell sinnvolle Muster lernen kann. Um diese Probleme zu vermeiden, ist es wichtig, vielfältige, unvoreingenommene und qualitativ hochwertige Datensätze zu pflegen, um eine zuverlässige Leistung sowohl beim Training als auch bei realen Anwendungen zu gewährleisten.

__wf_reserved_inherit
Abb. 2. Underfitting vs. Überanpassung.

Daten von geringer Qualität können es den Modellen auch erschweren, aus den Rohdaten aussagekräftige Muster zu extrahieren und zu lernen, ein Prozess, der als Merkmalsextraktion bekannt ist. Wenn der Datensatz unvollständig oder irrelevant ist oder es ihm an Vielfalt mangelt, kann das Modell kaum effektiv arbeiten. 

Manchmal kann eine schlechte Datenqualität das Ergebnis der Vereinfachung von Daten sein. Die Vereinfachung von Daten kann helfen, Speicherplatz zu sparen und die Verarbeitungskosten zu senken, aber durch eine zu starke Vereinfachung können wichtige Details verloren gehen, die das Modell benötigt, um gut zu funktionieren. Aus diesem Grund ist es so wichtig, während des gesamten Bildverarbeitungsprozesses- von der Erfassung bis zur Bereitstellung- auf eine hohe Datenqualität zu achten. Als Faustregel gilt, dass die Datensätze wesentliche Merkmale enthalten und gleichzeitig vielfältig und genau sein sollten, um zuverlässige Modellvorhersagen zu gewährleisten.

__wf_reserved_inherit
Abbildung 3. Verstehen der Merkmalsextraktion.

Tipps zur Aufrechterhaltung der Qualität Ihres Computer-Vision-Datensatzes

Nachdem wir nun verstanden haben, wie wichtig qualitativ hochwertige Daten sind und welche Auswirkungen minderwertige Daten haben, wollen wir nun untersuchen, wie Sie sicherstellen können, dass Ihr Datensatz hohe Standards erfüllt.

Alles beginnt mit einer zuverlässigen Datenerfassung. Die Verwendung unterschiedlicher Quellen wie Crowdsourcing, Daten aus verschiedenen geografischen Regionen und die Generierung synthetischer Daten verringern Verzerrungen und helfen den Modellen, reale Szenarien zu bewältigen. Sobald die Daten erfasst sind, ist die Vorverarbeitung entscheidend. Techniken wie die Normalisierung, bei der die Pixelwerte auf einen einheitlichen Bereich skaliert werden, und die Augmentation, bei der Transformationen wie Drehen, Spiegeln und Zoomen angewendet werden, verbessern den Datensatz. Diese Schritte tragen dazu bei, dass Ihr Modell besser verallgemeinert und robuster wird, wodurch das Risiko einer Überanpassung verringert wird.

Ein weiterer wichtiger Schritt ist die korrekte Aufteilung der Datensätze. Ein gängiger Ansatz besteht darin, 70 % der Daten für das Training, 15 % für die Validierung und 15 % für die Tests zu verwenden. Die doppelte Überprüfung, dass es keine Überschneidungen zwischen diesen Datensätzen gibt, verhindert Datenverluste und gewährleistet eine genaue Modellbewertung.

__wf_reserved_inherit
Abbildung 4. Eine gemeinsame Datenaufteilung zwischen Training, Validierung und Test.

Sie können auch vortrainierte Modelle wie YOLO11 verwenden, um Zeit und Rechenressourcen zu sparen. YOLO11 wurde auf großen Datensätzen trainiert und für verschiedene Bildverarbeitungsaufgaben entwickelt und kann auf Ihren spezifischen Datensatz abgestimmt werden, um Ihre Anforderungen zu erfüllen. Durch die Anpassung des Modells an Ihre Daten können Sie eine Überanpassung vermeiden und eine starke Leistung beibehalten. 

Der künftige Weg für Computer-Vision-Datensätze

Die KI-Gemeinschaft hat sich traditionell auf die Verbesserung der Leistung konzentriert, indem sie tiefere Modelle mit mehr Schichten erstellt hat. Mit der weiteren Entwicklung der KI verlagert sich der Schwerpunkt jedoch von der Optimierung der Modelle auf die Verbesserung der Qualität der Datensätze. Andrew Ng, der oft als "Vater der KI" bezeichnet wird, ist der Ansicht, dass "der wichtigste Wandel, den die KI-Welt in diesem Jahrzehnt vollziehen muss, die Umstellung auf datenzentrierte KI sein wird". 

Bei diesem Ansatz liegt der Schwerpunkt auf der Verfeinerung von Datensätzen durch Verbesserung der Beschriftungsgenauigkeit, Entfernung verrauschter Beispiele und Gewährleistung der Vielfalt. Für die Computer Vision sind diese Prinzipien entscheidend, um Probleme wie Verzerrungen und minderwertige Daten zu beseitigen, damit die Modelle in realen Szenarien zuverlässig funktionieren.

Mit Blick auf die Zukunft wird sich die Weiterentwicklung des maschinellen Sehens auf die Erstellung kleinerer, qualitativ hochwertiger Datensätze stützen, anstatt riesige Datenmengen zu sammeln. Andrew Ng meint: "Die Verbesserung von Daten ist kein einmaliger Vorverarbeitungsschritt, sondern ein zentraler Bestandteil des iterativen Prozesses der Entwicklung von Modellen für maschinelles Lernen. Durch die Konzentration auf datenzentrierte Prinzipien wird die maschinelle Bildverarbeitung weiterhin zugänglicher, effizienter und wirkungsvoller für verschiedene Branchen werden.

Die wichtigsten Erkenntnisse

Daten spielen während des gesamten Lebenszyklus eines Bildverarbeitungsmodells eine entscheidende Rolle. Von der Datenerfassung über die Vorverarbeitung, das Training, die Validierung und das Testen wirkt sich die Qualität der Daten direkt auf die Leistung und Zuverlässigkeit des Modells aus. Indem wir qualitativ hochwertige Daten und genaue Beschriftungen in den Vordergrund stellen, können wir robuste Computer-Vision-Modelle erstellen, die zuverlässige und präzise Ergebnisse liefern. 

Auf dem Weg in eine datengesteuerte Zukunft ist es von entscheidender Bedeutung, ethische Überlegungen anzustellen, um Risiken im Zusammenhang mit Befangenheit und Datenschutzbestimmungen zu mindern. Letztlich ist die Gewährleistung der Integrität und Fairness der Daten der Schlüssel zur Erschließung des vollen Potenzials der Bildverarbeitungstechnologien.

Werden Sie Mitglied unserer Community und besuchen Sie unser GitHub-Repository, um mehr über KI zu erfahren. Auf unseren Lösungsseiten finden Sie weitere KI-Anwendungen in Bereichen wie Landwirtschaft und Fertigung.

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert