Aktives Lernen beschleunigt die Entwicklung von Computer Vision

Abirami Vina

3 Minuten lesen

23. Januar 2025

Erfahren Sie, wie aktives Lernen in der Computer Vision eingesetzt wird, um den Aufwand für die Beschriftung zu minimieren, und erkunden Sie die realen Anwendungen in verschiedenen Branchen.

Das Trainieren eines Computer-Vision-Modells ist vergleichbar damit, einem Kind beizubringen, Farben zu erkennen. Zunächst benötigt man eine Sammlung von farbigen Objekten. Dann muss man das Kind anleiten, jede Farbe richtig zu erkennen - eine Aufgabe, die oft zeitaufwändig ist und sich ständig wiederholt.

So wie ein Kind viele Beispiele braucht, um zu lernen, benötigt ein Bildverarbeitungsmodell eine große Menge an beschrifteten Daten, um Muster und Objekte in Bildern zu erkennen. Die Kennzeichnung großer Datenmengen ist jedoch sehr zeit- und arbeitsaufwändig, von den Ressourcen ganz zu schweigen. Techniken wie aktives Lernen können helfen, diesen Prozess zu vereinfachen.

Aktives Lernen ist ein schrittweiser Prozess, bei dem die wichtigsten Daten aus einem großen Datensatz ausgewählt und beschriftet werden. Das Modell lernt anhand dieser beschrifteten Daten und wird dadurch genauer und effektiver. Durch die Konzentration auf die wertvollsten Daten wird der Umfang der erforderlichen Kennzeichnung reduziert und die Entwicklung des Modells beschleunigt.

In diesem Artikel werden wir einen Blick darauf werfen, wie aktives Lernen bei der Modellschulung hilft, die Beschriftungskosten reduziert und die Gesamtgenauigkeit des Modells verbessert.

Bilddatensätze sind nicht einfach zu erstellen

Datensätze sind die Grundlage für Computer Vision und Deep-Learning-Modelle. Beliebte Datensätze wie ImageNet bieten Millionen von Bildern mit verschiedenen Objektkategorien. Die Erstellung und Pflege solch großer Mengen an hochwertigen Datensätzen ist jedoch mit verschiedenen Herausforderungen verbunden. 

Das Sammeln und Beschriften von Daten erfordert beispielsweise Zeit, Ressourcen und qualifizierte Kommentatoren, was den Prozess je nach Anwendungsfall zu einer Herausforderung macht. Um mit der steigenden Nachfrage nach Bilddaten Schritt zu halten, sind innovative und effizientere Lösungen erforderlich, und genau darauf zielt aktives Lernen ab. 

Aktives Lernen bietet eine perfekte Lösung, indem es den Prozess der Datenbeschriftung optimiert. Durch die strategische Auswahl der informativsten Datenpunkte für die Beschriftung maximiert aktives Lernen die Modellleistung und minimiert gleichzeitig den Beschriftungsaufwand. 

Was ist aktives Lernen?

Aktives Lernen ist eine iterative Technik des maschinellen Lernens, bei der das Modell aus einem großen Pool unbeschrifteter Daten die wichtigsten zu beschriftenden Datenpunkte heraussucht. Diese ausgewählten Datenpunkte werden manuell beschriftet und dem Trainingsdatensatz hinzugefügt. 

Das Modell wird dann anhand des aktualisierten Datensatzes neu trainiert und wählt den nächsten Satz von Datenpunkten zur Kennzeichnung aus. Dieser Prozess wiederholt sich, wobei sich das Modell kontinuierlich verbessert, indem es sich auf die informativsten Datenpunkte konzentriert. Der Zyklus wird so lange fortgesetzt, bis das Modell entweder die gewünschte Genauigkeit erreicht oder die im Voraus festgelegten Beschriftungskriterien erfüllt.

__wf_reserved_inherit
Abbildung 1. Ein Überblick über das aktive Lernen.

Verstehen, wie aktives Lernen funktioniert

Sie fragen sich vielleicht, wie die aktive Lerntechnik entscheidet, welche Datenpunkte manuell beschriftet werden müssen und welche als nächstes beschriftet werden. Um zu verstehen, wie aktives Lernen funktioniert, vergleichen Sie es mit dem Lernen für eine Prüfung - Sie konzentrieren sich auf Themen, bei denen Sie unsicher sind, und stellen sicher, dass Sie eine Vielzahl von Themen abdecken, um gut vorbereitet zu sein.

Für die anfänglichen Datenauswahlprozesse werden beim aktiven Lernen Strategien wie das Uncertainty Sampling und das Diversity-based Sampling eingesetzt. Beim Uncertainty Sampling werden vorrangig Datenpunkte ausgewählt, bei denen das Modell am wenigsten Vertrauen in seine Vorhersagen hat, um die Genauigkeit in schwierigen Fällen zu verbessern. Beim diversitätsbasierten Sampling werden Datenpunkte ausgewählt, die ein breites Spektrum an Merkmalen abdecken, um sicherzustellen, dass das Modell gut auf ungesehene Daten verallgemeinert werden kann, indem es verschiedenen Beispielen ausgesetzt wird.

__wf_reserved_inherit
Abbildung 2. Uncertainty Sampling (links) und Diversity-based Sampling (rechts).

Nach der anfänglichen Datenauswahl verwendet aktives Lernen zwei Hauptansätze für die Kennzeichnung: Pool-basiertes Sampling und Stream-basiertes Sampling, ähnlich wie ein Lehrer einem Schüler hilft, sich auf das Wichtigste zu konzentrieren. 

Beim poolbasierten Sampling durchsucht das Modell einen großen Pool unbeschrifteter Daten und wählt die schwierigsten oder informativsten Beispiele aus, um sie zu beschriften, ähnlich wie ein Schüler die Lernkarten priorisiert, die er am schwierigsten findet. Beim strombasierten Sampling verarbeitet das Modell die eintreffenden Daten und entscheidet, ob sie beschriftet oder übersprungen werden sollen, ähnlich wie ein Schüler nur dann um Hilfe bittet, wenn er nicht weiterkommt. In beiden Fällen werden die beschrifteten Daten dem Trainingssatz hinzugefügt, und das Modell trainiert sich selbst neu, wobei es sich mit jeder Iteration stetig verbessert.

Erforschung von Anwendungen des aktiven Lernens

Aktives Lernen spielt eine Schlüsselrolle bei Bildverarbeitungsanwendungen, z. B. in der medizinischen Bildgebung und beim autonomen Fahren, da es die Modellgenauigkeit verbessert und den Prozess der Datenbeschriftung rationalisiert. Ein interessantes Beispiel hierfür sind Computer-Vision-Modelle, die in selbstfahrenden Autos verwendet werden, um Fußgänger oder Objekte bei schlechten Lichtverhältnissen oder Nebel zu erkennen. Aktives Lernen kann die Genauigkeit verbessern, indem es sich auf unterschiedliche und anspruchsvolle Fahrszenarien konzentriert. 

Insbesondere kann aktives Lernen verwendet werden, um unsichere Daten oder Bilder aus solchen Szenarien für eine selektive Kennzeichnung zu identifizieren. Durch die Hinzufügung dieser beschrifteten Beispiele zum Trainingssatz kann das Modell Fußgänger und Objekte in schwierigen Umgebungen, wie z. B. bei schlechtem Wetter oder bei Nachtfahrten, besser erkennen.

So hat NVIDIA beispielsweise aktives Lernen eingesetzt, um die Erkennung von Fußgängern bei Nacht in seinen selbstfahrenden Modellen zu verbessern. Durch die strategische Auswahl der informativsten Daten für das Training, insbesondere in schwierigen Szenarien, wird die Leistung des Modells erheblich gesteigert.

__wf_reserved_inherit
Abb. 3. Erkennung eines Fußgängers mit Regenschirm durch aktives Lernen.

Aktives Lernen kann die Etikettierungskosten senken

Ein weiterer wichtiger Aspekt des aktiven Lernens ist die Möglichkeit, die Kosten für die Beschriftung zu senken. Dies wird erreicht, indem man sich nur auf die wichtigsten Datenpunkte konzentriert, anstatt Anmerkungen für den gesamten Datensatz zu benötigen. Dieser gezielte Ansatz spart Zeit, Mühe und Geld. Durch die Fokussierung auf unsichere oder unterschiedliche Stichproben reduziert aktives Lernen die Anzahl der erforderlichen Beschriftungen und gewährleistet gleichzeitig eine hohe Modellgenauigkeit.

Untersuchungen haben gezeigt, dass aktives Lernen die Kosten für die Etikettierung um 40-60 % senken kann, ohne die Leistung zu beeinträchtigen. Dies ist besonders hilfreich in Branchen wie dem Gesundheitswesen und der Fertigung, wo die Beschriftung von Daten kostspielig ist. Durch die Vereinfachung des Beschriftungsprozesses hilft aktives Lernen den Unternehmen, Modelle schneller zu entwickeln und sie effizienter einzusetzen, ohne dass die Genauigkeit beeinträchtigt wird.

Vorteile des aktiven Lernens

Hier einige weitere wichtige Vorteile, die aktives Lernen bieten kann:

  • Beseitigung von Klassenungleichgewichten: Aktives Lernen kann dazu beitragen, Probleme des Klassenungleichgewichts zu lösen, indem Instanzen aus Minderheitsklassen von Daten gekennzeichnet werden. Das Modell kann in seltenen Szenarien mit begrenzten Daten besser abschneiden.
  • Schnellere Entwicklungszyklen: Weniger Daten zu beschriften bedeutet indirekt, den Entwicklungsprozess von Modellen für maschinelles Lernen und Computer Vision zu beschleunigen, was mehr Zeit und Ressourcen für zusätzliche Iterationen und Experimente ermöglicht.
  • Anpassungsfähigkeit: Es kann die Trainingsdaten kontinuierlich verbessern, indem es unsichere oder randständige Stichproben iteriert, wodurch es sich gut für dynamische oder sich entwickelnde Datensätze eignet.

Aktives Lernen und AutoML können zusammenarbeiten

Automatisiertes maschinelles Lernen (AutoML) konzentriert sich auf die Automatisierung der zeitaufwändigen und iterativen Aufgaben, die mit der Erstellung und dem Einsatz von Modellen für maschinelles Lernen verbunden sind. Es vereinfacht die Arbeitsabläufe beim maschinellen Lernen, indem es Aufgaben wie die Modellauswahl und die Leistungsbewertung automatisiert, um den manuellen Aufwand zu verringern. 

Durch die Integration mit aktivem Lernen kann AutoML den Lebenszyklus der Modellentwicklung beschleunigen und optimieren. Die Komponente für aktives Lernen wählt strategisch die informativsten Datenpunkte für die Beschriftung aus, während AutoML das Modell durch die Automatisierung der Auswahl von Architektur, Parametern und Abstimmung verfeinert.

__wf_reserved_inherit
Abbildung 4. AutoML-Arbeitsablauf.

Wir wollen diese Kombination von Technologien anhand eines Beispiels erläutern. 

Nehmen wir an, Sie versuchen, seltene Erkrankungen in der medizinischen Bildgebung zu erkennen (ein Anwendungsfall, bei dem beschriftete Datensätze begrenzt und teuer zu beschaffen sind). Aktives Lernen kann unsichere Daten identifizieren und auswählen, wie z. B. subtile Veränderungen in Röntgenbildern, die das Modell nicht klassifizieren kann. Anschließend können die unsicheren Daten für manuelle Anmerkungen priorisiert werden, um das Modellverständnis zu verbessern. 

Anhand der kommentierten Daten kann AutoML das Modell optimieren, indem es verschiedene Architekturen, Hyperparameter und andere Techniken zur Datenerweiterung untersucht. Der iterative Prozess beschleunigt die Entwicklung von zuverlässigen Bildgebungsmodellen wie Ultralytics YOLO11, die medizinischen Fachkräften helfen, genaue Diagnosen zu stellen.

Herausforderungen des aktiven Lernens

Aktives Lernen und seine Techniken bieten zahlreiche Vorteile, aber es gibt einige Überlegungen, die bei der Umsetzung dieser Strategien zu beachten sind:

  • Auswahl der Abfragestrategie: Aktives Lernen umfasst viele Techniken, und die Wahl der besten Methode hat erhebliche Auswirkungen auf die Effektivität des Modells. Die Wahl einer ungeeigneten Strategie kann die Leistung des Modells für eine bestimmte Anwendung verringern.
  • Umlernkosten: Die iterative Natur des aktiven Lernens erfordert teure Rechenressourcen, insbesondere bei großen Datensätzen. Das Modell wird nach jeder Beschriftungsrunde neu trainiert, was seine Komplexität erhöht.
  • Qualität des Ausgangsmodells: Die Wirksamkeit des aktiven Lernens hängt von der Qualität des Ausgangsmodells ab. Ein schlechtes Ausgangsmodell kann die informativen Datenpunkte nicht genau identifizieren, was zu unzureichenden Kennzeichnungsanforderungen und einer geringeren Gesamtleistung führt.

Die Zukunft des aktiven Lernens und von AutoML

Mit den jüngsten Fortschritten in den Bereichen KI und Computer Vision wird aktives Lernen immer komplexere Herausforderungen bewältigen und die Arbeitsabläufe beim maschinellen Lernen optimieren. Die Kombination von aktivem Lernen mit Techniken wie föderiertem Lernen und selbstüberwachtem Lernen kann die Effizienz und Skalierbarkeit von Bildverarbeitungsmodellen weiter verbessern. 

Föderiertes Lernen ermöglicht das Trainieren eines Modells auf mehreren Geräten oder Servern mit einem verteilten Rahmen, ohne dass die Daten ihren ursprünglichen Standort verlassen müssen. In Branchen wie dem Gesundheitswesen, in denen der Datenschutz eine wichtige Rolle spielt, ermöglicht das föderierte Lernen ein direktes Training auf sensiblen lokalen Daten, ohne dass diese Daten verloren gehen. Anstatt Rohdaten zu teilen, werden nur Modellaktualisierungen oder Erkenntnisse geteilt, wodurch sichergestellt wird, dass private Informationen geschützt bleiben und dennoch zum Trainingsprozess beitragen.

Selbstüberwachtes Lernen trägt dazu bei, den Bedarf an gekennzeichneten Daten zu verringern, indem Modelle anhand von nicht gekennzeichneten Daten vortrainiert werden. Dieser Prozess schafft eine solide Grundlage für das Modell. Aktives Lernen kann dann darauf aufbauen, indem es die wichtigsten Datenpunkte für menschliche Anmerkungen identifiziert und auswählt und das Modell weiter verfeinert.

Vom aktiven Lernen zur aktiven Wirkung

Aktives Lernen ist ein praktischer Weg, um große Herausforderungen in der Computer Vision zu bewältigen, wie z. B. die hohen Kosten für die Datenbeschriftung und den Bedarf an genaueren Modellen. Indem es sich darauf konzentriert, nur die wertvollsten Datenpunkte zu beschriften, reduziert es den Aufwand für den Menschen und steigert gleichzeitig die Leistung des Modells.

In Kombination mit Technologien wie AutoML wird die Modellentwicklung durch die Automatisierung zeitaufwändiger Aufgaben rationalisiert. Mit weiteren Fortschritten wird aktives Lernen zu einem unverzichtbaren Werkzeug für die Entwicklung intelligenterer und effizienterer Computer-Vision-Systeme.

Erkunden Sie unser GitHub-Repository und treten Sie unserer Community bei, um mehr über KI und Computer-Vision-Modelle zu erfahren. Entdecken Sie weitere Anwendungen von Computer Vision in der Fertigung und im Gesundheitswesen auf unseren Lösungsseiten. Informieren Sie sich auch über unsere Lizenzierungsoptionen, um noch heute mit Ihrer Vision AI-Reise zu beginnen.

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert