Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

Aktives Lernen beschleunigt die Entwicklung von Computer Vision

Abirami Vina

3 Minuten Lesezeit

23. Januar 2025

Erfahren Sie, wie Active Learning in der Computer Vision eingesetzt wird, um den Aufwand für die Annotation zu minimieren, und entdecken Sie die realen Anwendungen in verschiedenen Branchen.

Das Training eines Computer Vision Modells ist vergleichbar damit, einem Kind Farben beizubringen. Zuerst benötigt man eine Sammlung farbiger Objekte. Dann leitet man das Kind an, jede Farbe korrekt zu identifizieren. Diese Aufgabe ist oft sowohl zeitaufwendig als auch repetitiv.

So wie ein Kind viele Beispiele zum Lernen benötigt, benötigt ein Vision-Modell einen großen Satz gelabelter Daten, um Muster und Objekte in Bildern zu erkennen. Das Labeln großer Datenmengen erfordert jedoch viel Zeit und Mühe, ganz zu schweigen von Ressourcen. Techniken wie Active Learning können helfen, diesen Prozess zu vereinfachen.

Aktives Lernen ist ein schrittweiser Prozess, bei dem die wichtigsten Daten aus einem großen Datensatz ausgewählt und beschriftet werden. Das Modell lernt aus diesen beschrifteten Daten, wodurch es genauer und effektiver wird. Die Konzentration auf die wertvollsten Daten reduziert den Beschriftungsaufwand und beschleunigt die Entwicklung des Modells.

In diesem Artikel werden wir uns ansehen, wie Active Learning beim Modelltraining hilft, die Kosten für die Beschriftung reduziert und die Gesamtgenauigkeit des Modells verbessert.

Es ist nicht einfach, Bilddatensätze zu erstellen

Datensätze sind die Grundlage für Modelle des maschinellen Sehens und des Deep Learning. Beliebte Datensätze wie ImageNet bieten Millionen von Bildern mit verschiedenen Objektkategorien. Die Erstellung und Pflege solch großer Mengen an hochwertigen Datensätzen bringt jedoch verschiedene Herausforderungen mit sich. 

Beispielsweise erfordert das Sammeln und Beschriften von Daten Zeit, Ressourcen und qualifizierte Annotatoren, was den Prozess je nach spezifischer Anwendung zu einer Herausforderung macht. Innovative und effizientere Lösungen sind erforderlich, um mit der steigenden Nachfrage nach Bilddatensätzen Schritt zu halten, und genau das will Active Learning lösen. 

Aktives Lernen bietet eine perfekte Lösung, indem es den Datenbeschriftungsprozess optimiert. Durch die strategische Auswahl der informativsten Datenpunkte für die Annotation maximiert aktives Lernen die Modellleistung und minimiert gleichzeitig den Beschriftungsaufwand. 

Was ist aktives Lernen?

Aktives Lernen ist eine iterative Technik des maschinellen Lernens, bei der das Modell die wichtigsten Datenpunkte aus einem großen Pool unbeschrifteter Daten zur Beschriftung auswählt. Diese ausgewählten Datenpunkte werden manuell beschriftet und dem Trainingsdatensatz hinzugefügt. 

Das Modell wird dann mit dem aktualisierten Datensatz erneut trainiert und wählt den nächsten Satz von Datenpunkten aus, die beschriftet werden sollen. Dieser Prozess wird wiederholt, wobei sich das Modell kontinuierlich verbessert, indem es sich auf die informativsten Datenpunkte konzentriert. Der Zyklus wird fortgesetzt, bis das Modell entweder die gewünschte Genauigkeit erreicht oder die im Voraus festgelegten Beschriftungskriterien erfüllt.

__wf_reserved_inherit
Abb. 1. Eine Übersicht über Active Learning.

Verstehen, wie Active Learning funktioniert

Sie fragen sich vielleicht, wie die Active-Learning-Technik entscheidet, welche Datenpunkte manuell beschriftet werden müssen und welche als nächstes beschriftet werden sollen. Lassen Sie uns verstehen, wie Active Learning funktioniert, indem wir es mit dem Lernen für einen Test vergleichen - Sie konzentrieren sich auf Themen, bei denen Sie sich unsicher sind, und stellen außerdem sicher, dass Sie eine Vielzahl von Themen abdecken, um gut vorbereitet zu sein.

Für den ersten Satz von Datenauswahlprozessen verwendet Active Learning Strategien wie Uncertainty Sampling und Diversity-Based Sampling. Uncertainty Sampling priorisiert Datenpunkte, bei denen das Modell am wenigsten von seinen Vorhersagen überzeugt ist, um die Genauigkeit in schwierigen Fällen zu verbessern. Diversity-Based Sampling wählt Datenpunkte aus, die ein breites Spektrum an Merkmalen abdecken, um sicherzustellen, dass das Modell gut auf ungesehene Daten verallgemeinert, indem es mit verschiedenen Beispielen konfrontiert wird.

__wf_reserved_inherit
Abb. 2. Unsicherheits-Sampling (links) und diversitätsbasiertes Sampling (rechts).

Nach der ersten Datenauswahl verwendet Active Learning zwei Hauptansätze für die Beschriftung: Pool-basiertes Sampling und Stream-basiertes Sampling. Diese ähneln der Art und Weise, wie ein Lehrer einem Schüler hilft, sich auf das Wesentliche zu konzentrieren. 

Beim Pool-basierten Sampling scannt das Modell einen großen Pool ungelabelter Daten und wählt die anspruchsvollsten oder informativsten Beispiele zur Labelung aus, ähnlich wie ein Student die Karteikarten priorisiert, die er am schwierigsten findet. Beim Stream-basierten Sampling verarbeitet das Modell die Daten, sobald sie eintreffen, und entscheidet, ob es sie labeln oder überspringen soll, ähnlich wie ein Student nur dann um Hilfe bittet, wenn er nicht weiterkommt. In beiden Fällen werden die gelabelten Daten dem Trainingsdatensatz hinzugefügt, und das Modell trainiert sich selbst neu und verbessert sich stetig mit jeder Iteration.

Erkundung von Anwendungen des aktiven Lernens

Aktives Lernen spielt eine Schlüsselrolle in Computer-Vision-Anwendungen wie medizinischer Bildgebung und autonomem Fahren, indem es die Modellgenauigkeit verbessert und den Datenbeschriftungsprozess rationalisiert. Ein interessantes Beispiel hierfür sind Computer-Vision-Modelle, die in selbstfahrenden Autos verwendet werden, um Fußgänger oder Objekte bei schlechten Lichtverhältnissen oder Nebel zu erkennen. Aktives Lernen kann die Genauigkeit verbessern, indem es sich auf vielfältige und herausfordernde Fahrszenarien konzentriert. 

Insbesondere kann aktives Lernen verwendet werden, um unsichere Daten oder Frames aus solchen Szenarien für die selektive Kennzeichnung zu identifizieren. Das Hinzufügen dieser gekennzeichneten Beispiele zum Trainingsdatensatz verbessert die Fähigkeit des Modells, Fußgänger und Objekte in schwierigen Umgebungen zu erkennen, z. B. bei widrigen Wetterbedingungen oder bei Nachtfahrten.

Beispielsweise hat NVIDIA Active Learning eingesetzt, um die Erkennung von Fußgängern bei Nacht in seinen Modellen für selbstfahrende Autos zu verbessern. Durch die strategische Auswahl der informativsten Daten für das Training, insbesondere in schwierigen Szenarien, wird die Leistung des Modells erheblich gesteigert.

__wf_reserved_inherit
Abb. 3. Erkennung eines Fußgängers mit Regenschirm durch Active Learning.

Aktives Lernen kann die Kosten für die Beschriftung senken

Ein weiterer wichtiger Aspekt des aktiven Lernens ist sein Potenzial zur Reduzierung der Kennzeichnungskosten. Dies geschieht, indem es sich nur auf die wichtigsten Datenpunkte konzentriert, anstatt Anmerkungen für den gesamten Datensatz zu erfordern. Dieser gezielte Ansatz spart Zeit, Aufwand und Geld. Durch die Konzentration auf unsichere oder vielfältige Stichproben reduziert das aktive Lernen die Anzahl der benötigten Anmerkungen und behält gleichzeitig eine hohe Modellgenauigkeit bei.

Tatsächlich zeigen Forschungsergebnisse, dass aktives Lernen die Beschriftungskosten senken kann, und zwar um 40-60 %, ohne die Leistung zu beeinträchtigen. Dies ist besonders hilfreich in Branchen wie dem Gesundheitswesen und der Fertigung, wo die Beschriftung von Daten kostspielig ist. Durch die Vereinfachung des Annotationsprozesses hilft Active Learning Unternehmen, Modelle schneller zu entwickeln und effizienter bereitzustellen, während die Genauigkeit erhalten bleibt.

Vorteile von Active Learning

Hier sind einige der anderen wichtigen Vorteile, die Active Learning bieten kann:

  • Adressierung von Klassenungleichgewicht: Aktives Lernen kann helfen, Probleme mit Klassenungleichgewicht zu beheben, indem Instanzen aus Minderheiten-Datenklassen gekennzeichnet werden. Das Modell kann bei seltenen Szenarien mit begrenzten Daten besser abschneiden.
  • Schnellere Entwicklungszyklen: Weniger Daten zu kennzeichnen bedeutet indirekt, den Entwicklungsprozess von Modellen für maschinelles Lernen und Computer Vision zu beschleunigen, wodurch mehr Zeit und Ressourcen für zusätzliche Iterationen und Experimente zur Verfügung stehen.
  • Anpassungsfähigkeit: Es kann Trainingsdaten kontinuierlich verbessern, indem es unsichere oder Edge-Case-Beispiele iteriert, wodurch es gut für dynamische oder sich entwickelnde Datensätze geeignet ist.

Aktives Lernen und AutoML können zusammenarbeiten

Automatisiertes maschinelles Lernen (AutoML) konzentriert sich auf die Automatisierung der zeitaufwändigen und iterativen Aufgaben, die mit dem Erstellen und Bereitstellen von Modellen für maschinelles Lernen verbunden sind. Es vereinfacht die Arbeitsabläufe des maschinellen Lernens, indem es Aufgaben wie die Modellauswahl und die Leistungsbewertung automatisiert, um den manuellen Aufwand zu reduzieren. 

In Verbindung mit Active Learning kann AutoML den Modellentwicklungszyklus beschleunigen und optimieren. Die Active-Learning-Komponente wählt strategisch die informativsten Datenpunkte für die Beschriftung aus, während AutoML das Modell durch die Automatisierung der Wahl von Architektur, Parametern und Feinabstimmung verfeinert.

__wf_reserved_inherit
Abb. 4. AutoML-Workflow.

Verstehen wir diese Kombination von Technologien anhand eines Beispiels. 

Nehmen wir an, Sie versuchen, seltene Zustände in der medizinischen Bildgebung zu erkennen (ein Anwendungsfall, in dem beschriftete Datensätze begrenzt und teuer zu beschaffen sind). Active Learning kann unsichere Daten identifizieren und auswählen, wie z. B. subtile Veränderungen in Röntgenbildern, die das Modell nicht klassifizieren kann. Dann können die unsicheren Daten für die manuelle Annotation priorisiert werden, um das Modellverständnis zu verbessern. 

Mit den annotierten Daten kann AutoML das Modell optimieren, indem es verschiedene Architekturen, Hyperparameter und andere Techniken zur Datenaugmentation untersucht. Der iterative Prozess beschleunigt die Entwicklung zuverlässiger Vision-Modelle wie Ultralytics YOLO11, die medizinischem Fachpersonal helfen, genaue Diagnosen zu stellen.

Herausforderungen des aktiven Lernens

Aktives Lernen und seine Techniken bieten zahlreiche Vorteile, aber es gibt ein paar Überlegungen, die bei der Implementierung dieser Strategien zu beachten sind:

  • Auswahl der Abfragestrategie: Aktives Lernen umfasst viele Techniken, und die Wahl der besten Methode hat einen erheblichen Einfluss auf die Effektivität des Modells. Die Wahl einer ungeeigneten Strategie kann die Leistung des Modells für eine bestimmte Anwendung beeinträchtigen.
  • Retrainingskosten: Die iterative Natur des Active Learning erfordert teure Rechenressourcen, insbesondere bei großen Datensätzen. Das Modell wird nach jeder Labeling-Runde neu trainiert, was seine Komplexität erhöht.
  • Anfängliche Modellqualität: Die Effektivität von Active Learning hängt von der Qualität des anfänglichen Modells ab. Ein schlecht funktionierendes anfängliches Modell ist möglicherweise nicht in der Lage, die informativen Datenpunkte genau zu identifizieren, was zu minderwertigen Label-Anfragen und einer insgesamt reduzierten Leistung führt.

Der weitere Weg für aktives Lernen und AutoML

Mit den jüngsten Fortschritten in den Bereichen KI und Computer Vision ist Active Learning bereit, komplexere Herausforderungen anzugehen und Machine-Learning-Workflows zu rationalisieren. Die Kombination von Active Learning mit Techniken wie Federated Learning und Self-Supervised Learning kann die Effizienz und Skalierbarkeit von Vision-Modellen weiter verbessern. 

Federated Learning ermöglicht das Training eines Modells über mehrere Geräte oder Server mit einem verteilten Framework, ohne dass Daten ihren ursprünglichen Speicherort verlassen müssen. In Branchen wie dem Gesundheitswesen, in denen Datenschutz wichtig ist, ermöglicht Federated Learning das direkte Training mit sensiblen lokalen Daten, während diese gleichzeitig geschützt bleiben. Anstatt Rohdaten auszutauschen, werden nur Modellaktualisierungen oder Erkenntnisse weitergegeben, wodurch sichergestellt wird, dass private Informationen geschützt bleiben und gleichzeitig zum Trainingsprozess beigetragen wird.

Unterdessen trägt selbstüberwachtes Lernen dazu bei, den Bedarf an beschrifteten Daten zu reduzieren, indem Modelle auf unbeschrifteten Daten vortrainiert werden. Dieser Prozess schafft eine starke Basis für das Modell. Aktives Lernen kann dann darauf aufbauen, indem es die wichtigsten Datenpunkte für die menschliche Annotation identifiziert und auswählt, wodurch das Modell weiter verfeinert wird.

Vom aktiven Lernen zur aktiven Wirkung

Aktives Lernen bietet eine praktische Möglichkeit, große Herausforderungen im Bereich Computer Vision anzugehen, wie z. B. die hohen Kosten für die Datenannotation und die Notwendigkeit präziserer Modelle. Indem es sich auf die Kennzeichnung der wertvollsten Datenpunkte konzentriert, reduziert es den Aufwand für den Menschen und steigert gleichzeitig die Leistung des Modells.

In Kombination mit Technologien wie AutoML rationalisiert Active Learning die Modellentwicklung, indem es zeitaufwändige Aufgaben automatisiert. Mit den fortschreitenden Entwicklungen wird Active Learning zu einem unverzichtbaren Werkzeug für den Aufbau intelligenterer und effizienterer Computer-Vision-Systeme.

Erkunden Sie unser GitHub-Repository und treten Sie unserer Community bei, um mehr über KI- und Computer-Vision-Modelle zu erfahren. Entdecken Sie auf unseren Lösungsseiten weitere Anwendungen von Computer Vision in der Fertigung und im Gesundheitswesen. Sie können sich auch unsere Lizenzoptionen ansehen, um noch heute mit Ihrer Vision-AI-Reise zu beginnen.

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert