Vision-KI

Aktives Lernen beschleunigt die Computer-Vision-Entwicklung

Erfahre, wie aktives Lernen in der Computer Vision eingesetzt wird, um den Annotationsaufwand zu minimieren, und erkunde seine realen Anwendungen in verschiedenen Branchen.

ABAbirami Vina

3 min readJanuary 23, 2025

Aktives Lernen beschleunigt die Computer-Vision-Entwicklung

Das Training eines Computer-Vision-Modells ist ein wenig so, als würde man einem Kind beibringen, Farben zu erkennen. Zuerst benötigst du eine Sammlung farbiger Objekte. Dann leitest du das Kind an, jede Farbe korrekt zu identifizieren – eine Aufgabe, die oft sowohl zeitaufwendig als auch repetitiv ist.

Genau wie ein Kind viele Beispiele braucht, um zu lernen, benötigt ein Vision-Modell einen großen Satz gelabelter Daten, um Muster und Objekte in Bildern zu erkennen. Das Labeln riesiger Datenmengen erfordert jedoch viel Zeit, Mühe und Ressourcen. Techniken wie aktives Lernen können helfen, diesen Prozess zu vereinfachen.

Aktives Lernen ist ein schrittweiser Prozess, bei dem die wichtigsten Daten aus einem großen Datensatz ausgewählt und gelabelt werden. Das Modell lernt aus diesen gelabelten Daten, wodurch es genauer und effektiver wird. Die Konzentration auf nur die wertvollsten Daten reduziert den Labeling-Aufwand und beschleunigt die Modellentwicklung.

In diesem Artikel betrachten wir, wie aktives Lernen beim Modelltraining hilft, Labeling-Kosten senkt und die Gesamtgenauigkeit des Modells verbessert.

Link to this sectionBilddatensätze sind nicht einfach zu erstellen#

Datensätze sind das Fundament für Computer-Vision- und Deep-Learning-Modelle. Beliebte Datensätze wie ImageNet bieten Millionen von Bildern mit vielfältigen Objektkategorien. Das Erstellen und Pflegen solch riesiger Mengen an hochwertigen Datensätzen bringt jedoch verschiedene Herausforderungen mit sich.

Das Sammeln und Labeln von Daten erfordert beispielsweise Zeit, Ressourcen und qualifizierte Annotatoren, was den Prozess je nach spezifischer Anwendung schwierig macht. Innovative und effizientere Lösungen werden benötigt, um mit der steigenden Nachfrage nach Bilddatensätzen Schritt zu halten, und genau das will aktives Lernen lösen.

Aktives Lernen bietet eine perfekte Lösung, indem es den Daten-Labeling-Prozess optimiert. Durch die strategische Auswahl der informativsten Datenpunkte zur Annotation maximiert aktives Lernen die Modellleistung bei gleichzeitiger Minimierung des Labeling-Aufwands.

Link to this sectionWas ist aktives Lernen?#

Aktives Lernen ist eine iterative Machine-Learning-Technik, bei der das Modell aus einem großen Pool ungelabelter Daten die wichtigsten Datenpunkte zum Labeln auswählt. Diese ausgewählten Datenpunkte werden manuell gelabelt und dem Trainingsdatensatz hinzugefügt.

Das Modell wird dann mit dem aktualisierten Datensatz neu trainiert und wählt die nächsten Datenpunkte für das Labeling aus. Dieser Prozess wiederholt sich, wobei sich das Modell kontinuierlich verbessert, indem es sich auf die informativsten Datenpunkte konzentriert. Der Zyklus geht so lange weiter, bis das Modell entweder die gewünschte Genauigkeit erreicht oder die vorab festgelegten Labeling-Kriterien erfüllt.

Ein Überblick über Active Learning

Abb. 1. Ein Überblick über aktives Lernen.

Link to this sectionVerständnis der Funktionsweise von aktivem Lernen#

Du fragst dich vielleicht, wie die Technik des aktiven Lernens entscheidet, welche Datenpunkte manuelles Labeling erfordern und welche als Nächstes gelabelt werden sollen. Lass uns die Funktionsweise von aktivem Lernen am Vergleich mit der Vorbereitung auf einen Test verdeutlichen: Du konzentrierst dich auf Themen, bei denen du dir unsicher bist, und stellst gleichzeitig sicher, dass du eine Vielzahl von Themen abdeckst, um gut vorbereitet zu sein.

Für den anfänglichen Datenauswahlprozess verwendet aktives Lernen Strategien wie Unsicherheits-Sampling und Vielfalts-basiertes Sampling. Unsicherheits-Sampling priorisiert Datenpunkte, bei denen das Modell am wenigsten zuversichtlich in seinen Vorhersagen ist, mit dem Ziel, die Genauigkeit in schwierigen Fällen zu verbessern. Vielfalts-basiertes Sampling wählt Datenpunkte aus, die ein breites Spektrum an Merkmalen abdecken, wodurch sichergestellt wird, dass das Modell durch die Konfrontation mit vielfältigen Beispielen gut auf unbekannte Daten generalisiert.

Unsicherheits-Sampling auf der linken Seite und diversitätsbasiertes Sampling auf der rechten Seite

Abb. 2. Unsicherheits-Sampling (links) und Vielfalts-basiertes Sampling (rechts).

Nach der ersten Datenauswahl nutzt aktives Lernen zwei Hauptansätze für das Labeling: Pool-basiertes Sampling und Stream-basiertes Sampling. Sie ähneln der Art und Weise, wie ein Lehrer einen Schüler dabei unterstützt, sich auf das Wichtigste zu konzentrieren.

Beim Pool-basierten Sampling durchsucht das Modell einen großen Pool ungelabelter Daten und wählt die schwierigsten oder informativsten Beispiele zum Labeln aus, ähnlich wie ein Schüler, der die Lernkarten priorisiert, die er am schwierigsten findet. Beim Stream-basierten Sampling verarbeitet das Modell Daten, sobald sie eintreffen, und entscheidet, ob es sie labelt oder überspringt – vergleichbar mit einem Schüler, der nur dann um Hilfe bittet, wenn er feststeckt. In beiden Fällen werden die gelabelten Daten zum Trainingsset hinzugefügt, und das Modell trainiert sich neu, wodurch es sich mit jeder Iteration stetig verbessert.

Link to this sectionErkundung der Anwendungen von aktivem Lernen#

Aktives Lernen spielt eine Schlüsselrolle bei Computer-Vision-Anwendungen, wie etwa in der medizinischen Bildgebung oder beim autonomen Fahren, indem es die Modellgenauigkeit verbessert und den Daten-Labeling-Prozess rationalisiert. Ein interessantes Beispiel hierfür sind Computer-Vision-Modelle, die in selbstfahrenden Autos verwendet werden, um Fußgänger oder Objekte bei schlechten Lichtverhältnissen oder Nebel zu erkennen. Aktives Lernen kann die Genauigkeit erhöhen, indem es sich auf vielfältige und schwierige Fahrszenarien konzentriert.

Speziell kann aktives Lernen eingesetzt werden, um unsichere Daten oder Frames aus solchen Szenarien für ein selektives Labeling zu identifizieren. Das Hinzufügen dieser gelabelten Beispiele zum Trainingsset verbessert die Fähigkeit des Modells, Fußgänger und Objekte in schwierigen Umgebungen zu erkennen, wie etwa bei widrigen Wetterbedingungen oder bei Nachtfahrten.

NVIDIA hat beispielsweise aktives Lernen eingesetzt, um die Erkennung von Fußgängern bei Nacht in seinen Modellen für autonomes Fahren zu verbessern. Durch die strategische Auswahl der informativsten Daten für das Training, insbesondere in schwierigen Szenarien, steigt die Leistung des Modells erheblich.

Erkennung eines Fußgängers mit Regenschirm mittels Active Learning

Abb. 3. Erkennung eines Fußgängers mit Regenschirm unter Verwendung von aktivem Lernen.

Link to this sectionAktives Lernen kann Labeling-Kosten reduzieren#

Ein weiterer zentraler Aspekt des aktiven Lernens ist das Potenzial, Labeling-Kosten zu senken. Dies erreicht es, indem es sich nur auf die wichtigsten Datenpunkte konzentriert, anstatt Annotationen für den gesamten Datensatz zu erfordern. Dieser gezielte Ansatz spart Zeit, Aufwand und Geld. Durch die Konzentration auf unsichere oder vielfältige Stichproben reduziert aktives Lernen die Anzahl der benötigten Annotationen und erhält gleichzeitig eine hohe Modellgenauigkeit aufrecht.

Tatsächlich zeigen Forschungsergebnisse, dass aktives Lernen Labeling-Kosten um 40-60% senken kann, ohne dabei die Leistung zu beeinträchtigen. Dies ist besonders hilfreich in Branchen wie dem Gesundheitswesen und der Fertigung, in denen das Labeln von Daten kostspielig ist. Durch die Vereinfachung des Annotationsprozesses hilft aktives Lernen Unternehmen dabei, Modelle schneller zu entwickeln und effizienter bereitzustellen, während die Genauigkeit gewahrt bleibt.

Link to this sectionVorteile von aktivem Lernen#

Hier sind einige der weiteren Hauptvorteile, die aktives Lernen bieten kann:

Adressierung von Klassenungleichgewicht: Aktives Lernen kann helfen, Probleme mit Klassenungleichgewicht zu beheben, indem Instanzen aus Minderheiten-Datenklassen gelabelt werden. Das Modell kann bei seltenen Szenarien mit begrenzten Daten eine bessere Leistung erbringen.
Schnellere Entwicklungszyklen: Weniger Daten zu labeln bedeutet indirekt eine Beschleunigung des Entwicklungsprozesses für Machine-Learning- und Computer-Vision-Modelle, was mehr Zeit und Ressourcen für zusätzliche Iterationen und Experimente lässt.
Anpassungsfähigkeit: Es kann Trainingsdaten kontinuierlich verbessern, indem es auf unsicheren oder Grenzfall-Stichproben iteriert, was es gut geeignet für dynamische oder sich entwickelnde Datensätze macht.

Link to this sectionAktives Lernen und AutoML können zusammenarbeiten#

Automated Machine Learning (AutoML) konzentriert sich darauf, die zeitaufwendigen und iterativen Aufgaben beim Aufbau und der Bereitstellung von Machine-Learning-Modellen zu automatisieren. Es vereinfacht Machine-Learning-Workflows durch die Automatisierung von Aufgaben wie Modellauswahl und Leistungsbewertung, um den manuellen Aufwand zu reduzieren.

Bei der Integration mit aktivem Lernen kann AutoML den Lebenszyklus der Modellentwicklung beschleunigen und optimieren. Die Komponente des aktiven Lernens wählt strategisch die informativsten Datenpunkte zum Labeln aus, während AutoML das Modell durch die Automatisierung der Wahl von Architektur, Parametern und Feinabstimmung verfeinert.

AutoML-Workflow

Abb. 4. AutoML-Workflow.

Lass uns diese Kombination von Technologien anhand eines Beispiels nachvollziehen.

Angenommen, du versuchst, seltene Erkrankungen in der medizinischen Bildgebung zu erkennen (ein Anwendungsfall, in dem gelabelte Datensätze begrenzt und teuer zu beschaffen sind). Aktives Lernen kann unsichere Daten identifizieren und auswählen, wie etwa subtile Veränderungen in Röntgenbildern, die das Modell nicht korrekt klassifizieren kann. Dann können die unsicheren Daten für eine manuelle Annotation priorisiert werden, um das Modellverständnis zu verbessern.

Mit den annotierten Daten kann AutoML das Modell optimieren, indem es verschiedene Architekturen, Hyperparameter und andere Datenerweiterungstechniken erkundet. Der iterative Prozess beschleunigt die Entwicklung zuverlässiger Vision-Modelle wie Ultralytics YOLO11, die Fachkräfte im Gesundheitswesen bei präzisen Diagnosen unterstützen.

Link to this sectionHerausforderungen von aktivem Lernen#

Aktives Lernen und seine Techniken bieten zahlreiche Vorteile, aber bei der Implementierung dieser Strategien gibt es einige Überlegungen zu beachten:

Auswahl der Abfragestrategie: Aktives Lernen umfasst viele Techniken, und die Wahl der besten Methode hat einen erheblichen Einfluss auf die Effektivität des Modells. Die Wahl einer ungeeigneten Strategie kann die Leistung des Modells für eine spezifische Anwendung verringern.
Retraining-Kosten: Die iterative Natur des aktiven Lernens erfordert teure Rechenressourcen, insbesondere bei großen Datensätzen. Das Modell wird nach jeder Labeling-Runde neu trainiert, was seine Komplexität erhöht.
Qualität des Ausgangsmodells: Die Effektivität des aktiven Lernens hängt von der Qualität des Ausgangsmodells ab. Ein schlecht funktionierendes Ausgangsmodell erkennt möglicherweise nicht präzise die informativen Datenpunkte, was zu minderwertigen Label-Anfragen und einer verringerten Gesamtleistung führt.

Link to this sectionDer Weg nach vorne für aktives Lernen und AutoML#

Mit den jüngsten Fortschritten in KI und Computer-Vision ist aktives Lernen bereit, komplexere Herausforderungen anzugehen und Machine-Learning-Workflows zu rationalisieren. Die Kombination von aktivem Lernen mit Techniken wie Federated Learning und selbstüberwachtem Lernen kann die Effizienz und Skalierbarkeit von Vision-Modellen weiter steigern.

Federated Learning ermöglicht es, ein Modell über mehrere Geräte oder Server mit einem verteilten Framework zu trainieren, ohne dass Daten ihren ursprünglichen Standort verlassen müssen. In Branchen wie dem Gesundheitswesen, in denen Datenschutz wichtig ist, ermöglicht Federated Learning das Training direkt auf sensiblen lokalen Daten, während diese sicher bleiben. Anstatt Rohdaten zu teilen, werden nur Modellaktualisierungen oder Erkenntnisse ausgetauscht, wodurch sichergestellt wird, dass private Informationen geschützt bleiben, während sie dennoch zum Trainingsprozess beitragen.

Währenddessen hilft selbstüberwachtes Lernen, den Bedarf an gelabelten Daten zu reduzieren, indem Modelle auf ungelabelten Daten vortrainiert werden. Dieser Prozess schafft eine solide Basis für das Modell. Aktives Lernen kann darauf aufbauen, indem es die wichtigsten Datenpunkte für die menschliche Annotation identifiziert und auswählt, um das Modell weiter zu verfeinern.

Link to this sectionVom aktiven Lernen zur aktiven Wirkung#

Aktives Lernen bietet einen praktischen Weg, um große Herausforderungen in der Computer-Vision zu bewältigen, wie die hohen Kosten der Datenannotation und den Bedarf an genaueren Modellen. Durch die Konzentration darauf, nur die wertvollsten Datenpunkte zu labeln, reduziert es den Aufwand für Menschen und steigert gleichzeitig die Leistung des Modells.

In Kombination mit Technologien wie AutoML rationalisiert aktives Lernen die Modellentwicklung durch die Automatisierung zeitaufwendiger Aufgaben. Mit fortschreitender Entwicklung wird aktives Lernen zu einem unverzichtbaren Werkzeug für den Aufbau intelligenterer und effizienterer Computer-Vision-Systeme.

Erkunde unser GitHub-Repository und tritt unserer Community bei, um mehr über KI- und Computer-Vision-Modelle zu erfahren. Entdecke weitere Anwendungen von Computer-Vision in der Fertigung und im Gesundheitswesen auf unseren Lösungsseiten. Du kannst auch unsere Lizenzoptionen prüfen, um noch heute deine Vision-KI-Reise zu beginnen.

Explore solutions

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Aktives Lernen beschleunigt die Computer-Vision-Entwicklung

Link to this sectionBilddatensätze sind nicht einfach zu erstellen#

Link to this sectionWas ist aktives Lernen?#

Link to this sectionVerständnis der Funktionsweise von aktivem Lernen#

Link to this sectionErkundung der Anwendungen von aktivem Lernen#

Link to this sectionAktives Lernen kann Labeling-Kosten reduzieren#

Link to this sectionVorteile von aktivem Lernen#

Link to this sectionAktives Lernen und AutoML können zusammenarbeiten#

Link to this sectionHerausforderungen von aktivem Lernen#

Link to this sectionDer Weg nach vorne für aktives Lernen und AutoML#

Link to this sectionVom aktiven Lernen zur aktiven Wirkung#

Explore solutions

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

KI in der Robotik

KI in der Logistik

KI im Einzelhandel

KI im Gesundheitswesen

KI in der Fertigung

KI in der Automobilbranche

KI in der Landwirtschaft

Lass uns gemeinsam die Zukunft der KI bauen!