Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024

Grundlagen von Few-Shot-, Zero-Shot- und Transfer Learning

Abirami Vina

5 Min. Lesezeit

29. Januar 2025

Entdecken Sie die Unterschiede zwischen Few-Shot Learning, Zero-Shot Learning und Transfer Learning im Bereich Computer Vision und wie diese Paradigmen das Training von KI-Modellen beeinflussen.

Künstliche Intelligenz (KI)-Systeme können komplexe Aufgaben wie das Erkennen von Gesichtern, das Klassifizieren von Bildern und das Fahren von Autos mit minimalem menschlichen Eingriff bewältigen. Sie tun dies, indem sie Daten studieren, Muster erkennen und diese Muster verwenden, um Vorhersagen zu treffen oder Entscheidungen zu treffen. Mit dem Fortschritt der KI erleben wir immer ausgefeiltere Möglichkeiten, wie KI-Modelle lernen, sich anpassen und Aufgaben mit bemerkenswerter Effizienz ausführen können.

Beispielsweise ist Computer Vision ein Zweig der KI, der sich darauf konzentriert, Maschinen in die Lage zu versetzen, visuelle Informationen aus der Welt zu interpretieren und zu verstehen. Die traditionelle Entwicklung von Computer-Vision-Modellen stützt sich stark auf große, annotierte Datensätze für das Training. Das Sammeln und Beschriften solcher Daten kann zeitaufwendig und kostspielig sein. 

Um diese Herausforderungen zu bewältigen, haben Forscher innovative Ansätze wie Few-Shot Learning (FSL), das aus begrenzten Beispielen lernt, Zero-Shot Learning (ZSL), das ungesehene Objekte identifiziert, und Transfer Learning (TL) eingeführt, das Wissen aus vortrainierten Modellen auf neue Aufgaben anwendet.

In diesem Artikel werden wir untersuchen, wie diese Lernparadigmen funktionieren, ihre wichtigsten Unterschiede hervorheben und reale Anwendungen betrachten. Los geht's!

Ein Überblick über Lernparadigmen

Lassen Sie uns untersuchen, was Few-Shot Learning, Zero-Shot Learning und Transfer Learning in Bezug auf Computer Vision sind und wie sie funktionieren. 

Few-Shot Learning

Few-Shot Learning ist eine Methode, bei der Systeme lernen, neue Objekte anhand einer kleinen Anzahl von Beispielen zu erkennen. Wenn Sie einem Modell beispielsweise ein paar Bilder von einem Pinguin, einem Pelikan und einem Papageientaucher zeigen (diese kleine Gruppe wird als "Support Set" bezeichnet), lernt es, wie diese Vögel aussehen. 

Wenn Sie dem Modell später ein neues Bild zeigen, z. B. einen Pinguin, vergleicht es dieses neue Bild mit den Bildern in seinem Support-Set und wählt die ähnlichste Übereinstimmung aus. Wenn das Sammeln einer großen Datenmenge schwierig ist, ist diese Methode vorteilhaft, da das System auch mit nur wenigen Beispielen lernen und sich anpassen kann.

__wf_reserved_inherit
Abb. 1. Eine Übersicht über die Funktionsweise von Few-Shot Learning.

Zero-Shot-Lernen

Zero-Shot Learning ermöglicht es Maschinen, Dinge zu erkennen, die sie noch nie zuvor gesehen haben, ohne Beispiele dafür zu benötigen. Es verwendet semantische Informationen, wie z. B. Beschreibungen, um Verbindungen herzustellen.

Wenn eine Maschine beispielsweise etwas über Tiere wie Katzen, Löwen und Pferde gelernt hat, indem sie Merkmale wie “klein und flauschig”, “große Wildkatze” oder “langes Gesicht” verstanden hat, kann sie dieses Wissen nutzen, um ein neues Tier, wie einen Tiger, zu identifizieren. Selbst wenn sie noch nie einen Tiger gesehen hat, kann sie eine Beschreibung wie “ein löwenähnliches Tier mit dunklen Streifen” verwenden, um ihn korrekt zu identifizieren. Dies erleichtert es Maschinen, zu lernen und sich anzupassen, ohne viele Beispiele zu benötigen.

__wf_reserved_inherit
Abb. 2. Zero-Shot-Learning identifiziert neue Objekte anhand von Beschreibungen.

Transferlernen

Transfer Learning ist ein Lernparadigma, bei dem ein Modell das, was es aus einer Aufgabe gelernt hat, verwendet, um eine ähnliche, neue Aufgabe zu lösen. Diese Technik ist besonders nützlich bei Computer Vision Aufgaben wie Objekterkennung, Bildklassifizierung und Mustererkennung. 

Beispielsweise kann ein vortrainiertes Modell in Computer Vision allgemeine Objekte wie Tiere erkennen und dann durch Transfer Learning feinabgestimmt werden, um bestimmte Objekte wie verschiedene Hunderassen zu identifizieren. Durch die Wiederverwendung von Wissen aus früheren Aufgaben erleichtert Transfer Learning das Trainieren von Computer-Vision-Modellen auf kleineren Datensätzen, wodurch Zeit und Aufwand gespart werden.

__wf_reserved_inherit
Abb. 3. Eine Übersicht über die Funktionsweise von Transfer Learning.

Sie fragen sich vielleicht, welche Art von Modellen Transfer Learning unterstützen. Ultralytics YOLO11 ist ein hervorragendes Beispiel für ein Computer Vision Modell, das dies kann. Es ist ein hochmodernes Objekterkennungsmodell, das zuerst auf einem großen, allgemeinen Datensatz vortrainiert wird. Danach kann es auf einem kleineren, spezialisierten Datensatz für spezifische Aufgaben feinabgestimmt und kundenspezifisch trainiert werden.

Vergleich von Lernparadigmen

Nachdem wir nun über Few-Shot Learning, Zero-Shot Learning und Transfer Learning gesprochen haben, wollen wir sie vergleichen, um zu sehen, wie sie sich unterscheiden.

__wf_reserved_inherit
Abb. 4. Hauptunterschiede zwischen Few-Shot-, Zero-Shot- und Transferlernen. Bild vom Autor.

Few-Shot Learning ist nützlich, wenn nur eine geringe Menge an gelabelten Daten vorhanden ist. Es ermöglicht einem KI-Modell, aus nur wenigen Beispielen zu lernen. Zero-Shot Learning hingegen benötigt keine gelabelten Daten. Stattdessen werden Beschreibungen oder der Kontext verwendet, um dem System zu helfen, neue Aufgaben zu bewältigen. Transfer Learning verfolgt einen anderen Ansatz, indem es Wissen aus vortrainierten Modellen nutzt, wodurch diese sich schnell mit minimalen zusätzlichen Daten an neue Aufgaben anpassen können. Jede Methode hat ihre eigenen Stärken, abhängig von der Art der Daten und der Aufgabe, an der Sie arbeiten.

Anwendungsbereiche verschiedener Lernparadigmen in der Praxis

Diese Lernparadigmen bewirken bereits in vielen Sektoren einen Unterschied und lösen komplexe Probleme mit innovativen Lösungen. Sehen wir uns genauer an, wie sie in der realen Welt angewendet werden können.

Diagnose seltener Krankheiten mit Few-Shot Learning

Few-Shot Learning ist ein Wendepunkt für den Gesundheitssektor, insbesondere in der medizinischen Bildgebung. Es kann Ärzten helfen, seltene Krankheiten anhand von nur wenigen Beispielen oder sogar Beschreibungen zu diagnostizieren, ohne große Datenmengen zu benötigen. Dies ist besonders nützlich, wenn die Daten begrenzt sind, was oft der Fall ist, da das Sammeln großer Datensätze für seltene Erkrankungen eine Herausforderung darstellen kann.

Beispielsweise verwendet SHEPHERD Few-Shot-Learning und biomedizinische Wissensgraphen, um seltene genetische Erkrankungen zu diagnostizieren. Es bildet Patienteninformationen wie Symptome und Testergebnisse auf ein Netzwerk bekannter Gene und Krankheiten ab. Dies hilft, die wahrscheinliche genetische Ursache zu ermitteln und ähnliche Fälle zu finden, auch wenn nur begrenzte Daten vorliegen. 

__wf_reserved_inherit
Abb. 5. Das Shepherd-Modell diagnostiziert seltene Krankheiten mit minimalen Daten.

Verbesserung der Erkennung von Pflanzenkrankheiten mit Zero-Shot-Learning

In der Landwirtschaft ist die schnelle Erkennung von Pflanzenkrankheiten von entscheidender Bedeutung, da Verzögerungen bei der Erkennung zu weitverbreiteten Ernteschäden, geringeren Erträgen und erheblichen finanziellen Verlusten führen können. Traditionelle Methoden stützen sich oft auf große Datensätze und Expertenwissen, die möglicherweise nicht immer zugänglich sind, insbesondere in abgelegenen oder ressourcenarmen Gebieten. Hier kommen Fortschritte in der KI, wie z. B. Zero-Shot-Learning, ins Spiel.

Nehmen wir an, ein Landwirt baut Tomaten und Kartoffeln an und bemerkt Symptome wie gelbe Blätter oder braune Flecken. Zero-Shot Learning kann helfen, Krankheiten wie Kraut- und Knollenfäule zu identifizieren, ohne dass große Datensätze erforderlich sind. Durch die Verwendung von Beschreibungen der Symptome kann das Modell Krankheiten klassifizieren, die es noch nie zuvor gesehen hat. Dieser Ansatz ist schnell, skalierbar und ermöglicht es Landwirten, eine Vielzahl von Pflanzenproblemen zu erkennen. Es hilft ihnen, die Gesundheit der Pflanzen effizienter zu überwachen, rechtzeitig Maßnahmen zu ergreifen und Verluste zu reduzieren.

__wf_reserved_inherit
Abb. 6. Verwendung von Zero-Shot Learning zur Identifizierung von Pflanzenkrankheiten.

Autonome Fahrzeuge und Transferlernen

Autonome Fahrzeuge müssen sich oft an unterschiedliche Umgebungen anpassen, um sicher zu navigieren. Transferlernen hilft ihnen, Vorwissen zu nutzen, um sich schnell an neue Bedingungen anzupassen, ohne ihr Training von Grund auf neu zu beginnen. In Kombination mit Computer Vision, die Fahrzeugen hilft, visuelle Informationen zu interpretieren, ermöglichen diese Technologien eine reibungslosere Navigation in verschiedenen Terrains und Wetterbedingungen, wodurch autonomes Fahren effizienter und zuverlässiger wird.

Ein gutes Beispiel hierfür ist ein Parkraumverwaltungssystem, das Ultralytics YOLO11 zur Überwachung von Parkplätzen verwendet. YOLO11, ein vortrainiertes Objekterkennungsmodell, kann mithilfe von Transfer Learning feinabgestimmt werden, um freie und belegte Parkplätze in Echtzeit zu identifizieren. Durch das Trainieren des Modells mit einem kleineren Datensatz von Parkplatzbildern lernt es, freie Plätze, belegte Plätze und sogar reservierte Bereiche genau zu erkennen.

__wf_reserved_inherit
Abb. 7. Parkraummanagement mit Ultralytics YOLO11.

Integriert mit anderen Technologien kann dieses System die Fahrer zum nächstgelegenen freien Platz leiten und so die Suchzeit und das Verkehrsaufkommen reduzieren. Transfer Learning ermöglicht dies, indem es auf den bestehenden Objekterkennungs-Fähigkeiten von YOLO11 aufbaut und es ihm ermöglicht, sich an die spezifischen Bedürfnisse des Parkraummanagements anzupassen, ohne bei Null anzufangen. Dieser Ansatz spart Zeit und Ressourcen und schafft gleichzeitig eine hocheffiziente und skalierbare Lösung, die den Parkbetrieb verbessert und das gesamte Benutzererlebnis steigert.

Neue Trends in Lernparadigmen

Die Zukunft der Lernparadigmen in der Computer Vision tendiert zur Entwicklung intelligenterer und nachhaltigerer Vision-AI-Systeme. Ein wachsender Trend ist insbesondere der Einsatz von Hybridansätzen, die Few-Shot Learning, Zero-Shot Learning und Transfer Learning kombinieren. Durch die Verbindung der Stärken dieser Methoden können Modelle neue Aufgaben mit minimalen Daten erlernen und ihr Wissen in verschiedenen Bereichen anwenden.

Ein interessantes Beispiel ist die Verwendung von angepassten Deep Embeddings zur Feinabstimmung von Modellen unter Verwendung von Wissen aus früheren Aufgaben und einer kleinen Menge neuer Daten, was die Arbeit mit begrenzten Datensätzen erleichtert. 

In ähnlicher Weise ist X-shot Learning darauf ausgelegt, Aufgaben mit unterschiedlichen Datenmengen zu bewältigen. Es verwendet schwache Überwachung, bei der Modelle aus begrenzten oder verrauschten Labels lernen, und klare Anweisungen, um ihnen zu helfen, sich schnell anzupassen, selbst mit wenigen oder keinen vorherigen Beispielen. Diese hybriden Ansätze zeigen, wie die Integration verschiedener Lernmethoden KI-Systemen helfen kann, Herausforderungen effektiver zu bewältigen.

Wesentliche Erkenntnisse

Few-Shot Learning, Zero-Shot Learning und Transfer Learning adressieren jeweils spezifische Herausforderungen im Bereich Computer Vision und eignen sich daher für unterschiedliche Aufgaben. Der richtige Ansatz hängt von der jeweiligen Anwendung und der verfügbaren Datenmenge ab. Beispielsweise funktioniert Few-Shot Learning gut mit begrenzten Daten, während Zero-Shot Learning ideal für den Umgang mit unbekannten oder ungewohnten Klassen ist.

Mit Blick auf die Zukunft ist es wahrscheinlich, dass die Kombination dieser Methoden zur Entwicklung von Hybridmodellen, die Vision, Sprache und Audio integrieren, ein wichtiger Schwerpunkt sein wird. Diese Fortschritte zielen darauf ab, KI-Systeme flexibler, effizienter und in der Lage zu machen, komplexe Probleme zu lösen, wodurch neue Möglichkeiten für Innovationen in diesem Bereich eröffnet werden.

Erfahren Sie mehr über KI, indem Sie unserer Community beitreten und unser GitHub-Repository besuchen. Erfahren Sie, wie KI in selbstfahrenden Autos und Computer Vision in der Landwirtschaft die Zukunft neu gestalten. Informieren Sie sich über die verfügbaren YOLO-Lizenzoptionen, um loszulegen!

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert