Few-Shot, Zero-Shot und Transfer Learning verstehen
Erkunde die Unterschiede zwischen Few-Shot Learning, Zero-Shot Learning und Transfer Learning in der Computer Vision und wie diese Paradigmen das Training von KI-Modellen prägen.

Systeme der künstlichen Intelligenz (KI) können komplexe Aufgaben wie die Gesichtserkennung, Bildklassifizierung und das autonome Fahren mit minimalem menschlichen Eingriff bewältigen. Dies erreichen sie durch das Studieren von Daten, das Erkennen von Mustern und die Nutzung dieser Muster, um Vorhersagen oder Entscheidungen zu treffen. Mit dem Fortschritt der KI erleben wir zunehmend ausgefeiltere Methoden, mit denen KI-Modelle lernen, sich anpassen und Aufgaben bemerkenswert effizient ausführen können.
Zum Beispiel ist Computer Vision ein Teilbereich der KI, der sich darauf konzentriert, Maschinen in die Lage zu versetzen, visuelle Informationen aus der Welt zu interpretieren und zu verstehen. Die Entwicklung herkömmlicher Computer-Vision-Modelle stützt sich stark auf große, annotierte Datensätze für das Training. Das Sammeln und Labeln solcher Daten kann zeitaufwendig und kostspielig sein.
Um diese Herausforderungen zu bewältigen, haben Forscher innovative Ansätze eingeführt, wie z. B. Few-Shot Learning (FSL), das aus begrenzten Beispielen lernt; Zero-Shot Learning (ZSL), das unbekannte Objekte identifiziert; und Transfer Learning (TL), das Wissen von vorab trainierten Modellen auf neue Aufgaben anwendet.
In diesem Artikel werden wir untersuchen, wie diese Lernparadigmen funktionieren, ihre wichtigsten Unterschiede hervorheben und uns Anwendungen in der realen Welt ansehen. Fangen wir an!
Link to this sectionEin Überblick über Lernparadigmen#
Lass uns erkunden, was Few-Shot Learning, Zero-Shot Learning und Transfer Learning im Kontext von Computer Vision sind und wie sie funktionieren.
Link to this sectionFew-Shot Learning#
Few-Shot Learning ist eine Methode, bei der Systeme lernen, neue Objekte anhand nur einer geringen Anzahl von Beispielen zu erkennen. Wenn du einem Modell zum Beispiel ein paar Bilder eines Pinguins, Pelikans und Papageientauchers zeigst (diese kleine Gruppe wird als „Support Set“ bezeichnet), lernt es, wie diese Vögel aussehen.
Wenn du dem Modell später ein neues Bild zeigst, etwa einen Pinguin, vergleicht es dieses neue Bild mit denen in seinem Support Set und wählt die größte Übereinstimmung aus. Wenn das Sammeln einer großen Datenmenge schwierig ist, ist diese Methode vorteilhaft, da das System auch mit nur wenigen Beispielen lernen und sich anpassen kann.

Abb. 1. Ein Überblick darüber, wie Few-Shot Learning funktioniert.
Link to this sectionZero-Shot Learning#
Zero-Shot Learning ist eine Möglichkeit für Maschinen, Dinge zu erkennen, die sie noch nie zuvor gesehen haben, ohne Beispiele davon zu benötigen. Es verwendet semantische Informationen, wie Beschreibungen, um dabei zu helfen, Verbindungen herzustellen.
Wenn eine Maschine zum Beispiel durch das Verständnis von Merkmalen wie „klein und flauschig“, „große Wildkatze“ oder „langes Gesicht“ etwas über Tiere wie Katzen, Löwen und Pferde gelernt hat, kann sie dieses Wissen nutzen, um ein neues Tier, wie einen Tiger, zu identifizieren. Selbst wenn sie noch nie einen Tiger gesehen hat, kann sie eine Beschreibung wie „ein löwenartiges Tier mit dunklen Streifen“ verwenden, um ihn korrekt zu identifizieren. Dies macht es für Maschinen einfacher, zu lernen und sich anzupassen, ohne viele Beispiele zu benötigen.

Abb. 2. Zero-Shot Learning identifiziert neue Objekte mithilfe von Beschreibungen.
Link to this sectionTransfer Learning#
Transfer Learning ist ein Lernparadigma, bei dem ein Modell das nutzt, was es bei einer Aufgabe gelernt hat, um bei der Lösung einer ähnlichen, neuen Aufgabe zu helfen. Diese Technik ist besonders nützlich, wenn es um Computer-Vision-Aufgaben wie Objekterkennung, Bildklassifizierung und Mustererkennung geht.
Im Bereich Computer Vision kann beispielsweise ein vorab trainiertes Modell allgemeine Objekte wie Tiere erkennen und dann durch Transfer Learning feinabgestimmt werden, um spezifische Objekte, wie verschiedene Hunderassen, zu identifizieren. Durch die Wiederverwendung von Wissen aus früheren Aufgaben erleichtert Transfer Learning das Training von Computer-Vision-Modellen auf kleineren Datensätzen, was Zeit und Aufwand spart.

Abb. 3. Ein Überblick darüber, wie Transfer Learning funktioniert.
Du fragst dich vielleicht, welche Art von Modellen Transfer Learning unterstützt. Ultralytics YOLO11 ist ein großartiges Beispiel für ein Computer-Vision-Modell, das dies kann. Es ist ein hochmodernes Objekterkennungsmodell, das zunächst auf einem großen, allgemeinen Datensatz vorab trainiert wird. Danach kann es feinabgestimmt und für spezifische Aufgaben auf einem kleineren, spezialisierten Datensatz benutzerdefiniert trainiert werden.
Link to this sectionVergleich von Lernparadigmen#
Nachdem wir nun über Few-Shot Learning, Zero-Shot Learning und Transfer Learning gesprochen haben, vergleichen wir sie, um zu sehen, wie sie sich unterscheiden.

Abb. 4. Hauptunterschiede zwischen Few-Shot, Zero-Shot und Transfer Learning. Bild vom Autor.
Few-Shot Learning ist nützlich, wenn du nur eine kleine Menge an gelabelten Daten hast. Es ermöglicht einem KI-Modell, aus nur wenigen Beispielen zu lernen. Zero-Shot Learning hingegen erfordert keine gelabelten Daten. Stattdessen verwendet es Beschreibungen oder Kontext, um dem System zu helfen, neue Aufgaben zu bewältigen. Transfer Learning verfolgt einen anderen Ansatz, indem es Wissen aus vorab trainierten Modellen nutzt, wodurch diese sich schnell mit minimalen zusätzlichen Daten an neue Aufgaben anpassen können. Jede Methode hat ihre eigenen Stärken, je nach Art der Daten und der Aufgabe, an der du arbeitest.
Link to this sectionReale Anwendungen verschiedener Lernparadigmen#
Diese Lernparadigmen machen bereits in vielen Sektoren einen Unterschied und lösen komplexe Probleme mit innovativen Lösungen. Lass uns genauer betrachten, wie sie in der realen Welt angewendet werden können.
Link to this sectionDiagnose seltener Krankheiten mit Few-Shot Learning#
Few-Shot Learning ist ein Wendepunkt für den Gesundheitssektor, insbesondere in der medizinischen Bildgebung. Es kann Ärzten helfen, seltene Krankheiten anhand von nur wenigen Beispielen oder sogar Beschreibungen zu diagnostizieren, ohne dass große Datenmengen erforderlich sind. Dies ist besonders nützlich, wenn Daten begrenzt sind, was oft der Fall ist, da das Sammeln großer Datensätze für seltene Erkrankungen eine Herausforderung darstellen kann.
Zum Beispiel verwendet SHEPHERD Few-Shot Learning und biomedizinische Wissensgraphen, um seltene genetische Störungen zu diagnostizieren. Es bildet Patienteninformationen, wie Symptome und Testergebnisse, auf ein Netzwerk bekannter Gene und Krankheiten ab. Dies hilft dabei, die wahrscheinliche genetische Ursache zu bestimmen und ähnliche Fälle zu finden, selbst wenn die Daten begrenzt sind.

Abb. 5. Das Shepherd-Modell diagnostiziert seltene Krankheiten mithilfe minimaler Daten.
Link to this sectionVerbesserung der Erkennung von Pflanzenkrankheiten mit Zero-Shot Learning#
In der Landwirtschaft ist die schnelle Identifizierung von Pflanzenkrankheiten unerlässlich, da Verzögerungen bei der Erkennung zu weit verbreiteten Ernteschäden, geringeren Erträgen und erheblichen finanziellen Verlusten führen können. Herkömmliche Methoden stützen sich oft auf große Datensätze und Expertenwissen, die nicht immer zugänglich sind, insbesondere in abgelegenen oder ressourcenarmen Gebieten. Hier kommen Fortschritte in der KI, wie Zero-Shot Learning, ins Spiel.
Angenommen, ein Landwirt baut Tomaten und Kartoffeln an und bemerkt Symptome wie vergilbende Blätter oder braune Flecken. Zero-Shot Learning kann helfen, Krankheiten wie die Kraut- und Braunfäule zu identifizieren, ohne dass große Datensätze erforderlich sind. Durch die Verwendung von Beschreibungen der Symptome kann das Modell Krankheiten klassifizieren, die es zuvor noch nicht gesehen hat. Dieser Ansatz ist schnell, skalierbar und ermöglicht es Landwirten, eine Vielzahl von Pflanzenproblemen zu erkennen. Es hilft ihnen, die Pflanzengesundheit effizienter zu überwachen, rechtzeitig Maßnahmen zu ergreifen und Verluste zu reduzieren.

Abb. 6. Verwendung von Zero-Shot Learning zur Identifizierung von Pflanzenkrankheiten.
Link to this sectionAutonome Fahrzeuge und Transfer Learning#
Autonome Fahrzeuge müssen sich oft an unterschiedliche Umgebungen anpassen, um sicher zu navigieren. Transfer Learning hilft ihnen dabei, Vorkenntnisse zu nutzen, um sich schnell auf neue Bedingungen einzustellen, ohne ihr Training von Grund auf neu zu beginnen. In Kombination mit Computer Vision, das Fahrzeugen hilft, visuelle Informationen zu interpretieren, ermöglichen diese Technologien eine flüssigere Navigation über verschiedene Gelände und Wetterbedingungen hinweg, was das autonome Fahren effizienter und zuverlässiger macht.
Ein gutes Beispiel dafür ist ein Parkmanagementsystem, das Ultralytics YOLO11 verwendet, um Parkplätze zu überwachen. YOLO11, ein vorab trainiertes Objekterkennungsmodell, kann durch Transfer Learning feinabgestimmt werden, um freie und belegte Parkplätze in Echtzeit zu identifizieren. Durch das Training des Modells auf einem kleineren Datensatz von Parkplatzbildern lernt es, offene Plätze, volle Spots und sogar reservierte Bereiche präzise zu erkennen.

Abb. 7. Parkmanagement mit Ultralytics YOLO11.
Integriert mit anderen Technologien kann dieses System Fahrer zum nächsten freien Parkplatz leiten, was dazu beiträgt, Suchzeiten und Verkehrsaufkommen zu reduzieren. Transfer Learning macht dies möglich, indem es auf den bestehenden Objekterkennungsfähigkeiten von YOLO11 aufbaut und es so ermöglicht, sich an die spezifischen Bedürfnisse des Parkmanagements anzupassen, ohne von vorne beginnen zu müssen. Dieser Ansatz spart Zeit und Ressourcen und schafft gleichzeitig eine hocheffiziente und skalierbare Lösung, die den Parkbetrieb verbessert und das allgemeine Nutzererlebnis steigert.
Link to this sectionAufkommende Trends bei Lernparadigmen#
Die Zukunft der Lernparadigmen in der Computer Vision bewegt sich in Richtung der Entwicklung intelligenterer und nachhaltigerer Vision-KI-Systeme. Ein wachsender Trend ist insbesondere die Verwendung von hybriden Ansätzen, die Few-Shot Learning, Zero-Shot Learning und Transfer Learning kombinieren. Durch die Verbindung der Stärken dieser Methoden können Modelle neue Aufgaben mit minimalen Daten erlernen und ihr Wissen in verschiedenen Bereichen anwenden.
Ein interessantes Beispiel ist die Verwendung von angepassten Deep Embeddings, um Modelle mithilfe von Wissen aus früheren Aufgaben und einer kleinen Menge neuer Daten feinabzustimmen, was die Arbeit mit begrenzten Datensätzen erleichtert.
Ähnlich dazu ist X-Shot Learning darauf ausgelegt, Aufgaben mit unterschiedlichen Datenmengen zu bewältigen. Es nutzt schwache Überwachung (Weak Supervision), bei der Modelle von begrenzten oder verrauschten Labels lernen, sowie klare Anweisungen, um ihnen zu helfen, sich schnell anzupassen, selbst wenn nur wenige oder gar keine Vorkenntnisse verfügbar sind. Diese hybriden Ansätze zeigen, wie die Integration verschiedener Lernmethoden KI-Systemen helfen kann, Herausforderungen effektiver anzugehen.
Link to this sectionWichtige Erkenntnisse#
Few-Shot Learning, Zero-Shot Learning und Transfer Learning adressieren jeweils spezifische Herausforderungen in der Computer Vision, wodurch sie für unterschiedliche Aufgaben geeignet sind. Der richtige Ansatz hängt von der spezifischen Anwendung und der verfügbaren Datenmenge ab. Few-Shot Learning funktioniert beispielsweise gut bei begrenzten Daten, während Zero-Shot Learning hervorragend für den Umgang mit ungesehenen oder unbekannten Klassen geeignet ist.
Mit Blick auf die Zukunft wird es wahrscheinlich ein zentraler Schwerpunkt sein, diese Methoden zu kombinieren, um hybride Modelle zu erstellen, die Vision, Sprache und Audio integrieren. Diese Fortschritte zielen darauf ab, KI-Systeme flexibler, effizienter und fähiger zu machen, komplexe Probleme anzugehen, was neue Möglichkeiten für Innovationen in diesem Bereich eröffnet.
Erfahre mehr über KI, indem du unserer Community beitrittst und dir unser GitHub-Repository ansiehst. Erfahre, wie KI in selbstfahrenden Autos und Computer Vision in der Landwirtschaft die Zukunft neu gestalten. Sieh dir die verfügbaren Optionen der YOLO-Lizenz an, um loszulegen!






