Glossar

Few-Shot Learning

Entdecken Sie, wie KI mit minimalen Daten Anpassungen vornehmen kann und damit Bereiche wie die medizinische Diagnostik und den Schutz von Wildtieren revolutioniert.

Few-Shot Learning (FSL) ist ein Teilbereich des maschinellen Lernens (ML), der sich auf die Entwicklung von Modellen konzentriert, die aus einer sehr kleinen Anzahl von Trainingsbeispielen pro Klasse, oft nur einer Handvoll, verallgemeinern können. Dies steht in starkem Kontrast zu traditionellen Deep Learning (DL)-Ansätzen, die in der Regel riesige Mengen an markierten Trainingsdaten erfordern. Die Kernidee ist vom menschlichen Lernen inspiriert, bei dem wir neue Konzepte oft schon nach ein oder zwei Beispielen erkennen können. FSL ist vor allem in Bereichen von entscheidender Bedeutung, in denen die Datenerfassung teuer, zeitaufwändig oder von Natur aus begrenzt ist, was die Künstliche Intelligenz (KI ) anpassungsfähiger und dateneffizienter macht.

Wie Few-Shot Learning funktioniert

Few-Shot-Learning-Techniken zielen darauf ab, Vorwissen zu nutzen, um aus begrenzten Daten schnell neue Konzepte zu lernen. Zu den gängigen Strategien gehören:

  • Meta-Lernen: Meta-Learning wird oft als "Lernen, um zu lernen" beschrieben und beinhaltet das Training eines Modells mit einer Vielzahl von Lernaufgaben während einer Meta-Trainingsphase. Dadurch kann das Modell einen effizienten Lernalgorithmus oder Anfangsparameter erlernen, der sich schnell an eine neue Aufgabe mit wenigen Beispielen anpassen kann. Zu diesem Zweck wurden mehrere Meta-Learning-Algorithmen entwickelt.
  • Transfer-Lernen: FSL nutzt häufig Transfer Learning, indem es mit einem Modell beginnt, das auf einem großen Datensatz (wie ImageNet oder COCO) vortrainiert wurde. Dieses vortrainierte Modell, das bereits allgemeine Merkmale aus dem großen Datensatz kennt, wird dann anhand der geringen Anzahl verfügbarer Beispiele für die spezifische Zielaufgabe feinabgestimmt. Bei diesem Ansatz wird das in den Modellgewichten enthaltene allgemeine Wissen genutzt.
  • Datenerweiterung: Die Generierung von Variationen der wenigen verfügbaren Trainingsmuster mit Hilfe von Datenerweiterungstechniken kann dazu beitragen, den begrenzten Datensatz zu erweitern, auch wenn die Effektivität bei extrem niedrigen Datenmengen variieren kann. Möglicherweise sind fortgeschrittene Erweiterungsstrategien erforderlich.

Diese Methoden ermöglichen es Neuronalen Netzen (NN ), auch mit minimalen aufgabenspezifischen Daten eine angemessene Leistung zu erzielen.

Few-Shot-Lernen im Vergleich zu verwandten Konzepten

Es ist wichtig, FSL von ähnlichen Lernparadigmen zu unterscheiden:

  • Zero-Shot Learning (ZSL): ZSL zielt darauf ab, Instanzen von Klassen zu klassifizieren, die während des Trainings nie gesehen wurden. Dies wird in der Regel durch die Verwendung von Hilfsinformationen wie Textbeschreibungen oder Attributen der ungesehenen Klassen erreicht, um die Lücke zwischen gesehenen und ungesehenen Daten zu schließen. FSL hingegen erfordert zumindest einige gelabelte Beispiele für jede neue Klasse. Ein Überblick über ZSL, FSL und Transfer Learning kann weiteren Kontext liefern.
  • One-Shot Learning (OSL): OSL ist eine extreme Variante von FSL, bei der das Modell lernen muss, eine neue Klasse aus nur einem markierten Beispiel zu erkennen. Es verfolgt die gleichen Ziele wie FSL, arbeitet aber unter noch strengeren Datenbeschränkungen.
  • Transfer-Lernen: Während FSL oft Transferlernen als Technik verwendet, sind die Begriffe nicht austauschbar. Transferlernen ist ein umfassenderes Konzept, das die Nutzung von Wissen aus einer Ausgangsaufgabe zur Verbesserung der Leistung bei einer Zielaufgabe beinhaltet. FSL befasst sich speziell mit der Herausforderung, effektiv zu lernen, wenn die Zielaufgabe nur über äußerst begrenzte beschriftete Daten verfügt.

Anwendungen von Few-Shot Learning

FSL ermöglicht KI-Anwendungen in Szenarien, in denen große Datensätze unpraktisch oder unmöglich zu beschaffen sind:

  • Diagnose seltener Krankheiten: Bei der medizinischen Bildanalyse ist es eine Herausforderung, zahlreiche Beispiele seltener Krankheiten für das Training von Diagnosemodellen zu erhalten. Mit FSL können Modelle lernen, solche Krankheiten (z. B. bestimmte Arten von Tumoren in Scans) aus einer kleinen Menge von Patientenbildern zu erkennen, was Diagnose und Forschung beschleunigen könnte. Dies ist ein Schlüsselbereich für künstliche Intelligenz im Gesundheitswesen, dessen Forschungsergebnisse in Fachzeitschriften wie Radiology veröffentlicht wurden : Artificial Intelligence.
  • Benutzerdefinierte Objekterkennung: Stellen Sie sich vor, Sie benötigen ein Objekterkennungsmodell, um ein neu entworfenes Produkt auf einer Fertigungsstraße oder eine seltene Tierart in Aufnahmen zum Schutz von Wildtieren zu identifizieren. Die Erfassung tausender markierter Bilder könnte sich als undurchführbar erweisen. Mit FSL können benutzerdefinierte Modelle trainiert werden, z. B. die Anpassung eines Ultralytics YOLO-Modells mithilfe von Plattformen wie Ultralytics HUB, mit nur einer Handvoll Beispiele pro neuer Objektklasse. Dies beschleunigt den Einsatz für spezielle Computer-Vision-Aufgaben (CV).
  • Übersetzung ressourcenarmer Sprachen: Das Training von Übersetzungsmodellen für Sprachen mit wenig digitalem Text erfordert FSL-Techniken innerhalb der natürlichen Sprachverarbeitung (NLP).
  • Robotik: Eine weitere Anwendung, die auf Konferenzen wie der ICRA vorgestellt wird, ist die Fähigkeit von Robotern(Robotik), schnell zu lernen, neue Objekte in unbekannten Umgebungen zu erkennen und mit ihnen zu interagieren, wenn sie ihnen nur minimal ausgesetzt sind.

Herausforderungen und zukünftige Wege

Trotz seiner vielversprechenden Eigenschaften steht FSL vor einigen Herausforderungen, z. B. der Empfindlichkeit des Modells gegenüber den wenigen zur Verfügung stehenden Beispielen und der Gewährleistung einer robusten Verallgemeinerung über diese Beispiele hinaus. Die Überwindung der Überanpassung mit solch begrenzten Daten ist eine große Hürde. Die laufende Forschung konzentriert sich auf die Entwicklung robusterer Meta-Learning-Algorithmen, die bessere Nutzung von unüberwachtem Lernen oder selbstüberwachtem Lernen für das Pre-Training und die Schaffung theoretischer Rahmenbedingungen für das Verständnis der Generalisierung in datenarmen Situationen. Organisationen wie Google AI und Meta AI tragen aktiv zur Weiterentwicklung von FSL-Techniken bei, um KI-Systeme flexibler und weniger datenintensiv zu machen.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert