Glossar

Einmaliges Lernen

Entdecke die Leistungsfähigkeit von One-Shot Learning, einer revolutionären KI-Technik, die es ermöglicht, Modelle aus minimalen Daten für reale Anwendungen zu verallgemeinern.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

One-Shot Learning (OSL) ist ein Spezialgebiet des maschinellen Lernens (ML), bei dem das Ziel darin besteht, neue Beispiele auf der Grundlage nur eines einzigen Trainingsbeispiels für jede Klasse zu klassifizieren. Dies steht im krassen Gegensatz zu traditionellen überwachten Lernmethoden, die oft Tausende von markierten Beispielen pro Klasse benötigen, um eine hohe Genauigkeit zu erreichen. OSL ist vor allem dann wichtig, wenn die Trainingsdaten knapp, teuer oder zeitaufwändig sind, was es zu einer wichtigen Technik für reale Anwendungen macht, bei denen Datenbeschränkungen üblich sind.

Wie One-Shot Learning funktioniert

Anstatt zu lernen, eine Eingabe direkt einem Klassenlabel aus zahlreichen Beispielen zuzuordnen, lernen OSL-Modelle normalerweise eine Ähnlichkeitsfunktion. Im Kern geht es darum, zu bestimmen, wie ähnlich ein neues, ungesehenes Beispiel (Query) dem einzigen verfügbaren markierten Beispiel (Support) für jede Klasse ist. Wenn das abgefragte Beispiel dem Beispiel für eine bestimmte Klasse sehr ähnlich ist, wird es dieser Klasse zugeordnet. Dazu werden oft Deep Learning (DL)-Architekturen wie Siamesische Netze verwendet, die zwei Eingaben gleichzeitig verarbeiten, um ihre Ähnlichkeit zu bestimmen. Diese Netze werden oft auf großen Datensätzen (wie ImageNet) durch Transferlernen trainiert, um robuste Merkmalsrepräsentationen zu lernen, bevor sie durch Techniken wie metrisches Lernen an die OSL-Aufgabe angepasst werden.

Schlüsselkonzepte beim One-Shot-Lernen

  • Support Set: Diese enthält das einzelne markierte Beispiel für jede Klasse, aus dem das Modell lernen soll.
  • Abfragemenge: Diese enthält die unbeschrifteten Beispiele, die das Modell auf der Grundlage der Unterstützungsmenge klassifizieren muss.
  • Ähnlichkeit/Metrisches Lernen: Der Prozess des Lernens einer Abstandsfunktion oder Metrik, die die Ähnlichkeit zwischen Datenpunkten misst, ist entscheidend für den Vergleich von Abfragebeispielen mit Hilfsbeispielen.
  • Episodisches Training: Eine gängige Trainingsstrategie, bei der das Modell an vielen kleinen OSL-Aufgaben (Episoden) aus einem größeren Datensatz trainiert wird, um das One-Shot-Szenario beim Training zu simulieren.

One-Shot-Learning vs. verwandte Paradigmen

Um OSL zu verstehen, muss man es von verwandten Konzepten unterscheiden:

  • Few-Shot Learning (FSL): OSL gilt als eine extreme Variante von FSL. Während OSL nur ein Beispiel pro Klasse verwendet, nutzt FSL eine kleine Anzahl (k > 1, typischerweise 5 oder 10) von Beispielen pro Klasse. Beide gehen mit Datenknappheit um, unterscheiden sich aber in der Anzahl der verfügbaren Beispiele. Mehr über diese Paradigmen erfährst du in unserem Blogbeitrag zum Verständnis von few-shot, zero-shot und transfer learning.
  • Zero-Shot Learning (ZSL): ZSL geht ein noch schwierigeres Problem an: die Klassifizierung von Instanzen aus Klassen, die während des Trainings nie gesehen wurden. Dies wird in der Regel durch die Nutzung von Zusatzinformationen wie semantischen Attributen oder Textbeschreibungen erreicht, die gesehene und ungesehene Klassen miteinander verbinden. Bei OSL muss man ein Beispiel sehen, bei ZSL braucht man keine Beispiele zu sehen, benötigt aber zusätzlichen semantischen Kontext.
  • Transferlernen und Feinabstimmung: Auch wenn OSL häufig Transfer Learning (Vortraining auf einem großen Datensatz) verwendet, ist das Ziel ein anderes. Beim Standard-Transfer-Lernen oder der Feinabstimmung wird in der Regel davon ausgegangen, dass eine angemessene Menge an Zieldaten für die Anpassung zur Verfügung steht, während OSL sich speziell mit der Einschränkung eines Beispiels befasst. Techniken wie das benutzerdefinierte Training von Ultralytics YOLO beinhalten oft eine Feinabstimmung der vortrainierten Gewichte, aber normalerweise mit mehr als einem Beispiel pro Klasse.

Anwendungen in der realen Welt

OSL ermöglicht verschiedene Anwendungen, die bisher durch Datenbeschränkungen behindert wurden:

  1. Gesichtserkennung: Sicherheitssysteme oder persönliche Geräte müssen eine Person nach der Registrierung mit nur einem Foto identifizieren oder verifizieren. Das NIST führt umfangreiche Tests mit Gesichtserkennungstechnologien durch, von denen viele mit ähnlichen Herausforderungen konfrontiert sind, die nur wenige oder einmalige Aufnahmen erfordern.
  2. Erkennung seltener Objekte: In Bereichen wie der Qualitätskontrolle in der Fertigung oder dem Naturschutz ist die Erkennung seltener Defekte oder gefährdeter Arten möglicherweise nur mit einem oder wenigen Beispielen möglich. Während Modelle wie Ultralytics YOLO11 bei der Erkennung von Objekten mit einer ausreichenden Datenmenge hervorragend sind, könnten OSL-Techniken sie bei extrem seltenen Klassen ergänzen.
  3. Unterschriftenüberprüfung: Die Authentifizierung der Unterschrift einer Person auf der Grundlage einer einzigen gespeicherten Referenzunterschrift. Die Forschung erforscht Deep Learning für diese Aufgabe, oft mit geringem Datenaufkommen.
  4. Entdeckung von Arzneimitteln: Identifizierung potenzieller neuer Arzneimittelkandidaten oder Vorhersage von Moleküleigenschaften auf der Grundlage sehr begrenzter experimenteller Ergebnisse, um den Forschungsprozess zu beschleunigen. Studien zeigen die Anwendung von OSL bei der Vorhersage von Wirkstoff-Ziel-Interaktionen.

Herausforderungen und zukünftige Wege

Die größte Herausforderung bei OSL ist die Generalisierung: Wie kann ein Modell zuverlässig das Wesen einer Klasse aus nur einem Beispiel lernen, ohne sich zu sehr anzupassen? Die Wahl und die Qualität des einzelnen Beispiels sind dabei von entscheidender Bedeutung. Die laufende Forschung konzentriert sich auf die Entwicklung robusterer Merkmalsrepräsentationen, besserer Ähnlichkeitsmetriken und die Nutzung von Techniken wie Meta-Lernen ("Lernen, um zu lernen"), um die OSL-Leistung zu verbessern. Die Integration von OSL-Fähigkeiten in allgemeine Bildverarbeitungsmodelle und -plattformen wie Ultralytics HUB könnte ihre Anwendbarkeit in datenbeschränkten Umgebungen erheblich erweitern. Die Bewertung von OSL-Modellen erfordert eine sorgfältige Prüfung der Leistungsmetriken unter diesen schwierigen Bedingungen.

Alles lesen