Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

One-Shot Learning

Erkunde One-Shot Learning in der KI. Lerne, wie man Objekte mit einem einzigen Bild mithilfe von Ultralytics YOLO26 und siamesischen Netzwerken für effiziente Computer-Vision klassifiziert.

One-Shot Learning ist eine spezielle Klassifizierungstechnik im Bereich Machine Learning (ML), die darauf ausgelegt ist, Informationen über Objektkategorien aus einem einzigen Trainingsbeispiel zu lernen. Im Gegensatz zu herkömmlichen Deep Learning (DL)-Algorithmen, die riesige Datensätze mit tausenden annotierten Bildern erfordern, um effektiv zu generalisieren, ahmt One-Shot Learning die menschliche kognitive Fähigkeit nach, ein neues Konzept sofort zu erfassen. Eine Person kann zum Beispiel normalerweise einen bestimmten exotischen Vogel erkennen, nachdem sie ihn nur einmal gesehen hat; diese Methodik versucht, diese Effizienz in Artificial Intelligence (AI)-Systemen nachzubilden. Sie ist besonders wertvoll in Szenarien, in denen die Datenmarkierung teuer ist, Daten knapp sind oder neue Kategorien dynamisch hinzugefügt werden müssen, ohne das gesamte Modell neu trainieren zu müssen.

Link to this sectionMechanismen hinter dem Konzept#

Das Kernprinzip von One-Shot Learning besteht darin, das Ziel von der Standardklassifizierung zur Ähnlichkeitsbewertung zu verschieben. Anstatt ein Neural Network (NN) darauf zu trainieren, ein spezifisches Klassenlabel (z. B. „Hund“ oder „Katze“) auszugeben, lernt das Modell eine Distanzfunktion. Eine gängige Architektur, die hierfür eingesetzt wird, ist das Siamese Neural Network, das aus zwei identischen Teilnetzwerken besteht, die sich dieselben Modellgewichte teilen.

Während des Betriebs führt das Netzwerk eine Feature-Extraktion durch, um Eingabebilder in kompakte numerische Vektoren umzuwandeln, die als Embeddings bekannt sind. Das System vergleicht dann das Embedding eines neuen Abfragebildes mit dem Embedding des einzelnen Referenz-"Shots". Wenn die mathematische Distanz – oft berechnet unter Verwendung der euklidischen Distanz oder der Kosinus-Ähnlichkeit – unter einem bestimmten Schwellenwert liegt, wird bestimmt, dass die Bilder zur selben Klasse gehören. Dies ermöglicht es dem Modell, die Identität zu verifizieren oder Objekte basierend auf ihrer Nähe im gelernten Merkmalsraum zu klassifizieren.

Der folgende Python-Code zeigt, wie man Embeddings extrahiert und Ähnlichkeiten unter Verwendung eines YOLO26-Klassifizierungsmodells aus dem ultralytics-Paket berechnet.

import numpy as np
from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model for feature extraction
model = YOLO("yolo26n-cls.pt")

# Extract embeddings for a reference 'shot' and a query image
# The embed() method returns the feature vector directly
shot_vec = model.embed("reference_img.jpg")[0]
query_vec = model.embed("query_img.jpg")[0]

# Calculate similarity (higher dot product implies greater similarity)
similarity = np.dot(shot_vec, query_vec) / (np.linalg.norm(shot_vec) * np.linalg.norm(query_vec))

print(f"Similarity Score: {similarity:.4f}")

Link to this sectionUnterscheidung verwandter Paradigmen#

Es ist wichtig, One-Shot Learning von anderen dateneffizienten Lerntechniken abzugrenzen, da diese ähnliche Probleme durch unterschiedliche Einschränkungen lösen:

  • Few-Shot Learning (FSL): Dies ist die breitere Kategorie, die One-Shot Learning umfasst. Beim FSL erhält das Modell ein kleines „Support-Set“ von Beispielen, typischerweise zwischen zwei und fünf Bildern pro Klasse. One-Shot Learning ist einfach der Extremfall, bei dem die Größe des Support-Sets genau eins beträgt.
  • Zero-Shot Learning (ZSL): ZSL befasst sich mit der Erkennung von Kategorien, die das Modell noch nie visuell gesehen hat. Anstatt eines Referenzbildes stützt sich ZSL auf semantische Attribute oder Textbeschreibungen (z. B. die Identifizierung eines „Zebras“ durch die Verknüpfung visueller Merkmale mit der Textbeschreibung „gestreiftes Pferd“) mittels Natural Language Processing (NLP).
  • Transfer Learning: Dies beinhaltet die Verwendung eines Modells, das auf einer großen Datenbank wie ImageNet vorab trainiert wurde, und dessen Feinabstimmung auf eine neue Aufgabe. Während Transfer Learning die im One-Shot Learning verwendeten Feature-Extraktoren antreibt, erfordert standardmäßiges Transfer Learning normalerweise mehr als ein Beispiel, um Gewichte effektiv ohne Overfitting zu aktualisieren.

Link to this sectionPraxisanwendungen#

One-Shot Learning hat neue Möglichkeiten in Sektoren eröffnet, in denen das Sammeln großer Mengen an Trainingsdaten unpraktikabel ist.

Link to this sectionGesichtserkennung und Sicherheit#

Die am weitesten verbreitete Anwendung von One-Shot Learning liegt in der biometrischen Sicherheit. Beim Einrichten von Face ID auf einem Smartphone oder bei der Anmeldung in einem Mitarbeiterzugangssystem erfasst das Gerät eine einzelne mathematische Darstellung des Gesichts des Benutzers. Im täglichen Gebrauch vergleicht das Gesichtserkennungs-System den Live-Kamerastream mit diesem gespeicherten „One Shot“, um die Identität zu verifizieren. Dies beruht auf robusten Embedding-Techniken, wie sie in der grundlegenden FaceNet-Forschung diskutiert werden, um sicherzustellen, dass Änderungen der Beleuchtung oder des Winkels den Ähnlichkeitsabgleich nicht beeinträchtigen.

Link to this sectionIndustrielle Qualitätskontrolle#

In AI in manufacturing ist das Erstellen eines ausgewogenen Datensatzes von „defekten“ Teilen schwierig, da Defekte selten und inkonsistent sind. One-Shot Learning ermöglicht es Computer Vision (CV)-Systemen, die Repräsentation eines einzelnen „perfekten“ Referenzteils zu lernen. Jedes Teil am Fließband, das ein Embedding liefert, das signifikant von dieser Referenz abweicht, wird für die Anomalieerkennung markiert. Dies ermöglicht eine sofortige Qualitätssicherung, ohne dass tausende Bilder von defekten Teilen benötigt werden, was über die Ultralytics Platform verwaltet und bereitgestellt werden kann.

Link to this sectionHerausforderungen und Zukunftsaussichten#

Obwohl es leistungsstark ist, ist One-Shot Learning anfällig für Rauschen; wenn das einzelne Referenzbild unscharf, verdeckt oder nicht repräsentativ ist, verschlechtert sich die Fähigkeit des Modells, diese Klasse zu erkennen, erheblich. Forscher setzen oft Meta-Learning oder „Lernen zu lernen“ ein, um die Modellstabilität und Generalisierung zu verbessern. Mit der Weiterentwicklung der Architekturen integrieren neuere Modelle wie YOLO26 robustere Feature-Extraktoren, die One-Shot-Inferenz schneller und genauer machen und den Weg für adaptivere und intelligentere Edge AI-Geräte ebnen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens