Erschließen Sie die Leistungsfähigkeit des Transferlernens, um Zeit zu sparen, die KI-Leistung zu steigern und neue Aufgaben mit begrenzten Daten mithilfe vortrainierter Modelle zu bewältigen.
Transferlernen ist eine Technik des maschinellen Lernens, bei der ein für eine Aufgabe entwickeltes Modell als Ausgangspunkt für ein Modell für eine zweite, verwandte Aufgabe wiederverwendet wird. Anstatt ein Modell von Grund auf zu trainieren, was große Mengen an Trainingsdaten und Rechenressourcen erfordert, nutzt das Transfer Lernen das Wissen - z. B. Merkmalskarten, Gewichte und Muster -, das aus einer Ausgangsaufgabe gelernt wurde. Dieser Ansatz ist ein Eckpfeiler des modernen Deep Learning, insbesondere in der Computer Vision (CV), und ermöglicht Entwickler eine hohe Genauigkeit mit deutlich weniger Daten und weniger Daten und kürzeren Trainingszeiten zu erreichen.
Das Verfahren beruht auf der Fähigkeit von neuronaler Netze, hierarchische Merkmalsdarstellungen zu Repräsentationen zu lernen. In den ersten Schichten eines Modells, die oft als Backbone genannt, lernt das Netz universelle visuelle Merkmale wie Kanten, Texturen und Formen. Diese Merkmale sind für fast jede visuelle Aufgabe anwendbar.
Transferlernen umfasst in der Regel zwei Hauptphasen:
Für einen tieferen theoretischen Einblick bieten die Stanford CS231n Notizen über Transfer Learning eine ausgezeichnete Quelle.
Das Transfer-Lernen ist eine Lösung für das häufige Problem der Datenknappheit. Indem sie mit vorgelernten Merkmalen beginnen, vermeiden Modelle Modelle eine Überanpassung bei kleinen Datensätzen und konvergieren viel schneller als Modelle, die mit zufälligen Gewichten initialisiert werden.
Transfer Learning ist die Grundlage für weit verbreitete KI-Lösungen in verschiedenen Branchen:
Es ist hilfreich, Transferlernen von ähnlichen Begriffen zu unterscheiden:
Die folgenden Python Beispiel demonstriert die Anwendung des Transfer-Lernens anhand
der ultralytics Bibliothek. Wir laden ein YOLO11 , das zuvor mit COCO trainiert wurde, und stimmen es anhand eines Beispieldatensatzes ab.
from ultralytics import YOLO
# Load a pre-trained model (weights derived from the COCO dataset)
# This acts as our starting point for transfer learning
model = YOLO("yolo11n.pt")
# Fine-tune the model on a new dataset (e.g., COCO8)
# The model adapts its pre-learned features to the specific data
model.train(data="coco8.yaml", epochs=5)
# The updated model can now be used for inference on the new task
model.predict("path/to/image.jpg")
Weitere Einzelheiten zur Implementierung finden Sie im offiziellen PyTorch Transfer Learning Tutorial oder den TensorFlow Transfer Learning Guide.