Parameter-Efficient Fine-Tuning (PEFT)
Erkunde Parameter-Efficient Fine-Tuning (PEFT), um große Modelle wie Ultralytics YOLO26 zu optimieren. Lerne, Rechenkosten zu senken und SOTA-Ergebnisse auf GPUs zu erzielen.
Parameter-Efficient Fine-Tuning (PEFT) ist eine hochentwickelte Optimierungsstrategie im Machine Learning (ML), die es ermöglicht, große, vortrainierte Modelle an spezifische Aufgaben anzupassen und dabei die Rechenkosten zu minimieren. Da moderne Foundation Models inzwischen Milliarden von Parametern umfassen, sind traditionelle Trainingsmethoden, die jedes Gewicht im Netzwerk aktualisieren, in Bezug auf Hardware und Energie unerschwinglich geworden. PEFT begegnet dieser Herausforderung, indem die überwiegende Mehrheit der vortrainierten Model Weights eingefroren wird und nur eine kleine Teilmenge an Parametern aktualisiert oder durch leichte Adapter-Layer ergänzt wird. Dieser Ansatz senkt die Eintrittshürde und ermöglicht es Entwicklern, auf handelsüblichen GPUs modernste Ergebnisse zu erzielen, ohne dass Rechenzentren im industriellen Maßstab erforderlich sind.
Link to this sectionDie Mechanik der Effizienz#
Das Grundprinzip von PEFT beruht auf Transfer Learning, bei dem ein Modell Merkmalsdarstellungen nutzt, die aus massiven öffentlichen Datensätzen wie ImageNet gelernt wurden, um neue Probleme zu lösen. In einem Standard-Workflow kann die Anpassung eines Modells ein "Full Fine-Tuning" beinhalten, bei dem Backpropagation jeden Parameter im Neural Network anpasst.
PEFT-Techniken, wie LoRA (Low-Rank Adaptation), gehen einen anderen Weg. Sie halten das schwere "Backbone" des Modells statisch – und bewahren dessen allgemeines Wissen – während sie kleine, trainierbare Matrizen in spezifische Layer einfügen. Dies verhindert Catastrophic Forgetting, ein Phänomen, bei dem ein Modell seine ursprünglichen Fähigkeiten verliert, während es neue Informationen lernt. Durch die Reduzierung der trainierbaren Parameter um bis zu 99 % senkt PEFT den Speicherbedarf erheblich und ermöglicht es, mehrere aufgabenpezifische Adapter während der Real-Time Inference in ein einzelnes Basismodell ein- und auszuschleusen.
Link to this sectionPraxisanwendungen#
PEFT ist besonders wertvoll in Branchen, in denen Edge Computing und Datenschutz von größter Bedeutung sind.
- KI in der Landwirtschaft: Agritech-Startups setzen Modelle häufig auf Drohnen mit begrenzter Akkulaufzeit und Rechenleistung ein. Mit PEFT können Entwickler ein hocheffizientes Modell wie YOLO26 nehmen und es feinabstimmen, um spezifische regionale Schädlinge, wie den Heerwurm, mithilfe eines kleinen Custom Dataset zu erkennen. Durch das Einfrieren des Backbones kann das Training schnell auf einem Laptop durchgeführt werden, und das resultierende Modell bleibt leicht genug für die Onboard-Verarbeitung.
- KI im Gesundheitswesen: Bei der medizinischen Bildanalyse sind annotierte Daten oft knapp und teuer in der Beschaffung. Krankenhäuser nutzen PEFT, um universelle Vision-Modelle für die Identifizierung von Anomalien in MRT-Scans anzupassen. Da die Basisparameter eingefroren sind, neigt das Modell weniger zu Overfitting auf dem kleinen Datensatz, was eine robuste Diagnoseleistung gewährleistet und gleichzeitig die Privatsphäre der Patientendaten schützt.
Link to this sectionImplementierung eingefrorener Layer mit Ultralytics#
Im Ultralytics-Ökosystem wird Parametereffizienz oft dadurch erreicht, dass die anfänglichen Layer eines Netzwerks "eingefroren" werden. Dies stellt sicher, dass die robusten Merkmalsextraktoren unverändert bleiben, während nur der Head oder spätere Layer an neue Klassen angepasst werden. Dies ist eine praktische Implementierung von PEFT-Prinzipien für die Objekterkennung.
Das folgende Beispiel zeigt, wie man ein YOLO26-Modell trainiert und dabei die ersten 10 Layer des Backbones einfriert, um Rechenressourcen zu sparen:
from ultralytics import YOLO
# Load the YOLO26 model (latest stable version)
model = YOLO("yolo26n.pt")
# Train on a custom dataset with the 'freeze' argument
# freeze=10 keeps the first 10 layers static, updating only deeper layers
results = model.train(data="coco8.yaml", epochs=5, freeze=10)Für Teams, die diesen Prozess skalieren möchten, bietet die Ultralytics Platform eine einheitliche Schnittstelle zur Verwaltung von Datensätzen, zur Automatisierung der Annotation und zur Überwachung dieser effizienten Trainingsläufe aus der Cloud.
Link to this sectionUnterscheidung von PEFT und verwandten Konzepten#
Um die richtige Strategie zur Modellanpassung auszuwählen, ist es hilfreich, PEFT von ähnlichen Begriffen zu unterscheiden:
- Fine-Tuning: Oft als "Full Fine-Tuning" bezeichnet, aktualisiert dieser Prozess alle Parameter im Modell. Obwohl es maximale Plastizität bietet, ist es rechenintensiv und erfordert das Speichern einer vollständigen Kopie des Modells für jede Aufgabe. PEFT ist eine Unterkategorie des Fine-Tunings, die sich auf Effizienz konzentriert.
- Prompt Engineering: Dies beinhaltet das Erstellen von Texteingaben, um die Ausgabe eines Modells zu steuern, ohne interne Gewichte zu ändern. PEFT hingegen verändert mathematisch eine Teilmenge von Gewichten oder Adaptern, um die Art und Weise, wie das Modell Daten verarbeitet, dauerhaft zu ändern.
- Knowledge Distillation: Diese Technik trainiert ein kleines Schülermodell so, dass es ein großes Lehrermodell nachahmt. Obwohl dies zu einem effizienten Modell führt, ist es eine Kompressionsmethode, wohingegen PEFT eine Anpassungsmethode ist, die verwendet wird, um einem bestehenden Modell neue Fähigkeiten beizubringen.
Indem PEFT den Zugang zu leistungsstarker KI demokratisiert, ermöglicht es Entwicklern, spezialisierte Werkzeuge für autonome Fahrzeuge und Smart Manufacturing zu entwickeln, ohne dass Supercomputer-Infrastrukturen erforderlich sind.






