Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Model Pruning

Erfahre, wie Modell-Pruning die Größe und Komplexität neuronaler Netze für Edge AI reduziert. Erkunde Strategien zur Optimierung von Ultralytics YOLO26 für schnellere Inferenz auf Mobilgeräten.

Modell-Pruning ist eine Technik im maschinellen Lernen, die verwendet wird, um die Größe und rechnerische Komplexität eines neuronalen Netzwerks durch systematisches Entfernen unnötiger Parameter zu reduzieren. Ähnlich wie ein Gärtner tote oder überwucherte Zweige abschneidet, damit ein Baum gedeihen kann, beschneiden Entwickler künstliche Netzwerke, um sie schneller, kleiner und energieeffizienter zu machen. Dieser Prozess ist unerlässlich für den Einsatz moderner Deep Learning-Architekturen auf Geräten mit begrenzten Ressourcen, wie z. B. Smartphones, eingebetteten Sensoren und Edge-Computing-Hardware.

Link to this sectionWie Modell-Pruning funktioniert#

Die Kernidee hinter dem Pruning ist, dass tiefe neuronale Netzwerke oft "überparametrisiert" sind, was bedeutet, dass sie deutlich mehr Gewichte und Biases enthalten, als für die Lösung eines spezifischen Problems unbedingt erforderlich sind. Während des Trainingsprozesses lernt das Modell eine Vielzahl von Verbindungen, aber nicht alle tragen gleichermaßen zum Endergebnis bei. Pruning-Algorithmen analysieren das trainierte Modell, um diese redundanten oder nicht informativen Verbindungen zu identifizieren – typischerweise solche mit Gewichten nahe Null – und entfernen sie.

Der Lebenszyklus eines beschnittenen Modells folgt im Allgemeinen diesen Schritten:

  1. Training: Ein großes Modell wird bis zur Konvergenz trainiert, um komplexe Merkmale zu erfassen.

  2. Pruning: Parameter mit geringer Bedeutung werden auf Null gesetzt oder physisch aus der Netzwerkstruktur entfernt.

  3. Fine-Tuning: Das Modell durchläuft eine zweite Runde des Fine-Tunings, damit sich die verbleibenden Parameter anpassen und etwaige während der Pruning-Phase verlorene Genauigkeit wiederherstellen können.

Diese Methodik wird oft mit der Lottery Ticket Hypothesis in Verbindung gebracht, die besagt, dass dichte Netzwerke kleinere, isolierte Subnetzwerke (Gewinnlose) enthalten, die eine vergleichbare Genauigkeit wie das ursprüngliche Modell erreichen können, wenn sie isoliert trainiert werden.

Link to this sectionArten von Pruning-Strategien#

Pruning-Methoden werden im Allgemeinen basierend auf der Struktur der zu entfernenden Komponenten kategorisiert.

  • Unstrukturiertes Pruning: Dieser Ansatz entfernt einzelne Gewichte an beliebigen Stellen im Modell basierend auf einem Schwellenwert (z. B. Betrag). Obwohl dies die Parameteranzahl effektiv reduziert, entstehen dabei spärliche Matrizen, die für Standardhardware schwer effizient zu verarbeiten sind. Ohne spezialisierte Software oder Hardware-Beschleuniger führt unstrukturiertes Pruning möglicherweise nicht zu signifikanten Geschwindigkeitsverbesserungen.
  • Strukturiertes Pruning: Diese Methode entfernt ganze geometrische Strukturen, wie Kanäle, Filter oder Schichten innerhalb eines Convolutional Neural Network (CNN). Durch die Beibehaltung der dichten Matrixstruktur bleibt das beschnittene Modell mit Standard-GPU- und CPU-Hardware kompatibel, was zu direkten Verbesserungen bei Inferenzlatenz und Durchsatz führt.

Link to this sectionPraxisanwendungen#

Pruning ist ein entscheidender Wegbereiter für Edge AI und ermöglicht es, anspruchsvolle Modelle in Umgebungen auszuführen, in denen keine Cloud-Konnektivität verfügbar oder diese zu langsam ist.

  • Mobile Objekterkennung: Anwendungen auf mobilen Geräten, wie Echtzeit-Sprachübersetzung oder Augmented Reality, nutzen beschnittene Modelle, um die Akkulaufzeit zu verlängern und den Speicherverbrauch zu reduzieren. Optimierte Architekturen wie YOLO26 sind aufgrund ihrer inhärenten Effizienz oft bevorzugte Grundlagen für diese Aufgaben.
  • Automotive Safety: Selbstfahrende Autos und autonome Fahrzeuge erfordern Entscheidungen in Sekundenbruchteilen. Beschnittene Modelle ermöglichen es Bordcomputern, hochauflösende Kamera-Feeds zur Fußgängererkennung zu verarbeiten, ohne die durch die Datenübertragung an einen Server verursachte Latenz.
  • Industrielles IoT: In der Fertigung nutzen visuelle Inspektionssysteme an Montagelinien leichtgewichtige Modelle zur Fehlererkennung. Pruning stellt sicher, dass diese Systeme auf kosteneffizienten Mikrocontrollern statt auf teuren Server-Racks laufen können.

Link to this sectionPruning vs. verwandte Optimierungstechniken#

Obwohl Modell-Pruning ein mächtiges Werkzeug ist, wird es oft mit anderen Modelloptimierungstechniken verwechselt oder zusammen mit diesen verwendet.

  • Pruning vs. Quantisierung: Pruning reduziert die Anzahl der Parameter (Verbindungen) im Modell. Im Gegensatz dazu reduziert Modellquantisierung die Präzision dieser Parameter, beispielsweise durch die Umwandlung von 32-Bit-Fließkommazahlen in 8-Bit-Ganzzahlen. Beide werden oft kombiniert, um die Effizienz für den Modelleinsatz zu maximieren.
  • Pruning vs. Knowledge Distillation: Pruning modifiziert das ursprüngliche Modell durch Herausschneiden von Teilen. Knowledge Distillation beinhaltet das Training eines völlig neuen, kleineren "Schüler"-Modells, das das Verhalten eines größeren "Lehrer"-Modells nachahmt.

Link to this sectionImplementierungsbeispiel#

Das folgende Python-Beispiel zeigt, wie man unstrukturiertes Pruning auf eine konvolutive Schicht mit PyTorch anwendet. Dies ist ein häufiger Schritt vor dem Exportieren von Modellen in optimierte Formate wie ONNX.

import torch
import torch.nn as nn
import torch.nn.utils.prune as prune

# Initialize a standard convolutional layer
module = nn.Conv2d(in_channels=1, out_channels=20, kernel_size=3)

# Apply unstructured pruning to remove 30% of the connections
# This sets the weights with the lowest L1-norm to zero
prune.l1_unstructured(module, name="weight", amount=0.3)

# Calculate and print the sparsity (percentage of zero elements)
sparsity = 100.0 * float(torch.sum(module.weight == 0)) / module.weight.nelement()
print(f"Layer Sparsity: {sparsity:.2f}%")

Für Benutzer, die den gesamten Lebenszyklus ihrer Datensätze und Modelle – einschließlich Training, Evaluierung und Bereitstellung – verwalten möchten, bietet die Ultralytics Platform eine optimierte Schnittstelle. Sie vereinfacht den Prozess der Erstellung hochoptimierter Modelle wie YOLO26 und deren Export in hardwarefreundliche Formate wie TensorRT oder CoreML.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens