Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Anleitungen

Pruning und Quantisierung in der Computer Vision: Ein kurzer Leitfaden

Entdecke, warum Pruning und Quantisierung entscheidend für die Optimierung von Computer-Vision-Modellen und eine schnellere Performance auf Edge-Geräten sind.

ABAbirami Vina
5 min read
Pruning und Quantisierung in der Computer Vision

Edge-Geräte werden mit fortschreitender Technologie immer häufiger eingesetzt. Von Smartwatches, die deine Herzfrequenz messen, bis hin zu Drohnen, die Straßen überwachen: Edge-Systeme können Daten in Echtzeit direkt auf dem Gerät selbst verarbeiten.

Diese Methode ist oft schneller und sicherer als das Senden von Daten in die Cloud, insbesondere bei Anwendungen, die personenbezogene Daten betreffen, wie etwa die Erkennung von Nummernschildern oder das Tracking von Gesten. Dies sind Beispiele für Computer Vision, einen Teilbereich der künstlichen Intelligenz (KI), der es Maschinen ermöglicht, visuelle Informationen zu interpretieren und zu verstehen.

Ein Beispiel für die Kennzeichenerkennung

Abb. 1. Ein Beispiel für die Nummernschilderkennung. (Quelle)

Eine wichtige Überlegung ist jedoch, dass solche Anwendungen Vision AI Modelle erfordern, die in der Lage sind, rechenintensive Aufgaben zu bewältigen, minimale Ressourcen zu verbrauchen und unabhängig zu arbeiten. Die meisten Computer Vision Modelle sind für Hochleistungssysteme entwickelt, was sie für den direkten Einsatz auf Edge-Geräten weniger geeignet macht.

Um diese Lücke zu schließen, wenden Entwickler oft gezielte Optimierungen an, die das Modell an die effiziente Ausführung auf kleinerer Hardware anpassen. Diese Anpassungen sind entscheidend für reale Edge-Implementierungen, bei denen Speicher und Rechenleistung begrenzt sind.

Interessanterweise sind Computer Vision Modelle wie Ultralytics YOLO11 bereits auf Edge-Effizienz ausgelegt, was sie großartig für Echtzeitaufgaben macht. Ihre Leistung kann jedoch durch Modelloptimierungstechniken wie Pruning und Quantisierung weiter gesteigert werden, was eine noch schnellere Inferenz und einen geringeren Ressourcenverbrauch auf eingeschränkten Geräten ermöglicht.

In diesem Artikel werden wir uns genauer ansehen, was Pruning und Quantisierung sind, wie sie funktionieren und wie sie YOLO Modellen helfen können, in realen Edge-Umgebungen Leistung zu erbringen. Fangen wir an!

Link to this sectionPruning und Quantisierung: Kerntechniken der Modelloptimierung#

Bei der Vorbereitung von Vision AI Modellen für den Einsatz auf Edge-Geräten ist es ein Hauptziel, das Modell leicht und zuverlässig zu machen, ohne die Leistung zu beeinträchtigen. Dies beinhaltet oft die Reduzierung der Modellgröße und der Rechenanforderungen, damit es effizient auf Hardware mit begrenztem Speicher, Energie oder Prozessorleistung arbeiten kann. Zwei gängige Methoden hierfür sind Pruning und Quantisierung.

Pruning ist eine Technik zur Modelloptimierung von KI, die dabei hilft, neuronale Netze kleiner und effizienter zu machen. In vielen Fällen tragen Teile eines Modells, wie bestimmte Verbindungen oder Knoten, nicht viel zu den endgültigen Vorhersagen bei. Pruning funktioniert durch das Identifizieren und Entfernen dieser weniger wichtigen Teile, was die Modellgröße reduziert und die Leistung beschleunigt.

Andererseits ist die Quantisierung eine Optimierungstechnik, die die Präzision der Zahlen reduziert, die ein Modell verwendet. Anstatt sich auf hochpräzise 32-Bit-Gleitkommazahlen zu verlassen, wechselt das Modell zu kleineren, effizienteren Formaten wie 8-Bit-Integers. Diese Änderung trägt dazu bei, den Speicherverbrauch zu senken und die Inferenz zu beschleunigen, also den Prozess, bei dem das Modell Vorhersagen trifft.

Ein Blick auf Pruning und Quantisierung

Abb. 2. Ein Blick auf Pruning und Quantisierung. (Quelle)

Link to this sectionWie Pruning und Quantisierung funktionieren#

Nachdem wir nun ein besseres Verständnis davon haben, was Pruning und Quantisierung sind, schauen wir uns an, wie beide funktionieren.

Pruning erfolgt durch einen Prozess, der als Sensitivitätsanalyse bekannt ist. Dabei wird ermittelt, welche Teile der neuronalen Netzwerkmodelle, wie bestimmte Gewichte, Neuronen oder Kanäle, am wenigsten zur endgültigen Vorhersage beitragen. Diese Teile können mit minimaler Auswirkung auf die Genauigkeit entfernt werden. Nach dem Pruning wird das Modell normalerweise neu trainiert, um seine Leistung feinabzustimmen. Dieser Zyklus kann wiederholt werden, um das richtige Gleichgewicht zwischen Größe und Genauigkeit zu finden.

In der Zwischenzeit konzentriert sich die Modellquantisierung darauf, wie das Modell Daten verarbeitet. Sie beginnt mit der Kalibrierung, bei der das Modell auf Beispieldaten läuft, um den Wertebereich zu lernen, den es verarbeiten muss. Diese Werte werden dann von 32-Bit-Gleitkommaformaten in Formate mit geringerer Präzision wie 8-Bit-Integers konvertiert.

Quantisierung hilft, Modellgröße und Komplexität zu reduzieren

Abb. 3. Quantisierung hilft, Modellgröße und Komplexität zu reduzieren. (Quelle)

Es gibt verschiedene Tools, die den Einsatz von Pruning und Quantisierung in realen KI-Projekten erleichtern. Die meisten KI-Frameworks, wie PyTorch und TensorFlow, bieten integrierte Unterstützung für diese Optimierungstechniken, sodass Entwickler sie direkt in den Modellbereitstellungsprozess integrieren können.

Sobald ein Modell optimiert ist, können Tools wie ONNX Runtime dabei helfen, es effizient auf verschiedenen Hardwareplattformen wie Servern, Desktops und Edge-Geräten auszuführen. Außerdem bietet Ultralytics Integrationen an, mit denen YOLO Modelle in Formate exportiert werden können, die für die Quantisierung geeignet sind, was die Reduzierung der Modellgröße und die Steigerung der Leistung erleichtert.

Link to this sectionEin Überblick über die Ultralytics YOLO Modelloptimierung#

Ultralytics YOLO Modelle wie YOLO11 sind weithin bekannt für ihre schnelle Ein-Schritt-Objekterkennung, was sie ideal für Vision AI Aufgaben in Echtzeit macht. Sie sind bereits so konzipiert, dass sie leicht und effizient genug für den Edge-Einsatz sind. Die Schichten, die für die Verarbeitung visueller Merkmale zuständig sind, sogenannte Faltungsschichten, können jedoch bei der Inferenz immer noch beachtliche Rechenleistung erfordern.

Du fragst dich vielleicht: Wenn YOLO11 bereits für die Edge-Nutzung optimiert ist, warum braucht es weitere Optimierungen? Einfach ausgedrückt: Nicht alle Edge-Geräte sind gleich. Einige laufen auf sehr minimalistischer Hardware, wie winzigen eingebetteten Prozessoren, die weniger Strom verbrauchen als eine Standard-LED-Glühbirne.

In diesen Fällen benötigt selbst ein gestrafftes Modell wie YOLO11 zusätzliche Optimierungen, um eine reibungslose und zuverlässige Leistung zu gewährleisten. Techniken wie Pruning und Quantisierung helfen, die Größe des Modells zu reduzieren und die Inferenz zu beschleunigen, ohne die Genauigkeit nennenswert zu beeinträchtigen, was sie ideal für solch eingeschränkte Umgebungen macht.

Um die Anwendung dieser Optimierungstechniken zu erleichtern, unterstützt Ultralytics verschiedene Integrationen, die zum Exportieren von YOLO Modellen in mehrere Formate wie ONNX, TensorRT, OpenVINO, CoreML und PaddlePaddle verwendet werden können. Jedes Format ist so konzipiert, dass es gut mit bestimmten Hardwaretypen und Bereitstellungsumgebungen funktioniert.

ONNX wird beispielsweise aufgrund seiner Kompatibilität mit einer Vielzahl von Tools und Plattformen häufig in Quantisierungs-Workflows verwendet. TensorRT hingegen ist hochgradig für NVIDIA Geräte optimiert und unterstützt Inferenz mit geringer Präzision unter Verwendung von INT8, was es ideal für Hochgeschwindigkeits-Bereitstellungen auf Edge-GPUs macht.

Link to this sectionWirkungsvolle Anwendungsfälle der Ultralytics YOLO Modelloptimierung#

Da Computer Vision immer mehr in verschiedene reale Anwendungen Einzug hält, machen optimierte YOLO Modelle es möglich, Aufgaben wie Objekterkennung, Instanzsegmentierung und Objektverfolgung auf kleinerer, schnellerer Hardware auszuführen. Als Nächstes besprechen wir einige Anwendungsfälle, bei denen Pruning und Quantisierung diese Computer Vision Aufgaben effizienter und praktischer machen.

Link to this sectionIntelligente Überwachung mit YOLO11#

Viele industrielle Räume sowie öffentliche Bereiche sind auf Echtzeitüberwachung angewiesen, um sicher und geschützt zu bleiben. Orte wie Transitstationen, Fertigungsstätten und große Außenanlagen benötigen Vision AI Systeme, die Personen oder Fahrzeuge schnell und genau erkennen können. Oft operieren diese Standorte mit begrenzter Konnektivität und Hardwarebeschränkungen, was den Einsatz großer Modelle erschwert.

In solchen Fällen ist ein optimiertes Vision AI Modell wie YOLO11 eine großartige Lösung. Seine kompakte Größe und schnelle Leistung machen es perfekt für den Betrieb auf stromsparenden Edge-Geräten, wie eingebetteten Kameras oder intelligenten Sensoren. Diese Modelle können visuelle Daten direkt auf dem Gerät verarbeiten und so eine Echtzeiterkennung von Sicherheitsverstößen, unbefugtem Zutritt oder abnormalem Verhalten ermöglichen, ohne auf einen ständigen Cloud-Zugriff angewiesen zu sein.

YOLO11 bei der Überwachung öffentlicher Orte wie U-Bahn-Stationen

Abb. 4. YOLO11 kann verwendet werden, um öffentliche Orte wie U-Bahn-Stationen zu überwachen.

Link to this sectionVerbesserung der Sicherheit auf Baustellen mit YOLO11#

Baustellen sind schnelllebige und unvorhersehbare Umgebungen, voller schwerer Maschinen, sich bewegender Arbeiter und ständiger Aktivität. Die Bedingungen können sich aufgrund von sich ändernden Zeitplänen, Gerätebewegungen oder sogar plötzlichen Wetterumschwüngen schnell ändern. In einer solchen dynamischen Umgebung kann die Arbeitssicherheit eine ständige Herausforderung sein.

Echtzeitüberwachung spielt eine entscheidende Rolle, aber herkömmliche Systeme verlassen sich oft auf Cloud-Zugriff oder teure Hardware, die vor Ort möglicherweise nicht praktikabel ist. Hier können Modelle wie YOLO11 Wirkung zeigen. YOLO11 kann optimiert werden, um auf kleinen, effizienten Edge-Geräten zu laufen, die direkt vor Ort arbeiten, ohne eine Internetverbindung zu benötigen.

Stell dir zum Beispiel eine große Baustelle vor, wie eine Autobahnerweiterung, die sich über mehrere Hektar erstreckt. In einer solchen Umgebung kann das manuelle Verfolgen jedes Fahrzeugs oder jedes Geräts schwierig und zeitaufwendig sein. Eine Drohne, die mit einer Kamera und einem optimierten YOLO11 Modell ausgestattet ist, kann helfen, indem sie Fahrzeuge automatisch erkennt und verfolgt, den Verkehrsfluss überwacht und Sicherheitsprobleme wie unbefugten Zutritt oder unsicheres Fahrverhalten identifiziert.

Analyse von Drohnenbildern einer Baustelle

Abb. 5. Analysieren von Drohnenbildern von einer Baustelle. (Quelle)

Link to this sectionVor- und Nachteile von Pruning und Quantisierung im Computer Vision Bereich#

Hier sind einige wichtige Vorteile, die Methoden zur Optimierung von Computer Vision Modellen wie Pruning und Quantisierung bieten:

  • Kostengünstige Bereitstellung: Kleinere und effizientere Modelle können den Bedarf an teurer High-End-Hardware reduzieren, wodurch KI zugänglicher und skalierbarer für verschiedene Anwendungsfälle wird.
  • Geringere Latenz: Durch die Vereinfachung der Modellarchitektur und die Reduzierung des Rechenaufwands können diese Techniken dazu beitragen, schnellere Reaktionszeiten in Echtzeitanwendungen zu erreichen.
  • Energieeffizienz: Die Verringerung der Rechenlast senkt auch den Stromverbrauch, was besonders hilfreich für batteriebetriebene oder mobile Systeme ist.

Während Pruning und Quantisierung viele Vorteile bieten, bringen sie auch bestimmte Kompromisse mit sich, die Entwickler bei der Optimierung von Modellen berücksichtigen sollten. Hier sind einige Einschränkungen, die du im Hinterkopf behalten solltest:

  • Kompromisse bei der Genauigkeit: Wenn das Pruning zu aggressiv ist oder eine sehr niedrige Bit-Quantisierung verwendet wird, kann die Genauigkeit des Modells, gemessen an Metriken wie mAP, abfallen.
  • Hardwarebeschränkungen: Nicht alle Geräte unterstützen Formate mit geringerer Präzision wie INT8 gleich gut. Dies kann einschränken, wo und wie ein optimiertes Modell eingesetzt werden kann.
  • Implementierungskomplexität: Das Erreichen guter Ergebnisse erfordert oft eine sorgfältige, modellspezifische Abstimmung. Entwickler müssen das Modell möglicherweise neu trainieren und umfassende Tests durchführen, um die Leistung bei gleichzeitiger Effizienzsteigerung aufrechtzuerhalten.

Link to this sectionWichtige Erkenntnisse#

Pruning und Quantisierung sind nützliche Techniken, die YOLO Modellen helfen, auf Edge-Geräten eine bessere Leistung zu erbringen. Sie reduzieren die Größe des Modells, senken den Rechenbedarf und beschleunigen Vorhersagen, alles ohne spürbaren Genauigkeitsverlust.

Diese Optimierungsmethoden geben Entwicklern zudem die Flexibilität, Modelle für verschiedene Hardwaretypen anzupassen, ohne sie komplett neu aufbauen zu müssen. Mit etwas Abstimmung und Testen wird es einfacher, Vision AI in realen Situationen anzuwenden.

Werde Teil unserer wachsenden Community! Erkunde unser GitHub Repository, um mehr über KI zu erfahren. Bereit für deine Computer Vision Projekte? Sieh dir unsere Lizenzoptionen an. Entdecke KI in der Landwirtschaft und Vision AI im Gesundheitswesen auf unseren Lösungsseiten!

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.
Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.
Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.
Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.
Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.
Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.
Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.
Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens