Verstehen Sie FLOPs beim maschinellen Lernen! Erfahren Sie, wie sie die Modellkomplexität misst, sich auf die Effizienz auswirkt und bei der Hardwareauswahl hilft.
FLOPs oder Fließkommaoperationen sind eine grundlegende Metrik, die beim maschinellen Lernen (ML) verwendet wird, um die Berechnungskomplexität eines Modells zu messen. Eine Fließkomma-Operation ist eine mathematische Berechnung wie Addition, Subtraktion, Multiplikation oder Division, bei der Zahlen mit Dezimalpunkten verwendet werden, die in neuronalen Netzen Standard sind. Während sich der Begriff technisch gesehen auf Operationen pro Sekunde beziehen kann, quantifizieren FLOPs im Kontext des Deep Learning in der Regel die Gesamtzahl dieser Operationen, die für einen einzigen Vorwärtsdurchlauf eines Modells erforderlich sind. Diese Metrik bietet eine hardwareunabhängige Möglichkeit, abzuschätzen, wie rechenintensiv ein Modell während der Inferenz ist. Die Zahlen sind oft so groß, dass sie in GigaFLOPs (GFLOPs), also Milliarden von Operationen, oder TeraFLOPs (TFLOPs), also Billionen von Operationen, angegeben werden.
FLOPs sind ein wichtiger Indikator für die Effizienz eines Modells. Eine niedrigere FLOP-Zahl deutet im Allgemeinen darauf hin, dass ein Modell schneller ist und weniger Rechenleistung für die Ausführung benötigt. Dies ist besonders wichtig für Anwendungen, bei denen die Ressourcen begrenzt sind, wie z. B. bei Edge AI und auf mobilen Geräten. Durch die Analyse von FLOPs können Entwickler:
FLOPs sind eine praktische Kennzahl, die täglich bei der Entwicklung und dem Einsatz von KI-Lösungen verwendet wird.
Mobile Vision-Anwendungen: Ein Entwickler, der eine Echtzeit-Objekterkennungsfunktion für eine Smartphone-App entwickelt, muss ein Modell wählen, das schnell läuft, ohne den Akku zu belasten. Durch den Vergleich der FLOPs von leichtgewichtigen Modellen wie einer kleinen Ultralytics YOLO11-Variante mit anderen können sie ein Modell auswählen, das ein gutes Gleichgewicht zwischen Geschwindigkeit und Genauigkeit für die CPU oder GPU des Geräts bietet.
Autonome Fahrzeuge: Beim autonomen Fahren müssen Wahrnehmungsmodelle Kamerabilder mit extrem niedriger Latenzzeit verarbeiten. Ingenieure, die diese Systeme entwickeln, analysieren die FLOPs verschiedener Modelle, um sicherzustellen, dass die gewählte Architektur auf der speziellen Hardware des Fahrzeugs ausgeführt werden kann. Ein Modell wie YOLO11 könnte einem komplexeren Modell vorgezogen werden, wenn es aufgrund seiner geringeren FLOPs die strengen Zeitanforderungen für einen sicheren Betrieb erfüllen kann.
Es ist wichtig, FLOPs von anderen gebräuchlichen Metriken zu unterscheiden:
FLOPs sind zwar nützlich, haben aber ihre Grenzen:
Daher sollten FLOPs zusammen mit anderen Leistungsmetriken, Parametern und realen Benchmarks betrachtet werden, um ein vollständiges Bild der Modelleffizienz zu erhalten. Tools wie Ultralytics HUB können dabei helfen, Modelle zu verwalten und verschiedene Leistungsaspekte während der Entwicklung und Bereitstellung zu verfolgen.