Glossar

GPU (Graphics Processing Unit)

Entdecken Sie, wie GPUs KI und maschinelles Lernen revolutionieren, indem sie Deep Learning beschleunigen, Workflows optimieren und Anwendungen in der realen Welt ermöglichen.

Eine Graphics Processing Unit (GPU) ist eine spezialisierte elektronische Schaltung, die ursprünglich entwickelt wurde, um die Erstellung und das Rendern von Bildern, Videos und Animationen für die Anzeige zu beschleunigen. Ihre hochparallele Architektur macht sie jedoch außergewöhnlich effizient bei der gleichzeitigen Verarbeitung großer Datenblöcke. Diese Fähigkeit hat GPUs zum Arbeitstier der modernen künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) gemacht, wodurch die Zeit für das Training komplexer Modelle drastisch verkürzt und die Entwicklung ausgefeilterer KI-Lösungen ermöglicht wird.

Die Rolle von GPUs in KI und maschinellem Lernen

Die Leistungsfähigkeit einer GPU in der KI beruht auf ihrer Fähigkeit, viele tausend Berechnungen gleichzeitig durchzuführen, ein Konzept, das als parallele Verarbeitung bekannt ist. Deep-Learning-Modelle, wie z. B. Convolutional Neural Networks (CNNs), basieren auf mathematischen Operationen, die in Tausende von kleineren, unabhängigen Aufgaben zerlegt werden können. Bahnbrechende Forschungsergebnisse, wie z. B. die Veröffentlichung über die AlexNet-Architektur, demonstrierten die Effektivität des Trainings von CNNs auf GPUs.

Eine GPU mit ihren Tausenden von Kernen kann diese Aufgaben parallel ausführen und die Berechnungszeit für das Modelltraining von Wochen oder Monaten auf nur noch Tage oder Stunden drastisch reduzieren. Diese Beschleunigung ist entscheidend für die Iteration von Modellen, das Experimentieren mit verschiedenen Architekturen und die Durchführung umfangreicher Hyperparameter-Optimierung. Die Leistung dieser Prozessoren wird oft in FLOPS (Floating-Point Operations Per Second) gemessen.

Wesentliche Unterschiede zu CPUs und TPUs

Obwohl GPUs, CPUs und Tensor Processing Units (TPUs) allesamt Arten von Prozessoren sind, sind sie für verschiedene Arten von Aufgaben optimiert:

CPU (Central Processing Unit): Entwickelt für Allzweck-Computing, zeichnet sie sich bei sequenziellen Aufgaben und der Verwaltung von Systemoperationen aus. CPUs haben einige leistungsstarke Kerne, die für niedrige Latenz optimiert sind. Sie können einen detaillierten CPU- vs. GPU-Vergleich lesen.
GPU (Graphics Processing Unit): Optimiert für parallele Operationen mit Tausenden von einfacheren Kernen. Ideal für Aufgaben, die aufgeteilt und gleichzeitig verarbeitet werden können, wie z. B. das Rendern von Grafiken und das Training von Deep-Learning-Modellen. GPUs von Herstellern wie NVIDIA und AMD sind fester Bestandteil des High-Performance Computing (HPC).
TPU (Tensor Processing Unit): Ein kundenspezifischer Application-Specific Integrated Circuit (ASIC), der von Google zur Beschleunigung von Machine-Learning-Workloads entwickelt wurde. TPUs sind hochgradig optimiert für groß angelegte Matrixberechnungen, die in neuronalen Netzen (NN) üblich sind, insbesondere in Frameworks wie TensorFlow.

GPUs bieten ein leistungsstarkes Gleichgewicht zwischen hoher Leistung für parallele Aufgaben und Flexibilität für eine breite Palette von Anwendungen, was sie zu einer bevorzugten Wahl für viele KI-Entwickler macht.

Anwendungsfälle in der Praxis

Die Auswirkungen der GPU-Beschleunigung sind in zahlreichen KI-Anwendungen offensichtlich. Hier sind zwei prominente Beispiele:

Autonome Fahrzeuge: Selbstfahrende Autos sind auf eine Reihe von Sensoren angewiesen, um ihre Umgebung wahrzunehmen. GPUs sind unerlässlich, um massive Datenströme von Kameras und LiDAR in Echtzeit zu verarbeiten. Sie treiben Objekterkennungs-Modelle wie Ultralytics YOLO11 an, um Fußgänger, andere Fahrzeuge und Verkehrsschilder zu identifizieren, sodass das Fahrzeug sofort wichtige Fahrentscheidungen treffen kann. Dies ist eine Schlüsselkomponente moderner KI-gestützter Automobillösungen.
Medizinische Bildanalyse: Im Gesundheitswesen beschleunigen GPUs die Analyse komplexer medizinischer Scans wie MRTs und CTs. Wie in Fachzeitschriften wie Nature Reviews Clinical Oncology beschrieben, wächst die Rolle der KI in der Radiologie. Modelle, die auf GPUs laufen, können Aufgaben wie die Bildsegmentierung durchführen, um Tumore mit hoher Präzision abzugrenzen und Radiologen bei schnelleren, genaueren Diagnosen zu unterstützen. Diese Technologie ist ein Eckpfeiler der modernen KI im Gesundheitswesen und wird für Anwendungen wie die Erkennung von Tumoren in medizinischen Bildern eingesetzt.

Ökosystem und Nutzung

Die breite Akzeptanz von GPUs in der KI wird durch ein ausgereiftes und robustes Ökosystem unterstützt. Die CUDA-Plattform von NVIDIA ist ein dominantes paralleles Rechenframework und Programmiermodell, das es Entwicklern ermöglicht, die Leistung von NVIDIA-GPUs für Allzweck-Computing zu nutzen.

Deep-Learning-Frameworks wie PyTorch und TensorFlow sind stark optimiert, um die GPU-Beschleunigung zu nutzen, was das Trainieren von Modellen auf dieser Hardware vereinfacht. Das Einrichten einer Entwicklungsumgebung kann mithilfe von Containerisierungs-Tools wie Docker vereinfacht werden. Eine Anleitung finden Sie im Ultralytics Docker Quickstart-Leitfaden. Eine effiziente Modellbereitstellung erfordert oft weitere Optimierungen mit Tools wie TensorRT oder OpenVINO, um die Echtzeit-Inferenzgeschwindigkeit auf der Zielhardware zu maximieren. Sie können verschiedene Ultralytics-Lösungen erkunden, die darauf ausgelegt sind, die GPU-Fähigkeiten effektiv zu nutzen. Die Verwaltung des gesamten Workflows, von Datensätzen bis zur Bereitstellung, kann mithilfe von Plattformen wie Ultralytics HUB optimiert werden.

GPU (Graphics Processing Unit)

Trainieren Sie Ultralytics YOLO-Modelle, um Arbeitsabläufe in allen Branchen zu rationalisieren

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie KI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Die Rolle von GPUs in KI und maschinellem Lernen

Wesentliche Unterschiede zu CPUs und TPUs

Anwendungsfälle in der Praxis

Ökosystem und Nutzung

Mehr in dieser Kategorie lesen

Die wichtigsten Highlights von Ultralytics auf der PyTorch Conference 2025

Selbstüberwachtes Lernen zur Entrauschung von Bildern

Vision AI unterstützt Systeme zur Überwachung der Fahreraufmerksamkeit

Treten Sie der Ultralytics-Community bei