Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

BFloat16 (BF16)

Entdecke BFloat16 (BF16) für Deep Learning. Erfahre, wie dieses 16-Bit-Format die Trainingsgeschwindigkeit und Effizienz bei Modellen wie Ultralytics YOLO26 steigert.

BFloat16, oder Brain Floating Point, ist ein 16-Bit-Computer-Zahlenformat, das stark für Machine Learning-Anwendungen optimiert ist. Ursprünglich vom Google Brain Team entwickelt, stellt es einen spezialisierten Ansatz dar, um riesige Arrays von Modellgewichten und Gradienten effizient zu verarbeiten. Im Gegensatz zur standardmäßigen 32-Bit-Gleitkommazahl (FP32) weisen die mathematischen Eigenschaften von BFloat16 8 Bits für den Exponenten und 7 Bits für den Bruchteil (Mantisse) zu. Diese einzigartige Struktur bietet exakt denselben dynamischen Bereich wie FP32, jedoch mit reduzierter Genauigkeit, wodurch der Speicherbedarf komplexer Deep Learning-Architekturen effektiv halbiert wird, ohne unter der numerischen Instabilität zu leiden, die oft bei älteren 16-Bit-Formaten auftritt.

Link to this sectionBFloat16 vs. Float16 (FP16): Wichtige Unterschiede#

Beim Vergleich von Halbpräzisionsformaten ist der Unterschied zwischen BF16 und dem standardmäßigen FP16 (basierend auf dem IEEE-Standard für Gleitkomma-Arithmetik) für KI-Entwickler entscheidend.

FP16 verwendet 5 Bits für den Exponenten und 10 Bits für die Mantisse. Diese Struktur verleiht FP16 mehr numerische Präzision, aber einen deutlich schmaleren dynamischen Bereich. Folglich erfordern FP16-Trainings-Workflows oft komplexe Loss-Scaling-Techniken, um Gradienten-Underflow zu verhindern – ein Szenario, bei dem winzige Gradienten-Updates zu Nullen werden. Der 8-Bit-Exponent von BFloat16 löst dies, indem er den dynamischen Bereich von FP32 erreicht. Das bedeutet, dass Entwickler BF16 nahtlos in neuronale Netze integrieren können, ohne Hyperparameter anpassen oder den Loss skalieren zu müssen. Dies macht es zum bevorzugten Format für die Stabilisierung des Trainings massiver Large Language Models (LLMs). Detaillierte numerische Spezifikationen können auf der BFloat16-Seite von Wikipedia weiter erforscht werden.

Link to this sectionVorteile für das Deep Learning-Training#

Aktuelle Studien zu BFloat16 für das Deep Learning-Training unterstreichen, wie es den gesamten Trainingsprozess drastisch beschleunigt. Durch die Reduzierung der Speicherbandbreite, die zum Abrufen und Speichern von Tensoren erforderlich ist, können Anwender ihre Batch-Größen verdoppeln oder Foundation Models mit Milliarden von Parametern auf bestehender Hardware skalieren. Interessanterweise verhält sich die leichte Reduzierung der Mantissen-Präzision während des Trainings wie eine milde Regularisierungstechnik, die gelegentlich die Fähigkeit eines Modells zur Generalisierung auf unbekannte Daten verbessern kann. Es ist derzeit das Rückgrat moderner Mixed Precision-Verfahren.

Link to this sectionHardware-Kompatibilität und Ausführung#

Um die Geschwindigkeitsvorteile von BFloat16 voll auszuschöpfen, ist dedizierte Hardware-Unterstützung erforderlich. Es erzielt hohe Leistung auf Cloud TPUs und wird nativ auf modernen NVIDIA GPUs ab der NVIDIA Ampere-Architektur (wie der RTX 30-Serie, A100 und professionellen Workstation-Karten wie der RTX A6000) bis hin zu den neueren NVIDIA Hopper- und Blackwell-Generationen beschleunigt.

Bei der Verwendung von Frameworks mit PyTorch Automatic Mixed Precision (AMP) können Entwickler torch.autocast nutzen, um unterstützte mathematische Operationen automatisch über spezialisierte BF16 Tensor Cores zu leiten. Dies maximiert den Durchsatz bei gleichzeitiger Minimierung der Inferenzlatenz.

Link to this sectionKI-Anwendungen in der Praxis#

BFloat16 entwickelt sich schnell zum Industriestandard in zahlreichen Bereichen:

  • Generative KI und LLMs: Forschungsorganisationen, die OpenAIs neueste generative Modelle oder Claude von Anthropic trainieren, nutzen BFloat16 für modernste Netzwerke. Darüber hinaus verwenden sie BF16 für KV-Caching während der Inferenz. Dieses Format ist entscheidend, um Speichererschöpfung in Cloud-Computing-Umgebungen bei der Bearbeitung von Millionen gleichzeitiger Chat-Anfragen zu verhindern.
  • Hochauflösende Computer Vision: Bei der Verarbeitung von 4K-Videostreams oder großen Satellitenbildern sind die VRAM-Grenzen eng. Durch den Einsatz fortschrittlicher Architekturen wie Ultralytics YOLO26 mit BFloat16 können automatisierte Sicherheits- oder Fertigungssysteme eine Hochgeschwindigkeits-Objekterkennung auf hardwarebeschränkten Edge AI-Setups, wie z. B. NVIDIA Jetson-Geräten, erreichen und dabei strenge Genauigkeitsanforderungen einhalten.

Link to this sectionImplementierung von BFloat16 mit Ultralytics#

Das ultralytics-Paket, unterstützt durch PyTorch, macht die Ausführung von Modellen in BFloat16 außergewöhnlich unkompliziert. Nachfolgend findest du ein prägnantes Beispiel, das zeigt, wie du ein Modell lädst und die Inferenz innerhalb eines BF16-Autocast-Kontextblocks durchführst.

import torch
from ultralytics import YOLO

# Initialize the latest Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Verify that the active GPU architecture supports BFloat16
if torch.cuda.is_available() and torch.cuda.is_bf16_supported():
    # Use PyTorch autocast to run inference purely in BFloat16
    with torch.autocast(device_type="cuda", dtype=torch.bfloat16):
        results = model.predict("https://ultralytics.com/images/bus.jpg")

        print("Inference completed successfully using BFloat16 precision.")

Für Teams, die diese Optimierungen mühelos skalieren möchten, verwaltet die Ultralytics-Plattform automatisch Präzisionsformate über komplexe Cloud-Trainings-Pipelines hinweg und stellt sicher, dass Anwender die bestmögliche Geschwindigkeit und Genauigkeit erzielen, ohne Low-Level-Hardware-Code verwalten zu müssen.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens