Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Zurück zum Ultralytics Glossar

Diffusion Forcing

Erfahre mehr über Diffusion Forcing, ein generatives Modellierungsparadigma, das autoregressive Vorhersage mit Sequenzdiffusion für eine konsistente zeitliche Datengenerierung kombiniert.

Diffusion Forcing ist ein fortschrittliches generatives Modellierungsparadigma, das 2024 eingeführt wurde und die Stärken der autoregressiven Next-Token-Vorhersage mit der Full-Sequence-Diffusion verbindet. Durch die Anwendung unabhängiger und variabler Rauschpegel auf verschiedene Schritte innerhalb einer Sequenz ermöglicht diese Technik es Machine Learning-Modellen, hochkonsistente zeitliche Daten zu generieren. Im Gegensatz zu herkömmlichen Methoden, die entweder diskrete Tokens nacheinander vorhersagen oder eine gesamte Sequenz gleichzeitig entrauschen, trainiert Diffusion Forcing Modelle dazu, als robuste Planer und Sequenzgeneratoren zu fungieren, die kontinuierliche Zustände mit komplexen Langzeitabhängigkeiten bewältigen.

Link to this sectionWie Diffusion Forcing funktioniert#

Im Kern ist Diffusion Forcing von klassischem Teacher Forcing inspiriert, das in rekurrenten neuronalen Netzen verwendet wird. Anstatt jedoch Ground-Truth-Tokens für die Vorhersage des nächsten Schritts einzuspeisen, führt es einem kausalen Transformer teilweise verrauschte, kontinuierliche Historien zu. Das Modell lernt, den aktuellen Zustand in Abhängigkeit von der Vergangenheit zu entrauschen. Dies ermöglicht es dem Netzwerk, das Rauschniveau pro Frame dynamisch anzupassen, was ein flexibles Framework für Aufgaben bietet, die sowohl lokalisierte Präzision als auch ein umfassendes zeitliches Bewusstsein erfordern.

Dieser Ansatz ist äußerst vorteilhaft bei der Entwicklung intelligenter AI Agents, die auf unvorhersehbare Umgebungen reagieren und gleichzeitig einen langfristigen Plan einhalten müssen, wobei die bei Standard-autoregressiven Modellen häufig auftretenden Fehlerakkumulationen umgangen werden.

Link to this sectionPraxisanwendungen#

Diffusion Forcing gewinnt in verschiedenen komplexen Artificial Intelligence-Bereichen schnell an Bedeutung:

  • Robotik und visuo-motorische Steuerung: Autonome Roboterarme und selbstfahrende Systeme nutzen Diffusion Forcing, um flüssige, kontinuierliche Trajektorienpläne zu erstellen. Durch die Vorhersage von Sequenzen kontinuierlicher Motorbefehle können Roboter sich an dynamische Hindernisse anpassen und dabei einen stabilen Pfad zu ihrem Ziel beibehalten.
  • Videogenerierung und -vorhersage: In modernen Computer Vision-Pipelines nutzen Modelle diese Technik, um zukünftige Videoframes mit strenger zeitlicher Konsistenz vorherzusagen und die Flimmer-Artefakte zu vermeiden, die bei früheren generativen Ansätzen häufig auftreten.

Link to this sectionDiffusion Forcing vs. Standard-Diffusionsmodelle#

Obwohl sie einen grundlegenden Entrauschungsmechanismus teilen, unterscheidet sich Diffusion Forcing deutlich von Standard-Diffusion Models. Traditionelle Diffusionsmodelle, wie sie für die Text-to-Image-Generierung verwendet werden, entrauschen normalerweise alle Pixel oder latenten Variablen einer statischen Ausgabe gleichzeitig. Im Gegensatz dazu modelliert Diffusion Forcing explizit eine Zeitreihe und zwingt das Netzwerk dazu, die kausale Sequenzreihenfolge einzuhalten. Dies macht es weitaus besser geeignet für zeitliche Aufgaben wie Trajektorienvorhersage und Action Recognition.

Link to this sectionIntegration der Sequenzverarbeitung in der Praxis#

Während Diffusion Forcing primär bei generativen Sequenzaufgaben angewendet wird, ist die Interpretation zeitlicher Sequenzen in modernen Vision-Pipelines ebenso kritisch. Beispielsweise kannst du Objekte effizient über sequentielle Videoframes hinweg verfolgen, indem du Ultralytics YOLO26 verwendest, das zeitliche Konsistenz nativ beim Object Tracking handhabt.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")

# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)

# Iterate through the sequence of frames
for frame_result in results:
    # Access temporal tracking IDs for objects in the current state
    print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")

Für Teams, die Sequenzdaten sammeln und fortschrittliche Vision-Modelle trainieren möchten, bietet die Ultralytics Platform robuste Cloud-basierte Tools zur Verwaltung komplexer Datensätze, zur Nachverfolgung von Experimenten und zur nativen Bereitstellung von Modellen am Edge. Ob du mit modernsten kausalen Transformers in PyTorch experimentierst oder Echtzeit-Tracking-Systeme einsetzt, die Beherrschung der Schnittmenge von räumlichen und zeitlichen Daten ist für die Zukunft der AI unerlässlich.

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens