Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Retour au glossaire Ultralytics

Diffusion Forcing

Découvre le Diffusion Forcing, un paradigme de modélisation générative qui combine la prédiction autorégressive et la diffusion de séquence pour une génération cohérente de données temporelles.

Diffusion Forcing est un paradigme de modélisation générative avancé introduit en 2024 qui fusionne les forces de la prédiction autorégressive du prochain jeton avec la diffusion de séquence complète. En appliquant des niveaux de bruit indépendants et variables à différentes étapes au sein d'une séquence, cette technique permet aux modèles de machine learning de générer des données temporelles hautement cohérentes. Contrairement aux méthodes traditionnelles qui prédisent soit des jetons discrets un par un, soit débruitent une séquence entière simultanément, Diffusion Forcing entraîne les modèles à agir en tant que planificateurs robustes et générateurs de séquences, gérant des états continus avec des dépendances complexes à long terme.

Link to this sectionComment fonctionne Diffusion Forcing#

À sa base, Diffusion Forcing s'inspire du teacher forcing classique utilisé dans les réseaux de neurones récurrents. Cependant, au lieu de fournir des jetons discrets de vérité terrain pour prédire l'étape suivante, il alimente un Transformer causal avec des historiques continus partiellement bruités. Le modèle apprend à débruiter l'état actuel en fonction du passé. Cela permet au réseau d'ajuster dynamiquement le niveau de bruit par image, offrant un cadre flexible pour les tâches qui nécessitent à la fois une précision localisée et une conscience temporelle étendue.

Cette approche est très bénéfique lors de la construction d'AI agents intelligents qui doivent réagir à des environnements imprévisibles tout en respectant un plan à long terme, en évitant les problèmes d'erreurs cumulatives souvent rencontrés dans les modèles autorégressifs standard.

Link to this sectionApplications concrètes#

Diffusion Forcing gagne rapidement du terrain dans plusieurs domaines complexes de l'artificial intelligence :

  • Robotics and Visuo-Motor Control : Les bras robotiques autonomes et les systèmes de conduite autonome utilisent Diffusion Forcing pour générer des plans de trajectoire fluides et continus. En prédisant des séquences de commandes motrices continues, les robots peuvent s'adapter à des obstacles dynamiques tout en maintenant une trajectoire stable vers leur objectif.
  • Video Generation and Forecasting : Dans les pipelines avancés de computer vision, les modèles tirent parti de cette technique pour prédire les futures images vidéo avec une cohérence temporelle stricte, évitant les artefacts de scintillement couramment observés dans les approches génératives antérieures.

Link to this sectionDiffusion Forcing vs. modèles de diffusion standard#

Bien qu'ils partagent un mécanisme de débruitage fondamental, Diffusion Forcing est distinctement différent des Diffusion Models standard. Les modèles de diffusion traditionnels, comme ceux utilisés pour la génération text-to-image, débruitent généralement tous les pixels ou variables latentes d'une sortie statique unique simultanément. En revanche, Diffusion Forcing modélise explicitement une série temporelle, forçant le réseau à respecter l'ordre causal de la séquence. Cela le rend bien plus adapté aux tâches temporelles comme la prédiction de trajectoire et l'action recognition.

Link to this sectionIntégrer le traitement de séquence en pratique#

Bien que Diffusion Forcing s'applique principalement aux tâches de séquence générative, l'interprétation des séquences temporelles est tout aussi cruciale dans les pipelines de vision modernes. Par exemple, tu peux suivre efficacement des objets à travers des images vidéo séquentielles en utilisant Ultralytics YOLO26, qui gère nativement la cohérence temporelle lors de l'object tracking.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model for high-speed inference
model = YOLO("yolo26n.pt")

# Process a temporal sequence (video) to maintain consistent object identities
results = model.track(source="path/to/video.mp4", stream=True)

# Iterate through the sequence of frames
for frame_result in results:
    # Access temporal tracking IDs for objects in the current state
    print(f"Tracked {len(frame_result.boxes)} objects in the current frame.")

Pour les équipes cherchant à mettre à l'échelle la collecte de données de séquence et à entraîner des modèles de vision avancés, l'Ultralytics Platform fournit des outils cloud robustes pour gérer des jeux de données complexes, suivre les expériences et déployer des modèles nativement en périphérie. Que tu expérimentes avec des transformers causaux de pointe dans PyTorch ou que tu déploies des systèmes de suivi en temps réel, maîtriser l'intersection des données spatiales et temporelles est essentiel pour l'avenir de l'IA.

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.

En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.

En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.

En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.

En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.

En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.

En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique