Rectified Flow
Découvre Rectified Flow, une technique de modélisation générative efficace pour la création de données haute fidélité. Apprends à utiliser des données synthétiques avec les modèles Ultralytics YOLO26.
Rectified Flow est une technique avancée de generative modeling qui apprend à mapper une distribution de bruit simple et facilement échantillonnable vers une distribution de données complexe en utilisant des trajectoires en ligne droite. Émergeant comme une alternative hautement efficace aux frameworks génératifs traditionnels, Rectified Flow fonctionne en résolvant des équations différentielles ordinaires (EDO) qui transportent des points de données depuis un pur bruit directement vers des images, audios ou vidéos cibles. Comme ces chemins sont entraînés pour être aussi droits que possible, le modèle nécessite beaucoup moins d'étapes pour générer des sorties de haute qualité, ce qui réduit considérablement la charge computationnelle durant l'inférence.
Link to this sectionRectified Flow vs Modèles de Diffusion#
Bien que les deux techniques appartiennent à la vaste famille de l'IA générative, Rectified Flow corrige certaines inefficacités fondamentales trouvées dans les Diffusion Models standards. Les modèles de diffusion construisent généralement un chemin courbe et bruité entre la distribution de bruit et les données finales, nécessitant des dizaines, voire des centaines d'étapes de débruitage itératives pour générer une sortie claire. En revanche, Rectified Flow optimise explicitement les chemins de transport pour qu'ils soient droits. Ce « redressement » permet au modèle de faire des pas beaucoup plus grands sans perdre en précision, permettant une génération haute fidélité en seulement quelques itérations.
Link to this sectionApplications concrètes#
L'efficacité et la stabilité de Rectified Flow en ont fait une pierre angulaire des pipelines modernes de computer vision et de génération de médias.
- High-Fidelity Synthetic Data Generation : Les organisations utilisent les modèles Rectified Flow pour générer rapidement des computer vision datasets massifs et diversifiés. Ces données synthétiques peuvent simuler des cas limites rares, ce qui est crucial pour entraîner des object detection architectures robustes sans le coût prohibitif de la collecte manuelle de données.
- Advanced Text-to-Image Systems : Des organisations de recherche en IA de premier plan, notamment Google DeepMind et OpenAI, explorent de plus en plus les techniques génératives à chemin droit. Ces modèles alimentent des outils de génération d'images et de vidéos rapides destinés au grand public, où une faible inference latency est critique pour une expérience utilisateur fluide.
Link to this sectionAméliorer les flux de travail de Computer Vision#
En pratique, les images synthétiques de haute qualité produites par les modèles Rectified Flow sont fréquemment utilisées pour pré-entraîner ou affiner des modèles de vision en aval. Par exemple, tu peux générer des images ciblées de défauts de fabrication et utiliser l'Ultralytics Platform pour annoter ces nouvelles données sans effort dans le cloud. Une fois annoté, le dataset peut être utilisé pour entraîner un modèle Ultralytics YOLO26 pour une object detection haute précision en temps réel.
Voici un exemple concis démontrant comment entraîner un modèle YOLO26 sur un dataset personnalisé (qui pourrait inclure des données synthétiques générées via Rectified Flow) en utilisant le package ultralytics :
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")En comblant le fossé entre les modèles génératifs efficaces et les puissants outils discriminatifs comme YOLO26, les praticiens du machine learning peuvent construire des systèmes d'IA hautement résilients. Qu'il s'agisse d'évaluer les model performance metrics ou d'exporter vers des appareils de périphérie via TensorRT, la combinaison de données synthétiques et d'une détection de pointe accélère les steps of a CV project, garantissant que les modèles sont à la fois extrêmement précis et incroyablement rapides.






