Rectified Flow
Explora Rectified Flow, una técnica eficiente de modelado generativo para la creación de datos de alta fidelidad. Aprende a utilizar datos sintéticos con los modelos Ultralytics YOLO26.
Rectified Flow es una técnica avanzada de generative modeling que aprende a asignar una distribución de ruido simple y fácilmente muestreable a una distribución de datos compleja mediante trayectorias en línea recta. Surgiendo como una alternativa altamente eficiente a los marcos generativos tradicionales, Rectified Flow opera resolviendo ecuaciones diferenciales ordinarias (EDO) que transportan puntos de datos desde ruido puro directamente a imágenes, audio o vídeo de destino. Debido a que estas trayectorias están entrenadas para ser lo más rectas posible, el modelo requiere significativamente menos pasos para generar resultados de alta calidad, lo que reduce drásticamente la sobrecarga computacional durante la inferencia.
Link to this sectionRectified Flow frente a modelos de difusión#
Aunque ambas técnicas pertenecen a la familia más amplia de la IA generativa, Rectified Flow soluciona algunas de las ineficiencias fundamentales que se encuentran en los Diffusion Models estándar. Los modelos de difusión suelen construir una trayectoria curva y ruidosa entre la distribución de ruido y los datos finales, lo que requiere docenas o incluso cientos de pasos iterativos de eliminación de ruido para generar una salida clara. Por el contrario, Rectified Flow optimiza explícitamente las rutas de transporte para que sean rectas. Este "enderezamiento" permite al modelo dar pasos mucho más grandes sin perder precisión, lo que permite una generación de alta fidelidad en solo unas pocas iteraciones.
Link to this sectionAplicaciones en el mundo real#
La eficiencia y estabilidad de Rectified Flow lo han convertido en una piedra angular de los conductos modernos de computer vision y generación de medios.
- High-Fidelity Synthetic Data Generation: Las organizaciones utilizan modelos Rectified Flow para generar rápidamente computer vision datasets masivos y diversos. Estos datos sintéticos pueden simular casos extremos poco frecuentes, lo cual es crucial para entrenar object detection architectures sólidas sin el coste prohibitivo de la recopilación manual de datos.
- Advanced Text-to-Image Systems: Las principales organizaciones de investigación en IA, incluidas Google DeepMind y OpenAI, exploran cada vez más las técnicas generativas de trayectoria recta. Estos modelos impulsan herramientas de generación de imágenes y vídeo rápidas y orientadas al consumidor donde una inference latency baja es fundamental para una experiencia de usuario fluida.
Link to this sectionMejora de los flujos de trabajo de computer vision#
En la práctica, las imágenes sintéticas de alta calidad producidas por los modelos Rectified Flow se utilizan con frecuencia para preentrenar o ajustar modelos de visión posteriores. Por ejemplo, los desarrolladores pueden generar imágenes específicas de defectos de fabricación y utilizar Ultralytics Platform para anotar estos nuevos datos sin esfuerzo en la nube. Una vez anotado, el conjunto de datos puede utilizarse para entrenar un modelo Ultralytics YOLO26 para una object detection de alta precisión y en tiempo real.
Aquí tienes un ejemplo conciso que demuestra cómo entrenar un modelo YOLO26 en un conjunto de datos personalizado (que podría incluir datos sintéticos generados mediante Rectified Flow) utilizando el paquete ultralytics:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")Al cerrar la brecha entre modelos generativos eficientes y potentes herramientas discriminativas como YOLO26, los profesionales del aprendizaje automático pueden crear sistemas de IA altamente resistentes. Ya sea evaluando model performance metrics o exportando a dispositivos periféricos mediante TensorRT, la combinación de datos sintéticos y detección de última generación acelera los steps of a CV project, garantizando que los modelos sean increíblemente rápidos y muy precisos.






