Explora Rectified Flow, una técnica de modelado generativo eficiente para la creación de datos de alta fidelidad. Aprende a utilizar datos sintéticos con los modelos Ultralytics .
El flujo rectificado es una técnica avanzada de modelado generativo que aprende a mapear una distribución de ruido simple y fácilmente muestreable a una distribución de datos compleja utilizando trayectorias en línea recta. El flujo rectificado, que está surgiendo como una alternativa altamente eficiente a los marcos generativos tradicionales, funciona resolviendo ecuaciones diferenciales ordinarias (EDO) que transportan puntos de datos desde el ruido puro directamente a las imágenes, el audio o el vídeo de destino. Dado que estas trayectorias están entrenadas para ser lo más rectas posible, el modelo requiere muchos menos pasos para generar resultados de alta calidad, lo que reduce drásticamente la sobrecarga computacional durante la inferencia.
Si bien ambas técnicas pertenecen a la familia más amplia de la IA generativa, Rectified Flow aborda algunas de las principales ineficiencias que se encuentran en los modelos de difusión estándar. Los modelos de difusión suelen construir una ruta curva y ruidosa entre la distribución del ruido y los datos finales, lo que requiere docenas o incluso cientos de pasos iterativos de eliminación de ruido para generar un resultado claro. Por el contrario, Rectified Flow optimiza explícitamente las rutas de transporte para que sean rectas. Este «enderezamiento» permite al modelo dar pasos mucho más grandes sin perder precisión, lo que permite una generación de alta fidelidad en solo unas pocas iteraciones.
La eficiencia y estabilidad de Rectified Flow lo han convertido en una piedra angular de la visión artificial y los procesos de generación de medios modernos.
En la práctica, las imágenes sintéticas de alta calidad producidas por los modelos Rectified Flow se utilizan con frecuencia para preentrenar o ajustar modelos de visión posteriores. Por ejemplo, los desarrolladores pueden generar imágenes específicas de defectos de fabricación y utilizar la Ultralytics para anotar estos nuevos datos sin esfuerzo en la nube. Una vez anotado, el conjunto de datos se puede utilizar para entrenar un modelo Ultralytics para la detección de objetos en tiempo real y con gran precisión .
A continuación se muestra un ejemplo conciso que demuestra cómo entrenar un modelo YOLO26 en un conjunto de datos personalizado (que podría incluir datos sintéticos
generados a través de Rectified Flow) utilizando el ultralytics paquete:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")
Al salvar la brecha entre los modelos generativos eficientes y las potentes herramientas discriminativas como YOLO26, los profesionales del aprendizaje automático pueden crear sistemas de IA altamente resilientes. Ya sea evaluando las métricas de rendimiento de los modelos o exportando a dispositivos periféricos a través de TensorRT, la combinación de datos sintéticos y detección de última generación acelera los pasos de un proyecto de visión computacional, garantizando que los modelos sean altamente precisos e increíblemente rápidos.