Rectified Flow
Изучи Rectified Flow, эффективный метод генеративного моделирования для создания высококачественных данных. Узнай, как использовать синтетические данные с моделями Ultralytics YOLO26.
Rectified Flow — это продвинутый метод генеративного моделирования, который учится отображать простое, легко семплируемое шумовое распределение на сложное распределение данных с помощью прямолинейных траекторий. Появляясь как высокоэффективная альтернатива традиционным генеративным фреймворкам, Rectified Flow работает путем решения обыкновенных дифференциальных уравнений (ОДУ), которые переносят точки данных из чистого шума непосредственно в целевые изображения, аудио или видео. Поскольку эти пути обучаются быть максимально прямыми, модели требуется значительно меньше шагов для генерации высококачественных выходных данных, что значительно снижает вычислительные затраты во время вывода.
Link to this sectionRectified Flow против диффузионных моделей#
Хотя оба метода принадлежат к широкому семейству генеративного ИИ, Rectified Flow устраняет некоторые основные неэффективности, встречающиеся в стандартных диффузионных моделях. Диффузионные модели обычно строят изогнутый, шумный путь между шумовым распределением и финальными данными, требуя десятков или даже сотен итеративных шагов шумоподавления для генерации четкого результата. В отличие от них, Rectified Flow явно оптимизирует пути переноса, делая их прямыми. Это «выпрямление» позволяет модели делать гораздо большие шаги без потери точности, обеспечивая генерацию высокой четкости всего за несколько итераций.
Link to this sectionРеальные применения#
Эффективность и стабильность Rectified Flow сделали его краеугольным камнем современных конвейеров компьютерного зрения и генерации медиаконтента.
- Генерация высококачественных синтетических данных: организации используют модели Rectified Flow для быстрой генерации огромных, разнообразных наборов данных для компьютерного зрения. Эти синтетические данные могут имитировать редкие пограничные случаи, что критически важно для обучения надежных архитектур обнаружения объектов без непомерных затрат на ручной сбор данных.
- Продвинутые системы преобразования текста в изображение: ведущие исследовательские организации в области ИИ, включая Google DeepMind и OpenAI, все чаще исследуют методы генерации с прямыми путями. Эти модели обеспечивают работу быстрых потребительских инструментов генерации изображений и видео, где низкая задержка вывода критически важна для плавного взаимодействия с пользователем.
Link to this sectionУлучшение рабочих процессов компьютерного зрения#
На практике высококачественные синтетические изображения, созданные моделями Rectified Flow, часто используются для предварительного обучения или дообучения последующих моделей зрения. Например, разработчики могут генерировать целевые изображения производственных дефектов и использовать Ultralytics Platform, чтобы без усилий аннотировать эти новые данные в облаке. После аннотирования набор данных можно использовать для обучения модели Ultralytics YOLO26 для высокоточного обнаружения объектов в реальном времени.
Вот краткий пример, демонстрирующий, как обучить модель YOLO26 на пользовательском наборе данных (который может включать синтетические данные, созданные с помощью Rectified Flow) с использованием пакета ultralytics:
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")Преодолевая разрыв между эффективными генеративными моделями и мощными дискриминативными инструментами, такими как YOLO26, специалисты по машинному обучению могут создавать высокоустойчивые системы ИИ. Независимо от оценки метрик производительности модели или экспорта на периферийные устройства через TensorRT, сочетание синтетических данных и передовых технологий обнаружения ускоряет этапы проекта CV, гарантируя, что модели будут одновременно высокоточными и невероятно быстрыми.






