Rectified Flow
高品質なデータ作成のための効率的な生成モデリング技術、「Rectified Flow」について解説します。Ultralytics YOLO26モデルで合成データを使用する方法を学びましょう。
Rectified Flowは、単純でサンプリングが容易なノイズ分布から複雑なデータ分布へ、直線的な軌跡を用いてマッピングすることを学習する高度な生成モデリング技術です。従来の生成フレームワークに代わる非常に効率的な手法として注目されており、Rectified Flowは、ノイズからターゲットとなる画像、音声、ビデオへとデータポイントを直接輸送する常微分方程式(ODE)を解くことで機能します。これらの経路は可能な限り直線になるよう学習されるため、モデルが高品質な出力を生成するために必要なステップ数が大幅に削減され、推論時の計算負荷を劇的に低減します。
Link to this sectionRectified Flowと拡散モデルの比較#
どちらの技術も広義の生成AIに属しますが、Rectified Flowは標準的な拡散モデルに見られる根本的な非効率性のいくつかを解決します。拡散モデルは通常、ノイズ分布と最終的なデータとの間に曲線的でノイズの多い経路を構築するため、鮮明な出力を生成するために数十回から数百回の反復的なノイズ除去ステップを必要とします。対照的に、Rectified Flowは輸送経路が直線になるよう明示的に最適化します。この「直線化」により、精度を損なうことなく、より大きなステップでモデルを推論できるようになり、わずか数回の反復で高忠実度な生成が可能になります。
Link to this section実社会での応用#
Rectified Flowの効率性と安定性は、現代のコンピュータビジョンおよびメディア生成パイプラインの礎となっています。
- 高忠実度な合成データ生成:組織はRectified Flowモデルを使用して、大規模で多様なコンピュータビジョン用データセットを迅速に生成しています。この合成データは、手作業によるデータ収集にかかる莫大なコストをかけずに、堅牢な物体検出アーキテクチャを学習させるために不可欠な、希少なエッジケースをシミュレートできます。
- Advanced Text-to-Image Systems: Leading AI research organizations, including Google DeepMind and OpenAI, are increasingly exploring straight-path generative techniques. These models power fast, consumer-facing image and video generation tools where low inference latency is critical for a smooth user experience.
Link to this sectionコンピュータビジョンワークフローの強化#
実際には、Rectified Flowモデルによって生成された高品質な合成画像は、ダウンストリームのビジョンモデルの事前学習やファインチューニングによく使用されます。例えば、開発者は製造上の欠陥を示す特定の画像を生成し、Ultralytics Platformを使用してクラウド上でその新しいデータを簡単にアノテーションできます。アノテーションが完了したデータセットを使用してUltralytics YOLO26モデルを学習させることで、非常に高精度なリアルタイム物体検出を実現できます。
ultralyticsパッケージを使用して、カスタムデータセット(Rectified Flowによって生成された合成データを含むことができます)でYOLO26モデルを学習する方法を示す簡潔な例を以下に示します。
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model on your synthetic/real dataset mix
results = model.train(data="custom_synthetic_data.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for fast deployment
model.export(format="onnx")効率的な生成モデルとYOLO26のような強力な識別ツールとの橋渡しをすることで、機械学習の実践者は非常に回復力の高いAIシステムを構築できます。モデルパフォーマンスメトリクスの評価においても、TensorRTを介したエッジデバイスへのエクスポートにおいても、合成データと最先端の検出技術の組み合わせはコンピュータビジョンプロジェクトのステップを加速させ、モデルが非常に正確かつ驚異的に高速であることを確実にします。






