YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Flow Matching

ノイズをデータへ変換する生成モデリングフレームワークであるフローマッチングについて解説します。より高速で高品質な推論により、拡散モデルをどのように凌駕するかを学びましょう。

Flow matchingは、データポイントの時間経過に伴う連続的な流れを直接モデル化することで、単純なノイズ分布から複雑なデータ分布へと変換する学習を行う、生成モデリングのフレームワークです。複雑なマルチステップのノイズ除去プロセスに依存する従来の手法とは異なり、flow matchingはソース分布(ノイズ)とターゲット分布(データ)の間に、多くの場合直線となる、より単純で直接的なパスを定義します。このアプローチにより、generative AIモデルの学習が大幅に効率化され、収束の高速化、安定性の向上、高品質な出力を実現します。事前状態から目的のデータ状態へと確率密度を押し出すベクトル場を学習することで、標準的なdiffusion modelsに代わる堅牢な手法を提供します。

Link to this section中心的な概念とメカニズム#

flow matchingの本質は、周辺確率だけでなくデータ変換の速度に焦点を当てることで、生成プロセスを単純化することにあります。この手法は、連続正規化フロー(continuous normalizing flows)から着想を得ていますが、正確な尤度を計算するための高い計算コストを回避しています。

  • Vector Fields: flow matchingの中心的な構成要素は、空間と時間の任意の点における速度ベクトルを予測するニューラルネットワークです。このベクトルは、データポイントが現実的なサンプルになるために移動すべき方向を示します。
  • Optimal Transport: Flow matching often aims to find the most efficient path to transport mass from one distribution to another. By minimizing the distance traveled, models can achieve faster inference times. Techniques like optimal transport help define these straight paths, ensuring that noise maps to data in a geometrically consistent way.
  • Conditional Generation: Ultralytics YOLO26が入力画像に基づいて検出を条件付けるのと同様に、flow matchingもクラスラベルやテキストプロンプトに基づいて生成を条件付けることができます。これにより、生成されるコンテンツを正確に制御することが可能となり、これは最新のtext-to-imagetext-to-videoパイプラインにおける重要な機能です。

Link to this sectionFlow MatchingとDiffusion Modelsの比較#

flow matchingとdiffusion modelsはどちらも生成モデリングの目的を果たしますが、数学的な定式化と学習効率において違いがあります。

  • Diffusion Models: これらのモデルは通常、データに徐々にノイズを加え、そのプロセスを逆転させることを学習する確率微分方程式(SDE)に依存しています。逆経路はしばしば曲線的であり、inference中に多くの離散ステップを必要とするため、生成が遅くなる可能性があります。
  • Flow Matching: このアプローチは、本質的にノイズとデータの間の軌道を「直線化」します。より直線的なパスを持つ決定論的な常微分方程式(ODE)を学習することで、flow matchingはサンプリング中に大きなステップサイズを許容します。これは、real-time inferenceシナリオにおける大きなボトルネックを解決し、品質を犠牲にすることなく生成速度の向上に直結します。

Link to this section実社会での応用#

flow matchingの効率性と高忠実度は、さまざまな最先端のAI領域で急速に採用される原動力となっています。

  • 高解像度画像合成: flow matchingは、最先端の画像生成モデルを支えるためにますます使用されています。より直線的な軌道を可能にすることで、これらのモデルはStable Diffusionのような以前のアーキテクチャと比較して、少ないサンプリングステップでフォトリアルな画像を生成できます。この効率性は、コンシューマーハードウェア上での生成ツールの展開や、データ拡張のためのUltralytics Platform内での利用において非常に重要です。
  • 生成音声とオーディオ: speech synthesisの領域において、flow matchingは非常に自然な人間の音声を生成することを可能にします。自己回帰モデルよりも効果的にピッチとトーンの連続的な変化をモデル化できるため、より滑らかで表現力豊かなtext-to-speechシステムを実現します。
  • 3D点群生成: 3Dアセットの生成には、複雑な空間関係のモデル化が必要です。flow matchingはより高い次元へ効果的にスケーリングできるため、詳細な3D object detectionデータセットや仮想環境用のアセット作成に適しています。

Link to this sectionFlow Matchingの概念の実装#

flow matchingには複雑な学習ループが含まれますが、ノイズを変換するという概念は基本的なテンソル演算を使用して視覚化できます。以下の例では、flow matchingのベクトル場がどのようにデータをガイドするかと同様に、方向ベクトルを使用してノイズ分布からターゲットに向かって点を移動させる簡略化された概念を示しています。

import torch

# Simulate 'noise' data (source distribution)
noise = torch.randn(5, 2)

# Simulate 'target' data means (destination distribution)
target_means = torch.tensor([[2.0, 2.0], [-2.0, -2.0], [2.0, -2.0], [-2.0, 2.0], [0.0, 0.0]])

# Calculate a simple linear path (velocity) from noise to target
# In a real Flow Matching model, a neural network predicts this velocity
time_step = 0.5  # Move halfway
velocity = target_means - noise
next_state = noise + velocity * time_step

print(f"Start:\n{noise}\nNext State (t={time_step}):\n{next_state}")

Link to this section今後の方向性と研究#

2025年現在、flow matchingは進化を続けており、研究はこれらのモデルをより大規模なデータセットや複雑なモダリティへとスケーリングすることに焦点を当てています。研究者は、生成タスクにおける意味理解を向上させるために、flow matchingとlarge language modelsを組み合わせる方法を調査しています。さらに、flow matchingをビデオ生成パイプラインに統合することで、AI生成ビデオで頻繁に見られる「ちらつき」に対処し、より時間的な一貫性を確保する道が開かれています。これは、マルチモーダルなタスクをシームレスに処理できる統合されたfoundation modelsに向けた、より広範な業界のトレンドと一致しています。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう