Consistency Models

一貫性モデル (consistency models) がどのように1ステップで高速かつ高品質な生成AIを実現するかを解説します。リアルタイム推論のために、拡散モデルとどのように異なるかを学びましょう。

生成AIは視覚的な忠実度において大きな飛躍を遂げましたが、処理速度がボトルネックとなることが多くあります。Consistency Modelsは、生成AIの高度なアーキテクチャファミリーであり、単一ステップまたは非常に少数のステップで高品質なデータを生成するように設計されています。これにより、従来の確率的フレームワークで必要とされた計算コストの高いサンプリングプロセスを回避します。OpenAIによる基礎的な機械学習研究で最初に導入されたこのアプローチは、迅速なデータ合成における新しい標準を確立しています。

これらのネットワークは、何百ものステップを経て段階的にノイズを除去するのではなく、ノイズの多いデータポイントを、元のクリーンなデータ形式に直接結びつける数学的なマッピングを学習します。特定のノイズ軌道に沿って常微分方程式（ODE）を解くことで、モデルはパス上のすべての点が正確に同じ最終出力にマッピングされることを保証します。この「一貫性」の特性により、実務者は中間ステップを完全にスキップすることができます。Google DeepMindの進歩のような広範な革新に触発され、最近ではLatent Consistency Models (LCMs)などのブレイクスルーがこのプロセスをさらに最適化しました。圧縮された潜在空間で動作することで、LCMsはメモリ要件を劇的に削減し、テキストから画像への生成パイプラインを加速させます。

Link to this sectionConsistency ModelsとDiffusion Modelsの比較#

このアーキテクチャをDiffusion Modelsと比較すると、主な違いは生成のタイムラインにあります。従来の拡散フレームワークが画像を構築するために段階的かつ反復的なノイズ除去ループに依存しているのに対し、Consistency Modelsはリアルタイム推論を目的として明示的に設計されています。拡散モデルは驚異的な詳細を出力しますが、ユーザー向けのライブアプリケーションでは処理が遅すぎることが多いため、推論レイテンシの低さが重要なプロジェクト制約となる場合、この新しいアプローチが優先的に選択されます。

Link to this section実社会での応用#

高忠実度の出力を即座に生成できる能力は、ペースの速いさまざまな業界で新たな可能性を切り開きます。

インタラクティブメディアとビデオゲーム: ゲーム開発者は、これらの超高速ネットワークを使用して動的でオンザフライなテクスチャや視覚的アセットを生成し、レンダリングエンジンを停止させることなく、応答性の高い仮想環境を実現しています。
合成データ生成: 医療画像解析などの専門分野では、エンジニアがこれらのアーキテクチャを展開して多様な学習データを迅速に合成しています。これは、計算リソースが厳しく制限されているエッジコンピューティングハードウェアやエッジAI環境において特に有益です。

Link to this section現代のコンピュータビジョンにおける速度#

The pursuit of low-latency execution isn't limited to generative media; it is a universal goal across all forms of computer vision. For instance, Ultralytics YOLO26 is engineered entirely for native end-to-end efficiency. By eliminating post-processing bottlenecks, it enables real-time computing for both object detection and complex image segmentation tasks. For broader model optimization, developers can effortlessly manage datasets, train rapid models, and deploy them using the Ultralytics Platform.

The following code example demonstrates how to perform high-speed, single-pass inference using the highly optimized yolo26n.pt model, utilizing hardware acceleration via PyTorch to mirror the modern industry demand for rapid machine learning operations:

from ultralytics import YOLO

# Load the lightning-fast YOLO26 nano model for low-latency visual tasks
model = YOLO("yolo26n.pt")

# Perform a rapid, single-step prediction on an input image using GPU acceleration
results = model.predict(source="image.jpg", conf=0.5, device="cuda")

Explore solutions

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

Consistency Models

Link to this sectionConsistency ModelsとDiffusion Modelsの比較#

Link to this section実社会での応用#

Link to this section現代のコンピュータビジョンにおける速度#

Explore solutions

ロボティクスにおけるAI

物流におけるAI

小売業界におけるAI

ヘルスケアにおけるAI

製造におけるAI

自動車におけるAI

農業におけるAI

ロボティクスにおけるAI

物流におけるAI

小売業界におけるAI

ヘルスケアにおけるAI

製造におけるAI

自動車におけるAI

農業におけるAI

ロボティクスにおけるAI

物流におけるAI

小売業界におけるAI

ヘルスケアにおけるAI

製造におけるAI

自動車におけるAI

農業におけるAI

AIの未来を共に築き上げましょう！