YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Text-to-Video

Text-to-Video生成AIを探求します。モデルがテキストからダイナミックなコンテンツを合成し、Ultralytics YOLO26を使用して生成されたビデオを分析・追跡する方法を学びましょう。

Text-to-Videoは、テキストによる記述から直接動的なビデオコンテンツを合成することに焦点を当てた、generative AIの高度な分野です。これらのシステムは自然言語プロンプトを解釈することで、時間の経過とともに進化する一貫した画像シーケンスを生成し、静的なtext-to-image生成とフルモーションピクチャの間のギャップを効果的に埋めます。この技術は、物体やシーンの視覚的セマンティクス(何がどのように見えるか)だけでなく、それらが3次元空間内でどのように動き物理的に相互作用するかという時間的力学を理解するために、複雑なdeep learning (DL)アーキテクチャに依存しています。リッチメディアへの需要が高まる中、Text-to-Videoはアニメーションやビデオ制作における労働集約的なプロセスを自動化する、クリエイターにとって極めて重要なツールとして浮上しています。

Link to this sectionビデオ生成のメカニズム#

テキストをビデオに変換するプロセスには、natural language processing (NLP)とコンピュータービジョンの合成の相乗効果が関与しています。パイプラインは通常、Transformerアーキテクチャに基づくことが多いテキストエンコーダーから始まり、ユーザーのプロンプトを高次元のembeddingsに変換します。これらのエンベディングは、diffusion modelGenerative Adversarial Network (GAN)といった生成モデルをガイドし、視覚的なフレームを生成します。

このプロセスにおける重要な課題は、時間的一貫性を維持することです。単一の画像を生成する場合とは異なり、モデルはフレーム間で物体がちらついたり、意図せず変形したり、消失したりしないようにする必要があります。これを実現するために、モデルはビデオとテキストのペアの巨大なdatasetsで学習され、ピクセルが時間とともにどのように変化すべきかを予測するように訓練されます。frame interpolationのような技術は、動きを滑らかにしフレームレートを向上させるために頻繁に使用され、多くの場合、ハイエンドのGPUsからの多大な計算能力を必要とします。

Link to this section実社会での応用#

Text-to-Video技術は、迅速な視覚化とコンテンツ作成を可能にすることで業界を変革しています。2つの注目すべきユースケースは以下の通りです。

  • Marketing and Advertising: ブランドはText-to-Videoを使用して、シンプルなスクリプトから高品質な製品ショーケースやソーシャルメディアコンテンツを生成しています。例えば、マーケターは「雨の降るサイバーパンクな街を走るスポーツカー」のビデオを生成して、高価な物理的撮影を準備することなく視覚的なコンセプトをテストできます。この機能により、他のAIモデルのトレーニングにも使用できる多様なsynthetic dataの作成が可能になります。
  • Film Pre-visualization: Directors and game designers utilize tools like Google's DeepMind Veo for storyboarding. Instead of sketching static panels, creators can generate rough video clips to visualize camera angles, lighting, and pacing instantly. This accelerates the creative pipeline, allowing for rapid iteration on complex narratives before committing to final production.

Link to this section生成と分析の区別#

ビデオを生成すること分析することを区別することは極めて重要です。Text-to-Videoはプロンプトに基づいてゼロから新しいピクセルを作成します。対照的に、video understandingは、既存の映像を処理してobject detectionaction recognitionといった洞察を抽出することに関与します。

Text-to-Videoは生成モデルに依存しますが、ビデオ分析は最先端のYOLO26のような判別モデルに依存します。以下のコードスニペットは後者の例を示しており、ビデオファイル(AI生成のものであっても構いません)を読み込み、物体を追跡するために分析することでワークフローの違いを強調しています。

from ultralytics import YOLO

# Load the official YOLO26 model for analysis (not generation)
model = YOLO("yolo26n.pt")

# Process a video file to track objects across frames
# Ideally, this distinguishes real objects from generated artifacts
results = model.track(source="path/to/generated_video.mp4", show=True)

Link to this section関連する概念と課題#

Text-to-Videoの範囲を完全に把握するには、AI環境における関連用語と比較することが役立ちます。

  • Text-to-Image: これは静的なスナップショットを生成します。Text-to-Videoは時間次元を追加し、モデルが被写体の移動中にその一貫性を維持することを要求します。
  • Multi-Modal Learning: Text-to-Videoは本質的にマルチモーダルであり、テキストデータを視覚メディアに変換します。これは、テキストをオーディオ波形に変換するtext-to-speechと類似しています。
  • Computer Vision (CV): 一般的にマシンが画像を「見て」理解する能力を指します。Text-to-Videoはその逆で、マシンが視覚コンテンツを「想像」し、作成します。

急速な進歩にもかかわらず、高い計算コストや、ビデオが物理法則に反するhallucinationsの可能性など、課題は残っています。AI ethicsdeepfakesの蔓延に関する重大な懸念もあります。しかし、Meta Movie Genのようなモデルが進化するにつれて、より高い忠実度と、Ultralytics Platformを通じて管理される専門的なワークフローへの優れた統合が期待できます。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう