YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

ControlNet

ControlNetがどのように生成AIに対して精密な空間制御を提供するかを解説します。Ultralytics YOLO26を使用してポーズを抽出し、画像生成をガイドする方法を学びましょう。

ControlNetは、大規模なテキストから画像への生成AIモデルに対して、きめ細かな空間制御を可能にするために設計された高度なニューラルネットワークアーキテクチャです。元々はStable Diffusionのようなモデルを強化するために導入されたもので、ユーザーはテキストプロンプト以外にも追加の入力条件を使用して画像生成をガイドできます。エッジマップ、深度マップ、人間の骨格といった特定の視覚的ガイドをネットワークに入力することで、実務者は生成される出力の正確な構成、姿勢、構造を指示でき、自然言語による記述と精密な視覚的実行の間のギャップを埋めることができます。

Link to this sectionアーキテクチャの仕組み#

ControlNetの核心的な革新性は、ベースとなる基盤モデルが持つ膨大な事前学習済み知識を保持したまま、新しいコンディショニングタスクを学習できる点にあります。これは、オリジナルのニューラルネットワークブロックのパラメータを固定し、学習可能なクローンを作成することで実現されます。このクローンは、特別な「ゼロコンボリューション」層を使用して固定されたモデルに接続されており、この層は初期のファインチューニング段階でノイズが混入しないようゼロの重みで初期化されます。数学的および構造的な理論の詳細については、arXivのオリジナルのControlNet研究論文をご覧ください。

このユニークな構造により、開発者はコンシューマーグレードのハードウェアで堅牢なコンディショニング制御を学習させることができ、大規模なディープラーニングモデルを一から学習させる場合と比較して、非常に高いアクセス性を実現しています。

Link to this sectionControlNetとDiffusion ModelsおよびLoRAの比較#

生成人工知能について議論する際、ControlNetを関連する概念と区別すると理解しやすくなります。

  • Diffusion Models: これらは、繰り返しノイズを除去することで画像を生成する基本的なエンジンです。これらはほぼ排他的にテキストプロンプトに依存します。
  • LoRA (Low-Rank Adaptation): LoRAは、特定のキャラクターやアートスタイルといった新しいスタイル被写体をモデルに素早く学習させる手法です。対照的に、ControlNetは画像の正確な空間配置を指示します。

Link to this section実社会での応用#

ControlNetは、コンピュータビジョンと生成AIの有用性をプロフェッショナルなワークフローにおいて劇的に拡大しました。

  • 建築コンセプトのレンダリング: 建築家やインテリアデザイナーはControlNetを活用して、基本的な白黒のCADブループリントや手描きのスケッチを、建物や部屋のフォトリアルなレンダリングへと変換しています。
  • ゲーム開発におけるキャラクターポージング: アニメーターは人間の姿勢推定モデルを活用して、参照動画から骨格構造を抽出します。これらの骨格をControlNetに入力することで、ゲームアセット用に正確なポーズを維持した一貫性のあるスタイライズされたキャラクタースプライトを生成し、手動でのイラスト作成時間を大幅に削減しています。

Link to this sectionControlNetのための条件準備#

ControlNetを効果的に活用するには、まずソース画像から目的の空間条件を抽出する必要があります。例えば、最新の最先端ビジョンモデルである**Ultralytics YOLO26**を使用して、人間のポーズスケルトンを抽出できます。このスケルトンは保存され、ControlNet対応のテキストから画像へのパイプラインのコンディショニング入力として使用されます。

from ultralytics import YOLO

# Load the Ultralytics YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Perform inference to extract the human pose skeleton
results = model("character_reference.jpg")

# Save the resulting plotted skeleton to use as ControlNet input
results[0].save("pose_conditioning.jpg")

標準的なOpenCV関数を使用してCannyエッジを準備する場合でも、高度なセグメンテーションマスクを抽出する場合でも、高品質な入力を準備することが不可欠です。カスタムのControlNet条件を学習するために必要なクラウドベースのデータセット管理およびデータアノテーションに関しては、Ultralytics Platformのようなプラットフォームが、現代のAIチームのためにシームレスなエンドツーエンドの環境を提供します。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう