YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Capsule Networks (CapsNet)

Capsule Networks(CapsNet)と、それがCNNの限界をどのように解決するかを探求します。ダイナミックルーティング、空間階層、およびCapsNetとYOLO26の比較について学びましょう。

カプセルネットワーク (CapsNet) は、ディープラーニング分野における高度なアーキテクチャであり、従来のニューラルネットワークが持つ特定の制限を克服するために設計されました。Geoffrey Hinton氏とそのチームによって導入されたCapsNetは、標準的なモデルよりも人間の脳の生物学的な神経組織をより忠実に模倣しようとするものです。特徴検出には優れているものの、ダウンサンプリングによって空間的関係を失いがちな一般的な畳み込みニューラルネットワーク (CNN)とは異なり、カプセルネットワークは「カプセル」と呼ばれるグループにニューロンを編成します。これらのカプセルは、オブジェクトが存在する確率だけでなく、向き、サイズ、テクスチャなどの特定のプロパティもエンコードし、視覚データ内の階層的な空間関係を効果的に保持します。

Link to this section従来のCNNの制限#

CapsNetの革新性を理解するには、標準的なコンピュータビジョンモデルがどのように動作するかを知ることが役立ちます。従来のCNNは、計算負荷を軽減し並進不変性を実現するために、特徴抽出層とそれに続くプーリング層、特に最大プーリングを使用します。これは、CNNが画像内のどこに「猫」がいても識別できることを意味します。

しかし、このプロセスではしばしば正確な位置データが破棄されるため、「ピカソ問題」が発生します。CNNは、口が額にあっても必要な特徴がすべて揃っていれば、正しく顔を分類してしまう可能性があります。CapsNetは、プーリング層を削除し、オブジェクトの空間階層を尊重するプロセスに置き換えることで、この問題に対処します。

Link to this sectionカプセルネットワークの仕組み#

このアーキテクチャの主要な構成要素はカプセルであり、スカラー値ではなくベクトルを出力する一連のネストされたニューロンです。ベクトル数学において、ベクトルには大きさと方向の両方があります。CapsNetでは以下のようになります。

  • 大きさ (長さ): 現在の入力に特定のエンティティが存在する確率を表します。
  • 方向 (向き): オブジェクトの姿勢推定、スケール、回転などのインスタンス化パラメータをエンコードします。

下位層のカプセル (エッジのような単純な形状を検出) は、上位層のカプセル (目やタイヤのような複雑なオブジェクトを検出) の出力を予測します。この通信は「ダイナミックルーティング」または「合意によるルーティング」と呼ばれるアルゴリズムによって管理されます。下位レベルのカプセルの予測が上位レベルのカプセルの状態と一致する場合、それらの間の接続が強化されます。これにより、回転やスケールについてCNNに教えるために通常必要となる大規模なデータ拡張を必要とせずに、さまざまな3D視点からオブジェクトを認識できるようになります。

Link to this section主な違い: CapsNetとCNNの比較#

どちらのアーキテクチャもコンピュータビジョン (CV)の基礎ですが、視覚データの処理と表現方法が異なります。

  • スカラー vs ベクトル: CNNのニューロンはスカラー出力を使用して特徴の存在を示します。CapsNetはベクトルを使用して、存在 (長さ) と姿勢パラメータ (向き) をエンコードします。
  • ルーティング vs プーリング: CNNはプーリングを使用してデータをダウンサンプリングするため、しばしば位置の詳細が失われます。CapsNetはダイナミックルーティングを使用して空間データを保持するため、正確なオブジェクトトラッキングを必要とするタスクに非常に効果的です。
  • データ効率: カプセルは3D視点とアフィン変換を暗黙的に理解しているため、オブジェクトのあらゆる回転を学習するために膨大な例を必要とする可能性のあるCNNと比較して、より少ないトレーニングデータから一般化できることがよくあります。

Link to this section実社会での応用#

CapsNetはYOLO26のような最適化されたモデルよりも計算コストがかかることが多いですが、専門的なドメインでは明確な利点を提供します。

  1. 医療画像解析: ヘルスケアにおいて、異常の正確な向きと形状は非常に重要です。研究者は、標準的なCNNでは平滑化されてしまうような微妙な空間階層に基づいて、モデルが周囲の組織から腫瘍を区別しなければならない脳腫瘍セグメンテーションにCapsNetを適用しています。医療画像におけるカプセルネットワークに関する関連研究を調査できます。

  2. 重なり合う数字の認識: CapsNetは、特に数字が重なり合うシナリオにおいて、MNISTデータセットで最先端の成果を達成しました。ネットワークが各数字の「姿勢」を追跡するため、2つの重なり合う数字 (例: '5'の上に'3'がある) を混乱した単一の特徴マップに統合するのではなく、別個のオブジェクトとして分離できます。

Link to this section実用的なコンテキストと実装#

カプセルネットワークは主に分類アーキテクチャです。理論的な堅牢性は提供しますが、現代の業界アプリケーションでは、リアルタイムパフォーマンスのために高速なCNNやTransformerが優先されることがよくあります。ただし、MNISTのようなCapsNetで使用される分類ベンチマークを理解しておくことは有用です。

The following example demonstrates how to train a modern YOLO classification model on the MNIST dataset using the ultralytics package. This parallels the primary benchmark task used to validate Capsule Networks.

from ultralytics import YOLO

# Load a YOLO26 classification model (optimized for speed and accuracy)
model = YOLO("yolo26n-cls.pt")

# Train the model on the MNIST dataset
# This dataset helps evaluate how well a model learns handwritten digit features
results = model.train(data="mnist", epochs=5, imgsz=32)

# Run inference on a sample image
# The model predicts the digit class (0-9)
predict = model("https://docs.ultralytics.com/datasets/classify/mnist/")

Link to this sectionカプセルとビジョンAIの未来#

カプセルネットワークの背後にある原則は、AI安全性および解釈可能性の研究に引き続き影響を与えています。部分と全体の関係を明示的にモデル化することで、カプセルはディープニューラルネットワークの「ブラックボックス」の性質に対する「ガラスボックス」の代替手段を提供し、意思決定の説明可能性を高めます。将来の展望としては、カプセルの空間的堅牢性と、YOLO11や新しいYOLO26のようなアーキテクチャの推論速度を組み合わせて、3Dオブジェクト検出やロボット工学におけるパフォーマンスを向上させることが期待されています。研究者はまた、合意アルゴリズムの計算コストをさらに削減するために、EMルーティングを用いた行列カプセルを研究しています。

データセットを管理し、効率的にモデルをトレーニングしようとする開発者向けに、Ultralytics Platformは、データをアノテーションし、クラウドでトレーニングし、CNNの速度と複雑な視覚タスクに必要な精度を両立するモデルを展開するための統一された環境を提供します。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。
詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。
詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。
詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。
詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。
詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。
詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。
詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう