YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

Capsule Networks(CapsNet)

Capsule Networks(CapsNets)をご覧ください。空間階層と特徴の関係に優れた、画期的なニューラルネットワークアーキテクチャです。

CapsNets(カプセルネットワークの略)は、畳み込みニューラルネットワーク(CNN)の主要な制限事項を克服するために設計された一種のニューラルネットワーク(NN)アーキテクチャです。Geoffrey Hinton氏とそのチームによって提唱されたCapsNetsは、画像内の特徴間の階層的な関係をより良く認識することを目的としています。標準的なCNNのニューロンが単一のスカラー値を出力するのとは異なり、CapsNetの「カプセル」はベクトルを出力し、オブジェクトのポーズ(位置、サイズ、向き)、変形、テクスチャなどのプロパティに関するより詳細な情報をエンコードできます。この構造により、視点や向きの変化に対して本質的により堅牢になります。

カプセルネットワークの仕組み

CapsNetの核となる革新性は、特徴量間の空間的な階層構造を保持する能力です。CNNは、口、鼻、目などの顔の構成要素を認識するかもしれませんが、それらの空間的な関係を明示的に理解しているわけではありません。しかし、CapsNetは、カプセルと呼ばれるニューロンのグループを使用して、これらのパーツとその相対的な方向を識別します。これは、「動的ルーティング」と呼ばれるプロセスを通じて実現されます。このプロセスでは、下位レベルのカプセルが、その結果を最も適切に説明できる上位レベルのカプセルに出力を送信します。このアプローチは、重要な空間情報を破棄することが多いCNNのプーリング層とは根本的に異なります。元の概念は、論文Dynamic Routing Between Capsulesで詳しく説明されています。

CapsNetsと畳み込みニューラルネットワークの比較

CapsNetとCNNの主な違いは、空間情報と抽象化の処理方法にあります。

  • 空間的不変性: CNNはプーリング層を介して空間的不変性を実現しますが、これにより正確な位置データが失われる可能性があります。対照的に、CapsNetは「同変」になるように設計されており、フレーム内を移動する際にオブジェクトのポーズ情報を理解し、保持できます。
  • データ効率: CapsNetは、洗練された内部構造により、データに飢えた深層学習(DL)モデルと比較して、多くの場合、大幅に少ないトレーニングデータで高い精度を達成できます。
  • 階層的表現: CapsNetは、視覚エンティティの明示的な構文解析木を構築し、全体をその部分の構成として理解できるようにします。これは、標準的なCNNによって提供されるものよりも、物体検出などのタスクを実行するためのより直感的な方法です。

Ultralytics YOLOのようなモデルは、実用的なコンピュータビジョン(CV)タスクにおける速度と精度に高度に最適化されていますが、CapsNetは、視覚シーンの基本的な理解を向上させることに焦点を当てた代替アーキテクチャ哲学を表しています。現在の状況を理解するために、さまざまな物体検出モデル間の比較を調べることができます。

実際のアプリケーション

CapsNetはまだ活発な研究分野であり、YOLO11のような確立されたモデルほど一般的には導入されていませんが、いくつかの分野で有望であることが示されています。

  1. 文字認識: CapsNetは、手書き数字のMNISTデータセットで最先端の結果を達成し、オリエンテーションとスタイルのバリエーションを効果的に処理する能力を示し、一部のベンチマークで従来の画像分類アプローチを上回りました。
  2. 医用画像解析: 空間構成を理解する上での強みにより、医用スキャンの分析に適しています。たとえば、研究では、脳腫瘍セグメンテーションなどのタスクにCapsNetを使用することが検討されています。ここでは、異常の正確な形状と位置を特定することが重要です。これは、より広範な医用画像解析の分野に該当します。

さらなる応用例としては、特に複雑なシーンでの物体検出の改善、ロボティクスにおけるシーン理解の強化、自動運転車向けのより堅牢な知覚システムの実現などが考えられます。計算負荷が高いという課題は残りますが、現在進行中の研究では、より広範な機械学習(ML)アプリケーションや、PyTorchTensorFlowのようなフレームワークへの統合に向けて、CapsNetの効率を最適化することを目指しています。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました