YOLO Vision 2025にご期待ください!
2025年9月25日
10:00 — 18:00(英国夏時間)
ハイブリッドイベント
Yolo Vision 2024
用語集

受容野

コンピュータビジョンにおけるCNNの受容野の重要性について解説します。それらが、物体検出、セグメンテーション、およびAIの最適化にどのように影響するかを学びます。

畳み込みニューラルネットワーク(CNN)において、受容野とは、特定の層における特定のフィーチャが「見る」ことができる、または影響を受けることができる入力画像の特定領域のことです。データがネットワークの層を通過するにつれて、各ニューロンの受容野は拡大し、ネットワークが階層的な特徴を学習できるようになります。初期の層では、ニューロンは小さな受容野を持ち、エッジや色のような単純なパターンを検出します。より深い層では、受容野ははるかに大きくなり、ネットワークは以前に検出されたより単純なパターンを組み合わせることによって、複雑な物体やシーン全体を認識できるようになります。この概念は、CNNが空間情報をどのように処理するかを理解する上で基本となります。

コンピュータビジョンにおける重要性

受容野のサイズと品質は、コンピュータビジョン(CV)モデルの性能にとって非常に重要です。適切なサイズの受容野により、モデルはオブジェクトのコンテキスト全体を確実に捉えることができます。物体検出タスクにおいて、受容野が小さすぎると、モデルはオブジェクトの一部(車全体の代わりにタイヤなど)しか識別できない可能性があります。逆に、受容野が過度に大きいと、注意をそらす背景ノイズが組み込まれ、モデルが混乱する可能性があります。

効果的なネットワークアーキテクチャを設計するには、データセット内のオブジェクトのスケールに合わせて受容野のサイズを慎重に調整する必要があります。拡張畳み込み(アトロス畳み込みとも呼ばれる)などの手法を使用すると、計算コストを追加せずに受容野を拡大できます。これは、セマンティックセグメンテーションなどのタスクで特に役立ちます。また、受容野を視覚化するのに役立つツールもあり、モデルの設計とデバッグに役立ちます。

実際のアプリケーション

  • 自動運転車: 自動運転車では、物体検出モデルは、さまざまなサイズの歩行者、車両、および交通標識を識別する必要があります。Ultralytics YOLO11のようなモデルは、遠くから大型トラックやバスを検出するために、そのより深いレイヤーに十分に大きな受容野を持つように設計されていますが、より近くの小さなオブジェクトを検出するために、より小さな受容野を持つ特徴マップも保持しています。
  • 医用画像解析腫瘍検出のために医療スキャンを分析する場合、受容野のサイズをタスクに合わせて調整する必要があります。マンモグラフィーにおける微小石灰化のような小さくて微妙な異常を検出するには、きめ細かい特徴抽出とより小さな受容野を持つモデルが必要です。MRIでより大きな腫瘍を識別するには、病変とその周囲の組織の全体像を捉えるために、より大きな受容野が必要です。

受容野と関連概念

受容野を理解するには、関連する用語と区別する必要があります。

  • カーネルサイズ: カーネル(またはフィルター)は、画像をスライドして畳み込みを実行する重みの小さな行列です。カーネルサイズは、ユーザー定義の直接的なハイパーパラメータです(例:3x3または5x5)。対照的に、受容野は、複数の畳み込み層とプーリング層の後に、単一のニューロンの出力に影響を与える元の入力の累積領域を記述する創発的なプロパティです。レイヤー内のカーネルサイズが大きいほど、受容野が大きくなります。
  • ストライド: ストライドとは、畳み込みカーネルが各ステップで移動するピクセル数です。より大きなストライドは、ネットワークの深さが増すにつれて受容野のサイズをより急速に拡大させます。これは、出力特徴マップが小さくなり、入力のより広い領域を効果的に要約するためです。
  • パディング: パディングは、畳み込みの前に、入力画像の境界の周囲にピクセルを追加します。主な目的は、出力特徴マップの空間的次元を制御することですが、特に画像の端において、受容野にも影響を与えます。

カスタムモデルのトレーニング深層学習フレームワーク(PyTorchTensorFlowなど)で行う場合、開発者はこれらの要素が受容野に与える影響を総合的に考慮し、インスタンスセグメンテーション姿勢推定などのタスクのパフォーマンスを最適化する必要があります。Ultralytics HUBなどのプラットフォームは、幅広いビジョンタスク向けに最適化された、事前構成済みのモデルと環境を提供することで、このプロセスを効率化します。より深い技術的な洞察を得るには、IEEE Computational Intelligence Societyなどの組織からのリソースが役立ちます。

Ultralyticsコミュニティに参加しませんか?

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加
クリップボードにコピーしました