Yolo 深圳
深セン
今すぐ参加
用語集

受容野

Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.

In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.

The Mechanics Of Receptive Fields

受容野の大きさと深さはネットワークのアーキテクチャによって決定される。 初期層では、ニューロンは通常小さな受容野を持ち、微細なテクスチャを捉えるためにピクセルの小さなクラスターに焦点を当てる。ネットワークが深くなるにつれ、プーリング層 やストライド畳み込みなどの操作によって特徴マップが効果的にダウンサンプリングされる。このプロセスにより、後続のニューロンは元の入力のより広範な領域からの情報を統合できるようになる。

Ultralytics 現代のアーキテクチャは、これらの受容野を緻密にバランスさせるよう設計されている。受容野が狭すぎると、モデルは物体の形状全体を認識できず、大きな物体を認識できない可能性がある。 逆に、解像度を維持せずに受容野が過度に広すぎると、モデルは小さな物体を見逃す可能性がある。この問題を解決するため、エンジニアはしばしば拡張畳み込み(アトラス畳み込みとも呼ばれる)を用いて、空間解像度を低下させることなく受容野を拡張する。この技術は、セマンティックセグメンテーションのような高精度タスクに不可欠である。

実際のアプリケーション

受容野の最適化は、様々なAIソリューションの成功にとって極めて重要である。

  • 自動運転: 自動車向けAIにおいて、知覚システムはtrack と大型track 同時にtrack 。車両は遠方の信号機を識別するために小さな受容野を必要としつつ、同時に近くのトラックの軌跡や車線の曲率を理解するために大きな受容野を必要とする。このマルチスケールの知覚が、より優れたAIの安全性と意思決定保証する。
  • 医療診断: 医療分野でAIを応用する際、放射線科医は画像内の異常を検出するためにモデルに依存する。脳腫瘍の識別には、脳全体の対称性と構造を理解するために広範な受容野を持つネットワークが必要となる。一方、マンモグラフィーdetect 、微細な質感変化に敏感な狭い受容野を持つ初期層にモデルが依存する。

関連概念の区別

ネットワーク設計を完全に理解するには、受容野を類似の用語と区別することが有用である:

  • 受容野とカーネル カーネル(またはフィルタ)サイズは単一の畳み込み演算におけるスライディングウィンドウの次元(例:3x3)を定義する。 受容野は、ニューロンに影響を与える入力領域の総積算を表す創発的特性である。 複数の3x3カーネルを積み重ねると、3x3よりもはるかに大きな受容野が生じる。
  • 受容野と特徴マップ 特徴マップとは、学習された表現を含む、ある層によって生成される出力ボリュームである。 受容野とは、その特徴マップ上の単一点と元の入力画像との関係を記述するものである。
  • 受容野とコンテキストウィンドウ 両用語とも知覚されるデータの範囲を指すが、「コンテキストウィンドウ」通常、 自然言語処理(NLP) や動画解析において、時間的または順序的な範囲(例:トークン制限)を示すために用いられる。受容野は厳密に、 格子状のデータ(画像)における空間領域を指す。

Practical Usage In Code

State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加