Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
수용 영역의 크기와 깊이는 네트워크 구조에 의해 결정됩니다. 초기 레이어에서 뉴런은 일반적으로 작은 수용 영역을 가지며, 미세한 질감을 포착하기 위해 작은 픽셀 클러스터에 집중합니다. 네트워크가 깊어질수록 풀링 레이어와 스트라이드 컨볼루션과 같은 연산은 특징 맵을 효과적으로 다운샘플링합니다. 이 과정은 후속 뉴런이 원본 입력의 훨씬 더 큰 부분에서 정보를 통합할 수 있게 합니다.
최첨단 Ultralytics 포함한 현대적 아키텍처는 이들 영역을 세심하게 균형 잡도록 설계됩니다. 수용 영역이 너무 좁으면 모델이 전체 형태를 인지하지 못해 대형 물체를 인식하지 못할 수 있습니다. 반대로 해상도를 유지하지 못한 채 수용 야영이 지나치게 넓어지면 모델이 작은 물체를 놓칠 수 있습니다. 이를 해결하기 위해 엔지니어들은 종종 확장 컨볼루션 (아트로스 컨볼루션으로도 알려짐)을 사용하여 공간 해상도를 저하시키지 않으면서 수용 야영을 확장합니다. 이는 의미적 분할과 같은 고정밀 작업에 필수적인 기술입니다.
수용 영역의 최적화는 다양한 인공지능 솔루션의 성공에 매우 중요합니다.
네트워크 설계를 완전히 이해하려면 수용 야와 유사한 용어들을 구분하는 것이 도움이 됩니다:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()