Yolo 비전 선전
선전
지금 참여하기
용어집

수용 영역

Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.

In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.

The Mechanics Of Receptive Fields

수용 영역의 크기와 깊이는 네트워크 구조에 의해 결정됩니다. 초기 레이어에서 뉴런은 일반적으로 작은 수용 영역을 가지며, 미세한 질감을 포착하기 위해 작은 픽셀 클러스터에 집중합니다. 네트워크가 깊어질수록 풀링 레이어와 스트라이드 컨볼루션과 같은 연산은 특징 맵을 효과적으로 다운샘플링합니다. 이 과정은 후속 뉴런이 원본 입력의 훨씬 더 큰 부분에서 정보를 통합할 수 있게 합니다.

최첨단 Ultralytics 포함한 현대적 아키텍처는 이들 영역을 세심하게 균형 잡도록 설계됩니다. 수용 영역이 너무 좁으면 모델이 전체 형태를 인지하지 못해 대형 물체를 인식하지 못할 수 있습니다. 반대로 해상도를 유지하지 못한 채 수용 야영이 지나치게 넓어지면 모델이 작은 물체를 놓칠 수 있습니다. 이를 해결하기 위해 엔지니어들은 종종 확장 컨볼루션 (아트로스 컨볼루션으로도 알려짐)을 사용하여 공간 해상도를 저하시키지 않으면서 수용 야영을 확장합니다. 이는 의미적 분할과 같은 고정밀 작업에 필수적인 기술입니다.

실제 애플리케이션

수용 영역의 최적화는 다양한 인공지능 솔루션의 성공에 매우 중요합니다.

  • 자율 주행: 자동차용 인공지능에서 인식 시스템은 track 세부 사항과 대형 장애물을 동시에 track 합니다. 차량은 먼 신호등을 식별하기 위해 작은 수용 영역이 필요한 반면, 근처 트럭의 궤적이나 차선의 곡률을 이해하기 위해 동시에 큰 수용 영역이 필요합니다. 이러한 다중 스케일 인식은 더 나은 인공지능 안전성과 의사 결정을 보장합니다.
  • 의료 진단: 의료 분야에 인공지능을 적용할 때 방사선 전문의들은 스캔 영상의 이상을 발견하기 위해 모델에 의존합니다. 뇌종양을 식별하기 위해서는 뇌의 전반적인 대칭성과 구조를 이해하기 위해 네트워크에 넓은 수용 영역이 필요합니다. 그러나 유방촬영술에서 detect 위해서는 미세한 질감 변화에 민감한 작은 수용 영역을 가진 초기 계층에 모델이 의존합니다.

관련 개념 구분하기

네트워크 설계를 완전히 이해하려면 수용 야와 유사한 용어들을 구분하는 것이 도움이 됩니다:

  • 수용 야와 커널: 커널(또는 필터) 크기는 단일 컨볼루션 연산에 사용되는 슬라이딩 윈도우의 차원(예: 3x3)을 정의합니다. 수용 야는 뉴런에 영향을 미치는 총 누적 입력 영역을 나타내는 신흥 속성입니다. 여러 개의 3x3 커널을 쌓으면 3x3보다 훨씬 큰 수용 야가 생성됩니다.
  • 수용 야와 특징 맵: 특징 맵은 학습된 표현을 포함하는 레이어에서 생성된 출력 볼륨이다. 수용 야는 해당 특징 맵상의 단일 점과 원본 입력 이미지 간의 관계를 설명한다.
  • 수용 야와 컨텍스트 윈도우의 차이: 두 용어 모두 인지된 데이터의 범위를 지칭하지만, "컨텍스트 윈도우"는 일반적으로 자연어 처리(NLP) 또는 영상 분석에서 시간적 또는 순차적 범위(예: 토큰 제한)를 나타내는 데 사용됩니다. 수용 야는 엄밀히 말해 격자형 데이터(이미지) 내의 공간적 영역을 가리킵니다.

Practical Usage In Code

State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기