Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
Alıcı alanın boyutu ve derinliği, ağın mimarisi tarafından belirlenir. İlk katmanlarda, nöronlar genellikle küçük bir alıcı alana sahiptir ve ince dokuları yakalamak için küçük bir piksel kümesine odaklanır. Ağ derinleştikçe, havuzlama katmanları ve adımlı konvolüsyonlar gibi işlemler özellik haritalarını etkili bir şekilde düşürür. Bu işlem, sonraki nöronların orijinal girdinin çok daha büyük bir bölümünden bilgi toplamasını sağlar.
En son teknolojiye sahip Ultralytics dahil olmak üzere modern mimariler, bu alanları titizlikle dengelemek için tasarlanmıştır. Alıcı alan çok dar ise, model tüm şekli algılayamadığı için büyük nesneleri tanıyamayabilir. Tersine, alan çözünürlüğü korumadan aşırı geniş ise, model küçük nesneleri gözden kaçırabilir. Tersine, alan çözünürlüğü korumadan aşırı genişse, model küçük nesneleri gözden kaçırabilir. Bunu çözmek için mühendisler genellikle genişletilmiş konvolüsyonlar (atrous konvolüsyonlar olarak da bilinir) kullanarak uzamsal çözünürlüğü düşürmeden alıcı alanı genişletirler. Bu teknik, anlamsal segmentasyon gibi yüksek hassasiyet gerektiren görevler için hayati önem taşır.
Alıcı alanı optimize etmek, çeşitli AI çözümlerinin başarısı için çok önemlidir.
Ağ tasarımını tam olarak anlamak için, alıcı alanı benzer terimlerden ayırmak yararlıdır:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()
