Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.
In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.
Die Größe und Tiefe des rezeptiven Feldes werden durch die Architektur des Netzwerks bestimmt. In den ersten Schichten haben Neuronen in der Regel ein kleines rezeptives Feld, das sich auf eine winzige Pixelgruppe konzentriert, um feinkörnige Texturen zu erfassen. Mit zunehmender Tiefe des Netzwerks führen Operationen wie Pooling-Schichten und Strided Convolutions eine effektive Downsampling der Merkmalskarten durch. Dieser Prozess ermöglicht es nachfolgenden Neuronen, Informationen aus einem viel größeren Teil der ursprünglichen Eingabe zu aggregieren.
Moderne Architekturen, darunter das hochmoderne Ultralytics , sind so konzipiert, dass sie diese Felder sorgfältig ausbalancieren. Ist das rezeptive Feld zu eng, kann das Modell möglicherweise große Objekte nicht erkennen, da es nicht die gesamte Form wahrnehmen kann. Umgekehrt kann es vorkommen, dass das Modell kleine Objekte übersieht, wenn das Feld zu breit ist, ohne dass die Auflösung beibehalten wird . Um diesem Problem zu begegnen, verwenden Ingenieure häufig dilatierte Faltungen (auch bekannt als atrous convolutions), um das rezeptive Feld zu erweitern, ohne die räumliche Auflösung zu verringern – eine Technik, die für hochpräzise Aufgaben wie die semantische Segmentierung unerlässlich ist.
Die Optimierung des rezeptiven Feldes ist entscheidend für den Erfolg verschiedener KI-Lösungen.
Um das Netzwerkdesign vollständig zu verstehen, ist es hilfreich, das rezeptive Feld von ähnlichen Begriffen zu unterscheiden:
State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()