Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Рецептивное поле

Learn how receptive fields help [CNNs](https://www.ultralytics.com/glossary/convolutional-neural-network-cnn) see context. Explore why [YOLO26](https://docs.ultralytics.com/models/yolo26/) optimizes this for superior object detection.

In the domain of computer vision (CV) and deep learning, the receptive field refers to the specific region of an input image that a particular neuron in a neural network (NN) "sees" or analyzes. Conceptually, it functions similarly to the field of view of a human eye or a camera lens. It determines how much spatial context a model can perceive at any given layer. As data progresses through a Convolutional Neural Network (CNN), the receptive field typically expands, allowing the system to transition from identifying tiny, local details—like edges or corners—to understanding complex, global structures like entire objects or scenes.

The Mechanics Of Receptive Fields

Размер и глубина рецептивного поля определяются архитектурой сети. В начальных слоях нейроны обычно имеют небольшое рецептивное поле, фокусируясь на крошечной группе пикселей для захвата мелких текстур. По мере углубления сети такие операции, как объединение слоев и шаговые свертки, эффективно уменьшают разрешение карт признаков. Этот процесс позволяет последующим нейронам агрегировать информацию из гораздо большей части исходного входа.

Современные архитектуры, включая передовую Ultralytics , разработаны таким образом, чтобы тщательно сбалансировать эти поля . Если рецептивное поле слишком узкое, модель может не распознать крупные объекты, поскольку не сможет воспринять их форму целиком. И наоборот, если поле слишком широкое и не поддерживает разрешение, модель может пропустить мелкие объекты. Чтобы решить эту проблему, инженеры часто используют дилатационные свертки (также известные как атрозные свертки) для расширения рецептивного поля без снижения пространственного разрешения, что является важной техникой для высокоточных задач, таких как семантическая сегментация.

Применение в реальном мире

Оптимизация рецептивного поля имеет решающее значение для успеха различных решений в области искусственного интеллекта.

  • Автономное вождение: в искусственном интеллекте для автомобильной промышленности системы восприятия должны одновременно track детали и крупные препятствия. Автомобилю необходимо небольшое поле восприятия для идентификации удаленных светофоров, и в то же время требуется большое поле восприятия для понимания траектории движения близлежащего грузовика или кривизны дорожной полосы. Такое многомасштабное восприятие обеспечивает более высокую безопасность искусственного интеллекта и принятие решений.
  • Медицинская диагностика: при применении ИИ в здравоохранении радиологи полагаются на модели для выявления аномалий на сканах. Для идентификации опухолей головного мозга сети требуется большое рецептивное поле, чтобы понять общую симметрию и структуру мозга. Однако для detect в маммографии модель полагается на ранние слои с небольшими рецептивными полями, чувствительными к тонким изменениям текстуры.

Различение смежных понятий

Чтобы полностью понять принципы проектирования сетей, полезно отличать рецептивное поле от схожих терминов:

  • Рецептивное поле и ядро: Размер ядра (или фильтра) определяет размеры скользящего окна (например, 3x3) для одной операции свертки. Рецептивное поле — это возникающее свойство, представляющее собой общую накопленную входную область, влияющую на нейрон. Набор из нескольких ядер 3x3 приведет к рецептивному полю, значительно превышающему 3x3.
  • Рецептивное поле и карта признаков: Карта признаков — это объем вывода, создаваемый слоем, содержащий обученные представления. Рецептивное поле описывает взаимосвязь между одной точкой на карте признаков и исходным входным изображением.
  • Рецептивное поле и контекстное окно: Хотя оба термина относятся к объему воспринимаемых данных, «контекстное окно» обычно используется в обработке естественного языка (NLP) или анализе видео для обозначения временного или последовательного промежутка (например, ограничение токенов). Рецептивное поле строго относится к пространственной области в сетчатых данных (изображениях).

Practical Usage In Code

State-of-the-art models like the newer YOLO26 utilize Feature Pyramid Networks (FPN) to maintain effective receptive fields for objects of all sizes. The following example shows how to load a model and perform object detection, leveraging these internal architectural optimizations automatically. Users looking to train their own models with optimized architectures can utilize the Ultralytics Platform for seamless dataset management and cloud training.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас