Receptive Field
Узнай, как рецептивное поле определяет то, что видит нейронная сеть. Узнай, как Ultralytics YOLO26 оптимизирует пространственный контекст для эффективного обнаружения объектов любых размеров.
В области компьютерного зрения (CV) и глубокого обучения рецептивное поле относится к конкретной области входного изображения, которую «видит» или анализирует отдельный нейрон в нейронной сети (NN). Концептуально оно функционирует подобно полю зрения человеческого глаза или объектива камеры. Оно определяет, какой объем пространственного контекста модель может воспринимать на любом заданном слое. По мере прохождения данных через сверточную нейронную сеть (CNN) рецептивное поле обычно расширяется, позволяя системе переходить от распознавания мелких локальных деталей, таких как края или углы, к пониманию сложных глобальных структур, например, целых объектов или сцен.
Link to this sectionМеханика рецептивных полей#
Размер и глубина рецептивного поля определяются архитектурой сети. В начальных слоях нейроны обычно имеют небольшое рецептивное поле, фокусируясь на крошечном кластере пикселей для захвата мелкозернистых текстур. По мере углубления сети такие операции, как слои пулинга и свертки со сдвигом, эффективно понижают разрешение карт признаков. Этот процесс позволяет последующим нейронам агрегировать информацию из гораздо большей части исходных входных данных.
Современные архитектуры, включая передовую Ultralytics YOLO26, разработаны так, чтобы тщательно сбалансировать эти поля. Если рецептивное поле слишком узкое, модель может не распознать крупные объекты, так как не сможет увидеть их форму целиком. Напротив, если поле чрезмерно широкое без сохранения разрешения, модель может пропустить мелкие объекты. Чтобы решить эту проблему, инженеры часто используют дилатационные свертки (также известные как атросные свертки), чтобы расширить рецептивное поле без снижения пространственного разрешения — метод, критически важный для высокоточных задач, таких как семантическая сегментация.
Link to this sectionРеальные приложения#
Оптимизация рецептивного поля имеет решающее значение для успеха различных решений на базе ИИ.
- Автономное вождение: В ИИ для автомобильной промышленности системы восприятия должны одновременно отслеживать мельчайшие детали и крупные препятствия. Автомобилю нужно небольшое рецептивное поле для распознавания дальних светофоров и одновременно большое поле для понимания траектории движения грузовика поблизости или кривизны дорожной полосы. Такое многомасштабное восприятие обеспечивает лучшую безопасность ИИ и принятие решений.
- Медицинская диагностика: При применении ИИ в здравоохранении радиологи полагаются на модели для выявления аномалий на снимках. Для идентификации опухолей головного мозга сети требуется большое рецептивное поле, чтобы понимать общую симметрию и структуру мозга. Однако для обнаружения микрокальцинатов при маммографии модель опирается на ранние слои с небольшими рецептивными полями, чувствительными к тонким изменениям текстуры.
Link to this sectionРазграничение похожих концепций#
Чтобы полностью понять дизайн сети, полезно различать рецептивное поле и схожие термины:
- Рецептивное поле vs Ядро (Kernel): Размер ядра (или фильтра) определяет габариты скользящего окна (например, 3x3) для одной операции свертки. Рецептивное поле — это эмерджентное свойство, представляющее общую накопленную область входных данных, влияющую на нейрон. Стек из нескольких ядер 3x3 приведет к рецептивному полю, которое будет гораздо больше, чем 3x3.
- Рецептивное поле vs Карта признаков (Feature Map): Карта признаков — это выходной объем, созданный слоем и содержащий изученные представления. Рецептивное поле описывает связь между отдельной точкой на этой карте признаков и исходным входным изображением.
- Рецептивное поле vs Контекстное окно (Context Window): Хотя оба термина относятся к объему воспринимаемых данных, «контекстное окно» обычно используется в обработке естественного языка (NLP) или видеоанализе для обозначения временного или последовательного диапазона (например, лимита токенов). Рецептивное поле строго относится к пространственной области в сетчатых данных (изображениях).
Link to this sectionПрактическое использование в коде#
Современные модели, такие как новая YOLO26, используют пирамидальные сети признаков (FPN) для поддержания эффективных рецептивных полей для объектов всех размеров. В следующем примере показано, как загрузить модель и выполнить обнаружение объектов, автоматически используя эти внутренние архитектурные оптимизации. Пользователи, желающие обучить свои собственные модели с оптимизированными архитектурами, могут воспользоваться платформой Ultralytics для удобного управления наборами данных и облачного обучения.
from ultralytics import YOLO
# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")
# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results, detecting both large (bus) and small (person) objects
results[0].show()





