Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Campo Receptivo

Explore como o campo recetivo define o que uma rede neural vê. Saiba como Ultralytics otimiza o contexto espacial para detect de todos os tamanhos de forma eficaz.

No domínio da visão computacional (CV) e da aprendizagem profunda , o campo recetivo refere-se à região específica de uma imagem de entrada que um neurónio específico numa rede neural (NN) «vê» ou analisa. Conceitualmente, funciona de forma semelhante ao campo de visão do olho humano ou da lente de uma câmara. Determina quanto contexto espacial um modelo pode perceber em qualquer camada. À medida que os dados avançam através de uma rede neural convolucional (CNN), o campo receptivo normalmente expande-se, permitindo que o sistema faça a transição da identificação de pequenos detalhes locais — como bordas ou cantos — para a compreensão de estruturas globais complexas, como objetos ou cenas inteiras.

A mecânica dos campos recetivos

O tamanho e a profundidade do campo recetivo são ditados pela arquitetura da rede. Nas camadas iniciais, os neurónios geralmente têm um campo recetivo pequeno, concentrando-se num pequeno conjunto de pixels para capturar texturas finas. À medida que a rede se aprofunda, operações como camadas de agrupamento e convoluções escalonadas efetivamente reduzem a resolução dos mapas de características. Esse processo permite que os neurónios subsequentes agreguem informações de uma porção muito maior da entrada original.

As arquiteturas modernas, incluindo a tecnologia de ponta Ultralytics , são projetadas para equilibrar esses campos meticulosamente. Se o campo recetivo for muito estreito, o modelo pode não reconhecer objetos grandes, pois não consegue perceber a forma completa. Por outro lado, se o campo for excessivamente amplo sem manter a resolução, o modelo pode deixar de reconhecer objetos pequenos. Para resolver isso, os engenheiros costumam usar convoluções dilatadas (também conhecidas como convoluções atrous ) para expandir o campo receptivo sem reduzir a resolução espacial, uma técnica vital para tarefas de alta precisão, como segmentação semântica.

Aplicações no Mundo Real

Otimizar o campo recetivo é fundamental para o sucesso de várias soluções de IA.

  • Condução autónoma: Na IA para automóveis, os sistemas de perceção devem track simultaneamente detalhes track e grandes obstáculos. Um veículo precisa de um pequeno campo recetivo para identificar semáforos distantes , ao mesmo tempo que requer um grande campo recetivo para compreender a trajetória de um camião próximo ou a curvatura da faixa da estrada. Essa perceção em múltiplas escalas garante melhor segurança e tomada de decisões da IA.
  • Diagnóstico médico: Ao aplicar a IA na área da saúde, os radiologistas dependem de modelos para detectar anomalias em exames. Para identificar tumores cerebrais, a rede requer um grande campo recetivo para compreender a simetria e a estrutura geral do cérebro. No entanto, para detect em mamografias, o modelo depende de camadas iniciais com pequenos campos recetivos sensíveis a mudanças sutis na textura.

Distinguir conceitos relacionados

Para compreender totalmente o design de rede, é útil diferenciar o campo recetivo de termos semelhantes:

  • Campo receptivo vs. Kernel: O tamanho do kernel (ou filtro) define as dimensões da janela deslizante (por exemplo, 3x3) para uma única operação de convolução. O campo receptivo é uma propriedade emergente que representa a área total acumulada de entrada que afeta um neurónio. Uma pilha de vários kernels 3x3 resultará num campo receptivo muito maior do que 3x3.
  • Campo recetivo vs. mapa de características: Um mapa de características é o volume de saída produzido por uma camada, contendo as representações aprendidas. O campo recetivo descreve a relação entre um único ponto nesse mapa de características e a imagem de entrada original.
  • Campo recetivo vs. Janela de contexto: Embora ambos os termos se refiram ao âmbito dos dados percebidos, «janela de contexto» é normalmente utilizado em Processamento de Linguagem Natural (NLP) ou análise de vídeo para denotar um intervalo temporal ou sequencial (por exemplo, limite de tokens). O campo recetivo refere-se estritamente à área espacial em dados em forma de grelha (imagens).

Utilização prática no código

Modelos de última geração, como o mais recente YOLO26, utilizam Feature Pyramid Networks (FPN) para manter campos receptivos eficazes para objetos de todos os tamanhos. O exemplo a seguir mostra como carregar um modelo e realizar a detecção de objetos, aproveitando essas otimizações arquitetónicas internas automaticamente. Os utilizadores que desejam treinar os seus próprios modelos com arquiteturas otimizadas podem utilizar a Ultralytics para gerenciamento contínuo de conjuntos de dados e treinamento em nuvem.

from ultralytics import YOLO

# Load the latest YOLO26 model with optimized multi-scale receptive fields
model = YOLO("yolo26n.pt")

# Run inference; the model aggregates features from various receptive field sizes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results, detecting both large (bus) and small (person) objects
results[0].show()

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora