Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Mapas de Características

Descubra como os mapas de caraterísticas alimentam os modelos Ultralytics YOLO , permitindo a deteção precisa de objectos e aplicações avançadas de IA, como a condução autónoma.

Um mapa de caraterísticas é o resultado fundamental gerado quando um filtro convolucional actua sobre uma imagem de entrada ou outro mapa de caraterísticas numa rede neural convolucional (CNN). No contexto da visão computacional (CV), estes mapas actuam como os "olhos" de uma rede neural, destacando a presença e a localização de caraterísticas caraterísticas aprendidas, tais como arestas, texturas, cantos ou formas geométricas complexas. Ao transformar dados brutos de pixéis em abstracções significativas, os mapas de caraterísticas permitem que modelos sofisticados executem tarefas que vão desde a classificação de imagens até à deteção de objectos em tempo real.

Como são criados os mapas de caraterísticas

A geração de um mapa de caraterísticas envolve um processo matemático conhecido como convolução. Uma matriz especializada de de pesos aprendíveis, designada por kernel ou filtro, desliza pelos dados de entrada. Em cada posição, o kernel efectua uma multiplicação e soma de elementos, produzindo um valor único na matriz de saída.

  • Ativação: Os valores resultantes passam normalmente por uma função de ativação como a ReLU, que introduz a não-linearidade, permitindo que a rede aprenda padrões complexos.
  • Preservação espacial: Ao contrário das camadas totalmente ligadas, os mapas de elementos geográficos preservam as relações espaciais, o que significa que um valor elevado numa coordenada específica corresponde a uma caraterística detectada nessa mesma localização relativa na imagem original.
  • Profundidade: Uma única camada convolucional utiliza frequentemente vários filtros, empilhando as matrizes 2D resultantes para formar um volume 3D de mapas de caraterísticas, frequentemente visualizados em diagramas de arquitetura de aprendizagem profunda (DL).

Aprendizagem hierárquica de caraterísticas

As arquitecturas modernas, como a ResNet utilizadas em muitos sistemas, tiram partido da natureza hierárquica dos mapas de caraterísticas. medida que os dados progridem na rede, o nível de abstração aumenta:

  1. Camadas superficiais: Os mapas de caraterísticas iniciais captam detalhes de baixo nível, como linhas verticais, gradientes de gradientes de cor, ou curvas simples. Estes formam a base da perceção visual.
  2. Camadas profundas: Mais profundamente na rede, estes elementos básicos são combinados. Os mapas resultantes representam conceitos semânticos de alto nível, como a forma de uma roda de automóvel ou a cara de um cão. Esta hierarquia é fundamental para o desempenho de modelos de última geração como o YOLO11, permitindo-lhes distinguir entre classes semelhantes com elevada precisão.

Visualização da inteligência de rede

Os programadores visualizam frequentemente mapas de caraterísticas para interpretar o que um modelo aprendeu, uma prática fundamental na IA explicável (XAI). Ferramentas como o TensorBoard permitem aos engenheiros inspecionar estes estados internos. Se um mapa de caraterísticas destinado a detect carros estiver a ser ativado em árvores de fundo, isso indica que o modelo pode estar a ajustar-se demasiado ao ruído. Esta inspeção é vital para depurar e melhorar a robustez do modelo.

O seguinte código Python demonstra como aceder às dimensões do mapa de caraterísticas utilizando a função ultralytics biblioteca registando um gancho numa camada convolucional.

from ultralytics import YOLO

# Load the YOLO11 model (nano version)
model = YOLO("yolo11n.pt")


# Define a hook to print the shape of the feature map from the first layer
def hook_fn(module, input, output):
    print(f"Feature Map Output Shape: {output.shape}")


# Register the hook to the first convolutional layer of the model
model.model.model[0].register_forward_hook(hook_fn)

# Run inference on a dummy image to trigger the hook
model("https://ultralytics.com/images/bus.jpg")

Aplicações no Mundo Real

Os mapas de caraterísticas são o motor de muitas tecnologias transformadoras:

  • Veículos autónomos: Nos sistemas de condução autónoma, como os desenvolvidos pela Waymo, os mapas de recursos processam os feeds da câmara para identificar marcações de faixa, pedestres e sinais de trânsito. A fidelidade espacial desses mapas garante que o veículo saiba não apenas o que está na estrada, mas exatamente onde está em relação ao carro.
  • Diagnóstico médico: Na análise de imagens médicas, os modelos de aprendizagem profunda analisam exames de ressonância magnética ou de tomografia computorizada. Os mapas de caraterísticas nestas redes são treinados para realçar anomalias como tumores ou fracturas. A investigação publicada em revistas como a Nature Medicine demonstra como estas activações específicas podem ajudar os radiologistas, assinalando regiões de interesse com elevada precisão.

Distinguir conceitos relacionados

Para compreender plenamente as arquitecturas das redes neuronais, é útil diferenciar os mapas de caraterísticas dos termos relacionados:

  • Mapas de caraterísticas vs. extração de caraterísticas: A extração de caraterísticas é o processo abrangente processo de obtenção de dados informativos a partir de dados brutos. O mapa de caraterísticas é a estrutura de dados estrutura de dados específica resultante deste processo numa camada CNN.
  • Mapas de caraterísticas vs. Embeddings: Enquanto os mapas de caraterísticas mantêm as dimensões espaciais (altura e largura), os embeddings são tipicamente vectores achatados, de dimensão vectores. Os embeddings representam a essência semântica de toda uma imagem ou objeto, sendo frequentemente utilizados para pesquisa de semelhanças numa base de dados vetorial, enquanto os mapas de caraterísticas são utilizados para tarefas que requerem localização espacial, como a segmentação de imagens.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora