Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Mapas de características

Descubra cómo los mapas de características actúan como los ojos de las CNN. Aprenda cómo Ultralytics utiliza estas representaciones internas para detect y potenciar la visión artificial.

Un mapa de características es el resultado fundamental que se produce cuando un filtro convolucional procesa una imagen de entrada o una capa anterior dentro de una red neuronal. En el contexto de la visión por computadora (CV), estos mapas sirven como la representación interna de los datos, resaltando patrones específicos como bordes, texturas o formas geométricas complejas que el modelo ha aprendido a reconocer. Esencialmente, los mapas de características actúan como los «ojos» de una red neuronal convolucional (CNN), transformando los valores de píxeles sin procesar en abstracciones significativas que facilitan tareas como la detección y clasificación de objetos.

El mecanismo detrás de los mapas de características

La creación de un mapa de características se basa en la operación matemática conocida como convolución. Durante este proceso, una pequeña matriz de parámetros aprendibles, denominada núcleo o filtro, se desliza a lo largo de los datos de entrada. En cada posición, el núcleo realiza una multiplicación y suma por elementos, lo que da como resultado un único valor en la cuadrícula de salida.

  • Activación de patrones: cada filtro está entrenado para buscar una característica específica. Cuando el filtro encuentra esa característica en la entrada, el valor resultante en el mapa de características es alto, lo que indica una fuerte activación.
  • Jerarquía espacial: En las arquitecturas de aprendizaje profundo (DL), los mapas de características se organizan jerárquicamente. Las primeras capas producen mapas que detect detalles detect , como líneas y curvas de detección de bordes. Las capas más profundas combinan estos mapas simples para formar representaciones de alto nivel de objetos complejos, como rostros o vehículos.
  • Cambios de dimensionalidad: A medida que los datos avanzan por la red, operaciones como las capas de agrupación suelen reducir las dimensiones espaciales (altura y anchura) de los mapas de características, al tiempo que aumentan la profundidad (número de canales). Este proceso, a menudo denominado reducción de dimensionalidad, ayuda al modelo a centrarse en la presencia de características en lugar de en su ubicación exacta en píxeles.

Aplicaciones en el mundo real

Los mapas de características son la sala de máquinas de las aplicaciones modernas de IA, ya que permiten a los sistemas interpretar datos visuales con una comprensión similar a la humana .

  • Diagnóstico médico: En el análisis de imágenes médicas, los modelos utilizan mapas de características para procesar radiografías o resonancias magnéticas. Los primeros mapas pueden resaltar los contornos óseos, mientras que los mapas más profundos identifican anomalías como tumores o fracturas, lo que ayuda a los médicos en la IA en escenarios sanitarios.
  • Navegación autónoma: Los coches autónomos dependen en gran medida de los mapas de características generados por sensores visuales. Estos mapas permiten al ordenador de a bordo del vehículo distinguir entre carriles, peatones y señales de tráfico en tiempo real, lo cual es fundamental para que los vehículos autónomos funcionen con seguridad.

Trabajar con mapas de características en Python

Aunque los mapas de características son estructuras internas, comprender sus dimensiones es fundamental a la hora de diseñar arquitecturas. El siguiente PyTorch muestra cómo una sola capa convolucional transforma una imagen de entrada en un mapa de características.

import torch
import torch.nn as nn

# Define a convolution layer: 1 input channel, 1 output filter, 3x3 kernel
conv_layer = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, bias=False)

# Create a random dummy image (Batch Size=1, Channels=1, Height=5, Width=5)
input_image = torch.randn(1, 1, 5, 5)

# Pass the image through the layer to generate the feature map
feature_map = conv_layer(input_image)

print(f"Input shape: {input_image.shape}")
# The output shape will be smaller (3x3) due to the kernel size and no padding
print(f"Feature Map shape: {feature_map.shape}")

Distinguir conceptos relacionados

Es útil distinguir los mapas de características de términos similares para evitar confusiones durante el entrenamiento del modelo:

  • Mapa de características frente a filtro: un filtro (o núcleo) es la herramienta utilizada para escanear la imagen; contiene los pesos del modelo. El mapa de características es el resultado de ese escaneo. Se puede pensar en el filtro como la «lente» y en el mapa de características como la «imagen» capturada a través de esa lente.
  • Mapa de características frente a incrustación: aunque ambos representan datos, los mapas de características suelen conservar estructuras espaciales (altura y anchura) adecuadas para la segmentación semántica. Por el contrario, las incrustaciones suelen ser vectores unidimensionales aplanados que capturan el significado semántico pero descartan la disposición espacial, y se utilizan a menudo en tareas de búsqueda por similitud.
  • Mapa de características frente a activación: se aplica una función de activación (como ReLU) a los valores dentro de un mapa de características para introducir no linealidad. El mapa existe tanto antes como después de esta operación matemática .

Relevancia para Ultralytics

En arquitecturas avanzadas como YOLO26, los mapas de características desempeñan un papel fundamental en la «columna vertebral» y la «cabeza» del modelo. La columna vertebral extrae características a diferentes escalas (pirámide de características), lo que garantiza que el modelo pueda detect objetos pequeños detect grandes detect forma eficaz. Los usuarios que utilizan la Ultralytics para el entrenamiento pueden visualizar el rendimiento de estos modelos, observando indirectamente la eficacia de los mapas de características subyacentes a través de métricas como la precisión y la recuperación. La optimización de estos mapas implica un entrenamiento exhaustivo con conjuntos de datos anotados, a menudo utilizando técnicas como la extracción de características para transferir el conocimiento de los modelos preentrenados a nuevas tareas.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora