Feature Maps

Explora cómo los mapas de características actúan como los ojos de las CNN. Aprende cómo Ultralytics YOLO26 utiliza estas representaciones internas para detectar patrones e impulsar la visión artificial.

Un mapa de características es la salida fundamental producida cuando un filtro convolucional procesa una imagen de entrada o una capa precedente dentro de una red neuronal. En el contexto de la visión artificial (CV), estos mapas sirven como representación interna de los datos, destacando patrones específicos como bordes, texturas o formas geométricas complejas que el modelo ha aprendido a reconocer. Esencialmente, los mapas de características actúan como los "ojos" de una Red Neuronal Convolucional (CNN), transformando los valores de píxeles brutos en abstracciones significativas que facilitan tareas como la detección de objetos y la clasificación.

Link to this sectionEl mecanismo detrás de los mapas de características#

La creación de un mapa de características es impulsada por la operación matemática conocida como convolución. Durante este proceso, una pequeña matriz de parámetros aprendibles, llamada kernel o filtro, se desliza a través de los datos de entrada. En cada posición, el kernel realiza una multiplicación y suma elemento a elemento, resultando en un valor único en la cuadrícula de salida.

Activación de patrones: Cada filtro está entrenado para buscar una característica específica. Cuando el filtro encuentra esa característica en la entrada, el valor resultante en el mapa de características es alto, lo que indica una activación fuerte.
Jerarquía espacial: En arquitecturas de aprendizaje profundo (DL), los mapas de características están organizados jerárquicamente. Las primeras capas producen mapas que detectan detalles de bajo nivel como líneas y curvas de detección de bordes. Las capas más profundas combinan estos mapas simples para formar representaciones de alto nivel de objetos complejos, como rostros o vehículos.
Cambios de dimensionalidad: A medida que los datos avanzan a través de la red, operaciones como las capas de pooling típicamente reducen las dimensiones espaciales (alto y ancho) de los mapas de características mientras aumentan la profundidad (número de canales). Este proceso, a menudo llamado reducción de dimensionalidad, ayuda al modelo a enfocarse en la presencia de características en lugar de en su ubicación exacta de píxel.

Link to this sectionAplicaciones en el mundo real#

Los mapas de características son la sala de máquinas de las aplicaciones modernas de IA, permitiendo a los sistemas interpretar datos visuales con una comprensión similar a la humana.

Diagnóstico médico: En el análisis de imágenes médicas, los modelos utilizan mapas de características para procesar radiografías o escáneres de resonancia magnética. Los mapas tempranos podrían resaltar contornos óseos, mientras que los mapas más profundos identifican anomalías como tumores o fracturas, asistiendo a los médicos en escenarios de IA en el cuidado de la salud.
Navegación autónoma: Los coches autónomos dependen en gran medida de los mapas de características generados por sensores visuales. Estos mapas permiten al ordenador de a bordo del vehículo distinguir entre carriles, peatones y señales de tráfico en tiempo real, lo cual es fundamental para que los vehículos autónomos operen con seguridad.

Link to this sectionTrabajar con mapas de características en Python#

Aunque los mapas de características son estructuras internas, entender sus dimensiones es crucial al diseñar arquitecturas. El siguiente ejemplo de PyTorch demuestra cómo una sola capa convolucional transforma una imagen de entrada en un mapa de características.

import torch
import torch.nn as nn

# Define a convolution layer: 1 input channel, 1 output filter, 3x3 kernel
conv_layer = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, bias=False)

# Create a random dummy image (Batch Size=1, Channels=1, Height=5, Width=5)
input_image = torch.randn(1, 1, 5, 5)

# Pass the image through the layer to generate the feature map
feature_map = conv_layer(input_image)

print(f"Input shape: {input_image.shape}")
# The output shape will be smaller (3x3) due to the kernel size and no padding
print(f"Feature Map shape: {feature_map.shape}")

Link to this sectionDistinguir conceptos relacionados#

Resulta útil distinguir los mapas de características de términos similares para evitar confusión durante el entrenamiento del modelo:

Mapa de características frente a filtro: Un filtro (o kernel) es la herramienta utilizada para escanear la imagen; contiene los pesos del modelo. El mapa de características es el resultado de ese escaneo. Puedes pensar en el filtro como la "lente" y en el mapa de características como la "imagen" capturada a través de esa lente.
Mapa de características frente a embedding: Aunque ambos representan datos, los mapas de características típicamente retienen estructuras espaciales (alto y ancho) adecuadas para la segmentación semántica. Por el contrario, los embeddings suelen ser vectores 1D aplanados que capturan el significado semántico pero descartan la disposición espacial, a menudo utilizados en tareas de búsqueda de similitud.
Mapa de características frente a activación: Una función de activación (como ReLU) se aplica a los valores dentro de un mapa de características para introducir no linealidad. El mapa existe tanto antes como después de esta operación matemática.

Link to this sectionRelevancia para los modelos de Ultralytics#

En arquitecturas avanzadas como YOLO26, los mapas de características desempeñan un papel fundamental en el "backbone" y la "head" del modelo. El backbone extrae características a diferentes escalas (pirámide de características), asegurando que el modelo pueda detectar objetos pequeños y grandes de manera efectiva. Los usuarios que aprovechan la Plataforma Ultralytics para el entrenamiento pueden visualizar cómo funcionan estos modelos, observando indirectamente la eficacia de los mapas de características subyacentes a través de métricas como la precisión y la exhaustividad. La optimización de estos mapas implica un entrenamiento extensivo en conjuntos de datos anotados, a menudo utilizando técnicas como la extracción de características para transferir el conocimiento de modelos preentrenados a nuevas tareas.

Feature Maps

Link to this sectionEl mecanismo detrás de los mapas de características#

Link to this sectionAplicaciones en el mundo real#

Link to this sectionTrabajar con mapas de características en Python#

Link to this sectionDistinguir conceptos relacionados#

Link to this sectionRelevancia para los modelos de Ultralytics#

Explore solutions

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

¡Construyamos juntos el futuro de la IA!