Identity Mapping
Explora el mapeo de identidad en el aprendizaje profundo. Aprende cómo las conexiones de salto evitan el desvanecimiento de gradientes para potenciar redes neuronales como Ultralytics YOLO26.
En matemáticas y álgebra lineal, un mapa de identidad o matriz de identidad es una función que devuelve exactamente el mismo valor que se utilizó como entrada. En el contexto de la inteligencia artificial (IA) y el deep learning, el mapeo de identidad se refiere a una técnica arquitectónica específica utilizada para pasar datos de entrada directamente a capas posteriores de una red neuronal convolucional (CNN) sin realizar ninguna transformación no lineal. Este concepto se popularizó enormemente con la introducción de las Redes Residuales (ResNet) en 2015, que revolucionaron la forma en que se estructuran y entrenan los modelos profundos de visión artificial (CV).
Link to this sectionCómo funciona el mapeo de identidad#
Las redes neuronales profundas sufren con frecuencia el problema del gradiente desvaneciente. Durante la retropropagación, las señales de error utilizadas para actualizar los pesos de la red se vuelven exponencialmente más pequeñas a medida que viajan hacia atrás a través de las capas, lo que impide que las primeras capas aprendan eficazmente. El mapeo de identidad resuelve esto creando "conexiones de salto" o "conexiones de atajo".
En lugar de obligar a las capas secuenciales a aprender un mapeo completamente nuevo y sin referencia, están diseñadas para aprender una función residual. Matemáticamente, si la entrada a un bloque es x, la capa aprende una transformación F(x). El mapeo de identidad añade la entrada original x directamente a la salida de esa transformación, lo que resulta en la salida final F(x) + x. Esto garantiza que, incluso en redes extremadamente profundas, los gradientes puedan fluir sin obstáculos directamente a través del backbone del modelo. Organizaciones de investigación de IA de renombre como Google DeepMind y OpenAI aprovechan con frecuencia estos atajos arquitectónicos para estabilizar el entrenamiento en modelos fundacionales masivos.
Link to this sectionMapeo de identidad vs. Preservación de identidad#
Es crucial distinguir el mapeo de identidad de la llamada preservación de identidad.
Aunque el mapeo de identidad es una característica estructural de codificación de una red neuronal diseñada para optimizar el flujo de entrenamiento de machine learning (ML), la preservación de identidad es una tarea de visión artificial distinta. La preservación de identidad se centra en mantener la consistencia visual de una persona u objeto específico a través de diferentes fotogramas de vídeo en el seguimiento de objetos o a través de imágenes generadas en flujos de trabajo de IA generativa.
Link to this sectionAplicaciones en el mundo real#
El mapeo de identidad sirve como el bloque de construcción fundamental para muchos modelos altamente precisos utilizados hoy en producción:
- Detección de Objetos Avanzada: Las arquitecturas modernas en tiempo real, incluyendo el último YOLO26 de Ultralytics, utilizan bloques residuales avanzados que contienen mapas de identidad dentro de sus capas de extracción de características. Esto les permite realizar detecciones precisas y de alta velocidad en entornos complejos como la conducción autónoma sin degradar el rendimiento a medida que aumenta la profundidad de la red.
- Modelos de Clasificación de Imágenes: Las arquitecturas de visión de última generación, documentadas extensamente en repositorios académicos como arXiv y la IEEE Xplore Digital Library, dependen de mapeos de identidad para entrenar con éxito modelos con cientos de capas. Los marcos de alto nivel como TensorFlow utilizan estos atajos para extraer características jerárquicas altamente complejas de conjuntos de datos masivos.
Link to this sectionImplementación del mapeo de identidad en PyTorch#
Al crear redes neuronales personalizadas, los marcos de deep learning como PyTorch proporcionan herramientas nativas para implementar estos atajos sin esfuerzo. Puedes utilizar explícitamente el módulo PyTorch nn.Identity o simplemente aplicar una suma matemática dentro de tu paso forward en nn.Module.
El siguiente fragmento demuestra un bloque residual básico que utiliza un mapa de identidad. Ten en cuenta que los desarrolladores que utilizan la Ultralytics Platform basada en la nube para la gestión de conjuntos de datos y el entrenamiento de modelos se benefician automáticamente de estas estructuras arquitectónicas altamente optimizadas de forma subyacente.
import torch.nn as nn
class ResidualBlock(nn.Module):
def __init__(self, channels):
super().__init__()
# A simple convolutional layer for feature extraction
self.conv = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
# Explicit identity mapping module
self.identity = nn.Identity()
def forward(self, x):
# The block output is the sum of the learned features and the identity map
return self.conv(x) + self.identity(x)





