Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Reformer

Explora la arquitectura Reformer, una variante eficiente de Transformer para secuencias largas. Aprende cómo la atención LSH y las RevNets optimizan la memoria para la investigación en IA.

El Reformer es una variante eficiente de la arquitectura Transformer diseñada para procesar secuencias de datos muy largas que resultarían computacionalmente prohibitivas para los modelos estándar. Introducido para resolver los cuellos de botella de memoria inherentes a los sistemas tradicionales de deep learning, el Reformer reduce la complejidad del mecanismo de atención de términos cuadráticos a logarítmicos lineales. Esta innovación permite a los investigadores de inteligencia artificial entrenar modelos en ventanas de contexto que abarcan decenas de miles de tokens —como libros enteros, imágenes de alta resolución o largas composiciones musicales— en una sola GPU.

Link to this sectionInnovaciones clave del Reformer#

El Reformer logra su eficiencia mediante dos cambios arquitectónicos principales que lo distinguen de modelos como BERT o la serie original de GPT. Estas técnicas abordan la gran cantidad de memoria necesaria para almacenar activaciones durante el entrenamiento de modelos.

  • Atención por hashing sensible a la localidad (LSH): En un Transformer estándar, cada elemento de una secuencia presta atención a todos los demás, lo que genera una carga computacional masiva. El Reformer utiliza Locality-Sensitive Hashing para agrupar vectores similares. En lugar de calcular puntuaciones de atención para todos los pares, el modelo solo las calcula para un pequeño subconjunto de vecinos más cercanos, acelerando significativamente el motor de inferencia.
  • Capas residuales reversibles (RevNets): Las redes neuronales tradicionales deben almacenar activaciones para cada capa a fin de calcular gradientes durante la propagación hacia atrás. El Reformer utiliza redes neuronales reversibles, que permiten que la entrada de una capa se vuelva a calcular a partir de su salida durante el paso hacia atrás. Esta técnica elimina la necesidad de almacenar en caché las activaciones intermedias, liberando memoria para tamaños de lote mayores.

Link to this sectionReformer frente al Transformer estándar#

Aunque ambas arquitecturas dependen del mecanismo de autoatención, cumplen propósitos diferentes dentro del ecosistema de machine learning.

  • Transformer estándar: Excelente para secuencias de longitud corta a media. Sin embargo, su uso de memoria crece cuadráticamente ($O(L^2)$) con la longitud de la secuencia ($L$). Es la base de muchos modelos de lenguaje grandes (LLMs) utilizados para tareas como el análisis de sentimiento o los chatbots.
  • Reformer: Optimizado para longitudes extremas ($O(L \log L)$). Sacrifica una pequeña cantidad de precisión en algunos contextos para ganar la capacidad de manejar entradas imposibles para los Transformers estándar, como el procesamiento de datos extremadamente largos de análisis de series temporales o la generación de imágenes píxel a píxel.

Link to this sectionAplicaciones en el mundo real#

La capacidad del Reformer para manejar vastas ventanas de contexto abre nuevas posibilidades en campos donde los datos no pueden fragmentarse fácilmente.

  1. Análisis genómico: Las secuencias de ADN consisten en millones de pares de bases. El Reformer puede analizar estas largas cadenas para identificar patrones en bioinformática sin perder el contexto más amplio, lo que ayuda en la predicción de la estructura de proteínas.

  2. Generación de texto extenso: A diferencia de los modelos estándar de generación de texto que pueden perder la coherencia después de unos pocos párrafos, un Reformer puede mantener la consistencia a lo largo de miles de palabras, lo que lo hace adecuado para generar resúmenes de contratos legales extensos o capítulos completos de novelas.

Link to this sectionEficiencia en visión artificial#

Aunque los Reformers se asocian a menudo con el texto, el principio de eficiencia es crucial en visión artificial. Al igual que el Reformer optimiza los Transformers, los modelos de visión modernos como YOLO26 optimizan las redes neuronales convolucionales (CNN) para la inferencia en tiempo real. Comprender las limitaciones de memoria es vital al implementar modelos en dispositivos de borde a través de la Plataforma Ultralytics, donde los recursos de hardware son limitados.

El siguiente código demuestra cómo inspeccionar la huella de memoria de un modelo utilizando PyTorch, un concepto central para el desarrollo de arquitecturas eficientes en memoria como el Reformer.

import torch
import torch.nn as nn

# Define a simple Transformer layer (Standard, not Reformer optimized)
layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
model = nn.TransformerEncoder(layer, num_layers=6)

# Create a long sequence input (Sequence Length: 2000, Batch: 1, Features: 512)
# Standard Transformers struggle as this length increases.
input_data = torch.rand(2000, 1, 512)

# Check parameter count to understand model complexity
params = sum(p.numel() for p in model.parameters())
print(f"Model Parameters: {params:,}")

# Perform a forward pass
output = model(input_data)
print(f"Output shape: {output.shape}")

Link to this sectionConceptos relacionados#

  • Atención dispersa (Sparse Attention): Una categoría más amplia de técnicas, incluido el LSH, donde el modelo solo presta atención a un subconjunto de tokens para ahorrar computación.
  • Gradient Checkpointing: A technique similar to reversible layers used to trade computation time for memory during model training.
  • Optimización de modelos: La práctica general de mejorar la eficiencia del modelo, que abarca la cuantización, la poda y cambios arquitectónicos como los del Reformer.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático