Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

Linear Attention

Descubre cómo la atención lineal optimiza los modelos de aprendizaje profundo al reducir la complejidad de Transformer a O(N). Aprende cómo escala la eficiencia para aplicaciones de IA.

La atención lineal es una técnica de optimización fundamental diseñada para mejorar drásticamente la eficiencia computacional de los modelos modernos de aprendizaje profundo (DL). En las arquitecturas Transformer tradicionales, los mecanismos de atención estándar procesan secuencias comparando cada token con todos los demás. Esto genera un grave cuello de botella computacional y de memoria conocido como complejidad temporal cuadrática, u O(N al cuadrado), donde N es la longitud de la secuencia. La atención lineal altera esta operación matemática subyacente para que escale de forma lineal, u O(N). Este avance permite a los modelos de inteligencia artificial (IA) procesar conjuntos de datos masivos, como libros completos o imágenes de gigapíxeles, sin agotar la memoria del hardware.

Link to this sectionCómo funciona la atención lineal#

En la atención estándar, las redes neuronales procesan tres vectores principales: Consultas (Queries, Q), Claves (Keys, K) y Valores (Values, V). La fórmula clásica calcula la similitud entre todas las Consultas y Claves utilizando una función softmax, generando una matriz masiva N x N antes de multiplicarla por los Valores.

La atención lineal evita la generación de esta matriz intermedia masiva. En su lugar, se basa en la propiedad asociativa de la multiplicación de matrices. Al eliminar o aproximar la capa softmax mediante funciones de kernel especializadas, el modelo agrupa la multiplicación de forma diferente. Primero multiplica las Claves y los Valores para crear una matriz de contexto de tamaño fijo y, a continuación, multiplica las Consultas por esta nueva matriz comprimida. Este sencillo reordenamiento reduce significativamente la complejidad computacional, liberando hardware como una GPU (unidad de procesamiento gráfico) para gestionar entradas mucho más largas de forma nativa.

Link to this sectionDesarrollos recientes y DeltaNet#

La comunidad de investigación en IA, liderada por instituciones como la Universidad de Stanford y gigantes tecnológicos como Google DeepMind, innova continuamente en formulaciones lineales para aumentar la precisión. En 2024 y 2025, los investigadores presentaron DeltaNet, una arquitectura novedosa que sustituye las actualizaciones aditivas estándar en los transformers lineales por una "Regla Delta". Esto permite a la red actualizar su memoria interna en relación con lo que ya está almacenado, en lugar de calcular valores absolutos desde cero.

Los avances posteriores, como las arquitecturas Gated DeltaNet, introducen tasas de decaimiento por canal, lo que permite a los modelos olvidar o retener selectivamente características clave específicas a lo largo del tiempo. Estas innovaciones eficientes en cuanto a hardware cierran la brecha de rendimiento entre los transformers lineales y la atención softmax tradicional, específicamente en tareas complejas de recuperación en contexto.

Link to this sectionAtención lineal frente a otros mecanismos de atención#

Entender en qué se diferencia esta técnica de conceptos relacionados dentro de la familia más amplia de mecanismos de atención es crucial para los ingenieros de IA que optimizan sus redes:

  • Autoatención (Self-Attention): El mecanismo fundamental que utiliza la matriz softmax completa, computacionalmente costosa y de orden O(N al cuadrado), para capturar un contexto global perfecto.
  • Flash Attention: Una optimización consciente de la E/S (IO-aware) que acelera la matemática exacta de autoatención O(N al cuadrado) al mover eficientemente los datos entre los niveles de memoria de la GPU. A diferencia de la atención lineal, Flash Attention no cambia la fórmula matemática subyacente.
  • Atención dispersa (Sparse Attention): Un método que ahorra memoria forzando a la red a observar solo una ventana localizada de tokens vecinos, mientras que la atención lineal comprime matemáticamente toda la visión global en un estado fijo.

Link to this sectionAplicaciones en el mundo real#

Al romper la barrera de la longitud de la secuencia, el escalado lineal desbloquea capacidades potentes en múltiples dominios de la IA:

Link to this sectionEjemplo de código#

Los frameworks modernos como PyTorch y TensorFlow hacen que la implementación de estos conceptos matemáticos sea directa. A continuación, se muestra un fragmento conceptual de PyTorch que demuestra cómo la atención lineal cambia el orden de la multiplicación de matrices para lograr una eficiencia O(N).

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Si bien los modelos experimentales de la comunidad pueden incorporar varias capas de atención lineal o dispersa, a menudo pueden sufrir de velocidades de CPU lentas o inestabilidad en el entrenamiento. Para despliegues de visión artificial robustos y listos para producción, Ultralytics YOLO26 es el estándar recomendado. Cuenta con una arquitectura altamente optimizada y nativamente integral (end-to-end) que maximiza la velocidad y la precisión para tareas críticas como la detección de objetos sin depender de pesadas capas de atención. Los desarrolladores pueden anotar conjuntos de datos, entrenar, desplegar y supervisar estos modelos de primer nivel sin problemas utilizando la integral Plataforma Ultralytics.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático