Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Linear Attention

Descobre como a atenção linear otimiza modelos de deep learning ao reduzir a complexidade do Transformer para O(N). Aprende como ela escala a eficiência para aplicações de IA.

A atenção linear é uma técnica fundamental de otimização projetada para melhorar drasticamente a eficiência computacional de modelos modernos de deep learning (DL). Em arquiteturas Transformer tradicionais, mecanismos de atenção padrão processam sequências comparando cada token individual contra todos os outros. Isso cria um gargalo computacional e de memória severo, conhecido como complexidade de tempo quadrática, ou O(N ao quadrado), onde N é o comprimento da sequência. A atenção linear altera essa operação matemática subjacente para que ela escale linearmente, ou O(N). Esse avanço permite que modelos em inteligência artificial (IA) processem conjuntos de dados massivos, como livros inteiros ou imagens de gigapixels, sem esgotar a memória do hardware.

Link to this sectionComo a Atenção Linear Funciona#

Na atenção padrão, redes neurais processam três vetores principais: Consultas (Queries - Q), Chaves (Keys - K) e Valores (Values - V). A fórmula clássica calcula a similaridade entre todas as Consultas e Chaves usando uma função softmax, gerando uma enorme matriz N x N antes de multiplicá-la pelos Valores.

A atenção linear contorna a geração dessa enorme matriz intermediária. Em vez disso, ela conta com a propriedade associativa da multiplicação de matrizes. Ao descartar ou aproximar a camada softmax usando funções de kernel especializadas, o modelo agrupa a multiplicação de forma diferente. Ele multiplica as Chaves e os Valores primeiro para criar uma matriz de contexto de tamanho fixo, e então multiplica as Consultas por essa nova matriz comprimida. Essa simples reordenação reduz significativamente a complexidade computacional, liberando hardware como uma GPU (Graphics Processing Unit) para lidar com entradas muito mais longas nativamente.

Link to this sectionDesenvolvimentos Recentes e DeltaNet#

A comunidade de pesquisa em IA, liderada por instituições como a Stanford University e gigantes da tecnologia como o Google DeepMind, inova continuamente em formulações lineares para aumentar a precisão. Em 2024 e 2025, pesquisadores introduziram o DeltaNet, uma nova arquitetura que substitui as atualizações aditivas padrão em transformers lineares por uma "Regra Delta". Isso permite que a rede atualize sua memória interna em relação ao que já está armazenado, em vez de calcular valores absolutos do zero.

Avanços subsequentes, como arquiteturas Gated DeltaNet, introduzem taxas de decaimento por canal, permitindo que modelos esqueçam ou retenham seletivamente características-chave específicas ao longo do tempo. Essas inovações eficientes em hardware preenchem a lacuna de desempenho entre transformers lineares e a atenção softmax tradicional, especificamente em tarefas complexas de recuperação em contexto.

Link to this sectionAtenção Linear vs. Outros Mecanismos de Atenção#

Entender como essa técnica difere de conceitos relacionados dentro da família mais ampla de mecanismos de atenção é crucial para engenheiros de IA que estão otimizando suas redes:

  • Self-Attention: O mecanismo fundamental que utiliza a matriz softmax completa e computacionalmente cara de O(N ao quadrado) para capturar um contexto global perfeito.
  • Flash Attention: Uma otimização consciente de IO que acelera a matemática exata da self-attention de O(N ao quadrado) movendo dados de forma eficiente entre os níveis de memória da GPU. Diferente da atenção linear, o Flash Attention não altera a fórmula matemática subjacente.
  • Sparse Attention: Um método que economiza memória forçando a rede a olhar apenas para uma janela localizada de tokens vizinhos, enquanto a atenção linear comprime matematicamente toda a visão global em um estado fixo.

Link to this sectionAplicações no Mundo Real#

Ao romper a barreira do comprimento da sequência, o escalonamento linear desbloqueia capacidades poderosas em múltiplos domínios de IA:

Link to this sectionExemplo de Código#

Frameworks modernos como PyTorch e TensorFlow tornam a implementação desses conceitos matemáticos direta. Abaixo está um snippet conceitual de PyTorch demonstrando como a atenção linear altera a ordem da multiplicação de matrizes para alcançar eficiência O(N).

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Embora modelos comunitários experimentais possam incorporar várias camadas de atenção linear ou esparsa, eles frequentemente podem sofrer com velocidades de CPU lentas ou instabilidade de treinamento. Para implementações de visão computacional robustas e prontas para produção, o Ultralytics YOLO26 é o padrão recomendado. Ele apresenta uma arquitetura altamente otimizada e nativamente de ponta a ponta que maximiza a velocidade e a precisão para tarefas críticas como detecção de objetos sem depender de camadas de atenção pesadas. Desenvolvedores podem anotar conjuntos de dados, treinar, implantar e monitorar esses modelos de alto nível perfeitamente usando a Ultralytics Platform abrangente.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática