Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Linear Attention

Scopri come la linear attention ottimizza i modelli di deep learning riducendo la complessità dei Transformer a O(N). Impara come scala l'efficienza per le applicazioni AI.

Linear attention è una tecnica di ottimizzazione fondamentale progettata per migliorare drasticamente l'efficienza computazionale dei moderni modelli di deep learning (DL). Nelle architetture Transformer tradizionali, i meccanismi di attenzione standard elaborano le sequenze confrontando ogni singolo token con tutti gli altri. Ciò crea un grave collo di bottiglia computazionale e di memoria noto come complessità temporale quadratica, o O(N al quadrato), dove N è la lunghezza della sequenza. La linear attention modifica questa operazione matematica di base in modo che scali in modo lineare, o O(N). Questo passo avanti consente ai modelli di intelligenza artificiale (AI) di elaborare dataset massivi, come libri interi o immagini gigapixel, senza esaurire la memoria hardware.

Link to this sectionCome funziona la Linear Attention#

Nell'attenzione standard, le reti neurali elaborano tre vettori principali: Query (Q), Key (K) e Value (V). La formula classica calcola la somiglianza tra tutte le Query e le Key utilizzando una funzione softmax, generando una massiccia matrice N x N prima di moltiplicarla per i Value.

La linear attention aggira la generazione di questa massiccia matrice intermedia. Invece, si basa sulla proprietà associativa della moltiplicazione di matrici. Eliminando o approssimando lo strato softmax utilizzando funzioni kernel specializzate, il modello raggruppa la moltiplicazione in modo diverso. Moltiplica prima le Key e i Value per creare una matrice di contesto di dimensioni fisse, e quindi moltiplica le Query per questa nuova matrice compressa. Questo semplice riordino riduce significativamente la complessità computazionale, liberando hardware come una GPU (Graphics Processing Unit) per gestire nativamente input molto più lunghi.

Link to this sectionSviluppi recenti e DeltaNet#

La comunità di ricerca sull'AI, guidata da istituzioni come la Stanford University e giganti tecnologici come Google DeepMind, innova continuamente le formulazioni lineari per aumentare la precisione. Nel 2024 e nel 2025, i ricercatori hanno introdotto DeltaNet, un'architettura innovativa che sostituisce i classici aggiornamenti additivi nei transformer lineari con una "Delta Rule". Ciò consente alla rete di aggiornare la propria memoria interna in relazione a ciò che è già archiviato, piuttosto che calcolare valori assoluti partendo da zero.

I progressi successivi, come le architetture Gated DeltaNet, introducono tassi di decadimento per canale, consentendo ai modelli di dimenticare o conservare selettivamente caratteristiche chiave specifiche nel tempo. Queste innovazioni efficienti dal punto di vista hardware colmano il divario di prestazioni tra i transformer lineari e la tradizionale attenzione softmax, in particolare in complessi task di recupero in-context.

Link to this sectionLinear Attention rispetto ad altri meccanismi di attenzione#

Comprendere come questa tecnica differisca da concetti correlati all'interno della più ampia famiglia dei meccanismi di attenzione è fondamentale per gli ingegneri AI che ottimizzano le proprie reti:

  • Self-Attention: Il meccanismo fondamentale che utilizza l'intera matrice softmax O(N al quadrato), computazionalmente costosa, per catturare un contesto globale perfetto.
  • Flash Attention: Un'ottimizzazione consapevole dell'IO che accelera l'esatta matematica della self-attention O(N al quadrato) spostando in modo efficiente i dati tra i livelli di memoria della GPU. A differenza della linear attention, Flash Attention non modifica la formula matematica sottostante.
  • Sparse Attention: Un metodo che consente di risparmiare memoria costringendo la rete a guardare solo una finestra localizzata di token vicini, mentre la linear attention comprime matematicamente l'intera visione globale in uno stato fisso.

Link to this sectionApplicazioni nel mondo reale#

Superando la barriera della lunghezza della sequenza, la scalabilità lineare sblocca potenti funzionalità in molteplici domini AI:

Link to this sectionEsempio di codice#

Framework moderni come PyTorch e TensorFlow rendono semplice l'implementazione di questi concetti matematici. Di seguito è riportato uno snippet concettuale in PyTorch che dimostra come la linear attention cambi l'ordine della moltiplicazione di matrici per ottenere un'efficienza O(N).

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Sebbene i modelli sperimentali della community possano incorporare vari strati di attenzione lineare o sparsa, possono spesso soffrire di basse velocità della CPU o instabilità durante l'addestramento. Per distribuzioni di computer vision robuste e pronte per la produzione, Ultralytics YOLO26 è lo standard consigliato. È dotato di un'architettura end-to-end altamente ottimizzata che massimizza velocità e precisione per task critici come l'object detection senza fare affidamento su pesanti strati di attenzione. Gli sviluppatori possono annotare dataset, addestrare, distribuire e monitorare questi modelli di alto livello in modo fluido utilizzando la completa Ultralytics Platform.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning