Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Self-Attention

Esplora i fondamenti della self-attention nel deep learning. Scopri come i vettori Query, Key e Value alimentano i Transformer e Ultralytics YOLO26 per un'AI superiore.

Il self-attention è un meccanismo fondamentale nel deep learning che consente ai modelli di valutare l'importanza di diversi elementi all'interno di una sequenza di input in relazione l'uno con l'altro. A differenza delle architetture tradizionali che elaborano i dati in sequenza o si concentrano solo sui vicinati locali, il self-attention consente a una neural network di esaminare simultaneamente l'intero contesto. Questa capacità aiuta i sistemi a identificare relazioni complesse tra parti distanti dei dati, come le parole in una frase o regioni distinte in un'immagine. Serve come blocco costitutivo fondamentale per l'architettura Transformer, che ha guidato enormi progressi nell'generative AI e nei moderni sistemi di percezione.

Link to this sectionCome funziona il Self-Attention#

Il meccanismo imita la messa a fuoco cognitiva assegnando un peso, spesso chiamato "punteggio di attenzione", a ciascuna feature di input. Per calcolare questi punteggi, il modello trasforma i dati di input—tipicamente rappresentati come embeddings—in tre vettori distinti: la Query, la Key e il Value.

  • Query (Q): Rappresenta l'elemento corrente che cerca un contesto rilevante dal resto della sequenza.
  • Key (K): Funge da etichetta o identificatore per ogni elemento nella sequenza rispetto al quale viene abbinata la query.
  • Value (V): Contiene l'effettivo contenuto informativo dell'elemento che verrà aggregato.

Il modello confronta la Query di un elemento con le Key di tutti gli altri elementi per determinare la compatibilità. Questi punteggi di compatibilità vengono normalizzati utilizzando una funzione softmax per creare pesi simili a probabilità. Questi pesi vengono quindi applicati ai Value, generando una rappresentazione ricca di contesto. Questo processo consente ai Large Language Models (LLMs) e ai sistemi di visione di dare priorità alle informazioni significative filtrando il rumore.

Link to this sectionApplicazioni nel mondo reale#

La versatilità del self-attention ha portato alla sua diffusa adozione in vari ambiti dell'Artificial Intelligence (AI).

  • Natural Language Processing (NLP): In attività come la machine translation, il self-attention risolve l'ambiguità collegando i pronomi ai loro referenti. Ad esempio, nella frase "L'animale non ha attraversato la strada perché era troppo stanco", il modello usa il self-attention per associare fortemente "era" (il soggetto sottinteso) ad "animale" piuttosto che a "strada". Questa consapevolezza contestuale alimenta strumenti come Google Translate.
  • Contesto globale dell'immagine: Nel Computer Vision (CV), architetture come il Vision Transformer (ViT) dividono le immagini in patch e applicano il self-attention per comprendere la scena globalmente. Questo è vitale per l'object detection in ambienti complessi dove l'identificazione di un oggetto dipende dalla comprensione di ciò che lo circonda.

Link to this sectionDistinguere termini correlati#

Sebbene spesso discussi insieme a concetti simili, questi termini hanno definizioni tecniche distinte:

  • Attention Mechanism: L'ampia categoria di tecniche che consentono ai modelli di concentrarsi su parti specifiche dei dati. Comprende il Cross-Attention, in cui un modello utilizza una sequenza (come un output del decoder) per interrogare una sequenza diversa (come un input dell'encoder).
  • Self-Attention: Un tipo specifico di attenzione in cui la Query, la Key e il Value provengono tutti dalla stessa sequenza di input. È progettato per apprendere dipendenze interne all'interno di un singolo set di dati.
  • Flash Attention: Un algoritmo di ottimizzazione sviluppato dai ricercatori della Stanford University che rende il calcolo del self-attention significativamente più veloce ed efficiente dal punto di vista della memoria sulle GPUs senza alterare il risultato matematico.

Link to this sectionEsempio di codice#

Il seguente snippet Python dimostra come utilizzare RTDETR, un rilevatore di oggetti basato su Transformer incluso nel pacchetto ultralytics. A differenza delle reti convoluzionali standard, questo modello si basa pesantemente sul self-attention per elaborare le feature visive.

from ultralytics import RTDETR

# Load the RT-DETR model which utilizes self-attention for detection
model = RTDETR("rtdetr-l.pt")

# Perform inference on an image to detect objects with global context
# Self-attention helps the model understand relationships between distant objects
results = model("https://ultralytics.com/images/bus.jpg")

# Print the number of objects detected
print(f"Detected {len(results[0].boxes)} objects using Transformer attention.")

Link to this sectionEvoluzione e impatto futuro#

Il self-attention ha risolto efficacemente il problema del vanishing gradient che ostacolava le prime Recurrent Neural Networks (RNNs), consentendo l'addestramento di massicci foundation models. Sebbene altamente efficace, il costo computazionale del self-attention standard cresce quadraticamente con la lunghezza della sequenza. Per risolvere questo problema, la ricerca attuale si concentra su efficienti meccanismi di attenzione lineare.

Ultralytics integra questi progressi in modelli all'avanguardia come YOLO26, che combina la velocità delle CNN con la potenza contestuale dell'attenzione per una real-time inference superiore. Questi modelli ottimizzati possono essere facilmente addestrati e distribuiti tramite la Ultralytics Platform, ottimizzando il flusso di lavoro per gli sviluppatori che creano la prossima generazione di applicazioni intelligenti.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning