Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Ring Attention

Esplora come la Ring Attention scala i Transformer a lunghezze di sequenza infinite. Scopri come questa tecnica migliora gli LLM e i Vision Transformer per compiti con enormi quantità di dati.

Ring Attention è una tecnica avanzata di machine learning (ML) progettata per scalare la finestra di contesto delle architetture Transformer fino a lunghezze di sequenza virtualmente infinite. Distribuendo il complesso calcolo dell'attenzione su un cluster di GPU collegate in una topologia ad anello, sovrappone efficacemente la comunicazione al calcolo. Questa innovazione architettonica consente ai Large Language Models (LLM) e ai Vision Transformer (ViT) di elaborare input massivi, come libri interi o ore di video continuo, che superano di gran lunga la capacità di memoria di qualsiasi singolo dispositivo hardware.

Link to this sectionSuperare la barriera della finestra di contesto#

Nei meccanismi standard di self-attention, il consumo di memoria scala in modo quadratico con la lunghezza della sequenza di input. Questo crea un grave collo di bottiglia per i modelli di deep learning (DL) che tentano di analizzare dati a lungo formato. Per saperne di più su come la comunità AI affronta questo problema, puoi esplorare il lavoro di Berkeley AI Research sui modelli a contesto ampio.

Ring Attention risolve questo collo di bottiglia quadratico suddividendo le query, le key e i value in blocchi più piccoli. Ogni GPU nella rete distribuita calcola un blocco e poi passa le key e i value al dispositivo vicino nell'anello. Questo trasferimento ciclico continua fino a quando non viene calcolato l'intero meccanismo di attenzione. L'utilizzo di strumenti come il pacchetto di comunicazione distribuita di PyTorch consente agli sviluppatori di costruire questi sofisticati pipeline di addestramento multi-dispositivo.

Link to this sectionRing Attention vs. Flash Attention#

Sebbene entrambe le tecniche ottimizzino la memoria, operano a livelli diversi. Flash Attention è un algoritmo hardware-aware che minimizza le costose operazioni di lettura e scrittura in memoria all'interno della SRAM di una singola GPU. Al contrario, Ring Attention è un algoritmo distribuito focalizzato sulla scalabilità del calcolo su più GPU. Nei flussi di lavoro di IA generativa allo stato dell'arte, queste due tecniche vengono spesso combinate per ottenere sia un'efficienza hardware localizzata che una massiccia scalabilità multi-dispositivo, come descritto nel documento di ricerca originale su Ring Attention su arXiv.

Link to this sectionApplicazioni nel mondo reale#

La capacità di elaborare milioni di token simultaneamente sblocca potenti funzionalità nell'IA moderna:

  1. Analisi completa di documenti e codebase: Ring Attention consente ai modelli di ingerire milioni di righe di codice o complesse librerie legali in un singolo prompt. Ciò migliora enormemente i sistemi che si basano sulla Retrieval Augmented Generation (RAG), consentendo loro di sintetizzare il contesto senza troncare informazioni vitali. Questo concetto è fondamentale per modelli a contesto massivo come l'architettura Gemini di Google.

  2. Comprensione video estesa: Nella computer vision (CV), l'elaborazione di sequenze video ad alta risoluzione richiede solitamente un downsampling aggressivo. Ring Attention permette ai modelli di analizzare feed video non compressi della durata di ore. Ciò migliora il riconoscimento delle azioni e il tracciamento degli oggetti continuo nei sistemi di sicurezza e guida autonoma, mantenendo la consapevolezza temporale su lunghe durate.

Link to this sectionElaborazione di sequenze visive#

Mentre i modelli di attenzione distribuita massiva gestiscono contesti infiniti, le applicazioni pratiche orientate all'edge richiedono architetture altamente ottimizzate. Per l'inferenza in tempo reale e l'elaborazione di sequenze visive, Ultralytics YOLO26 offre prestazioni leader del settore senza l'estremo carico computazionale dei transformer basati puramente sull'attenzione.

from ultralytics import YOLO

# Load the recommended YOLO26 model for high-speed object tracking
model = YOLO("yolo26n.pt")

# Perform robust multi-object tracking on a long video sequence
results = model.track(source="long_surveillance_feed.mp4", stream=True)

# Iterate through the stream to process temporal tracking data
for frame_result in results:
    print(f"Tracked {len(frame_result.boxes)} objects in current frame.")

Quando costruisci e scali queste complesse soluzioni di rilevamento oggetti e segmentazione di immagini, gestire l'orchestrazione dell'hardware è fondamentale. La Ultralytics Platform semplifica completamente questo processo, offrendo strumenti per addestramento nel cloud senza interruzioni, annotazione automatizzata dei dataset e distribuzione del modello con un clic su più ambienti hardware. Sfruttare queste piattaforme assicura che le tecniche di scalabilità all'avanguardia passino senza intoppi dalla ricerca a pipeline di IA scalabili e pronte per la produzione.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning