Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

QLoRA

Scopri come QLoRA (Quantized Low-Rank Adaptation) abilita il fine-tuning efficiente di LLM su GPU consumer utilizzando la quantizzazione a 4 bit per risparmiare memoria GPU.

QLoRA (Quantized Low-Rank Adaptation) è una tecnica di ottimizzazione avanzata utilizzata nel deep learning progettata per rendere il fine-tuning di enormi large language models (LLMs) altamente efficiente. Introdotta per la prima volta in un documento di ricerca su arXiv ampiamente citato, QLoRA riduce drasticamente i requisiti di memoria GPU necessari per aggiornare modelli contenenti miliardi di parametri.

Sfruttando l'aggressiva model quantization a 4 bit, puoi ora ottimizzare potenti modelli fondamentali originariamente creati da organizzazioni come OpenAI o Anthropic utilizzando consumer-grade GPUs standard. Questa innovazione democratizza l'accesso alla generative AI all'avanguardia senza richiedere costosi cluster server a livello enterprise.

Link to this sectionCome funziona QLoRA#

L'innovazione principale di QLoRA risiede nelle sue tecniche di risparmio della memoria, costruite principalmente sui concetti fondamentali presenti nelle metodologie di quantizzazione di PyTorch. Introduce un nuovo tipo di dati chiamato 4-bit NormalFloat (NF4), che è matematicamente ottimizzato per gestire pesi del modello distribuiti normalmente senza degradare pesantemente le capacità predittive della rete.

Inoltre, QLoRA impiega una strategia nota come Double Quantization, una tecnica riconosciuta nella più ampia ricerca sul machine learning che quantizza le costanti di quantizzazione stesse, eliminando ulteriormente l'utilizzo di memoria non necessario. Mentre l'enorme modello base pre-addestrato rimane bloccato in uno stato compresso a 4 bit, minuscoli adattatori addestrabili vengono inseriti nei livelli della rete. Quando si verifica la backpropagation durante l'addestramento della rete neurale, i gradienti vengono passati attraverso i pesi congelati a 4 bit per aggiornare solo questi piccoli adattatori altamente efficienti.

Link to this sectionQLoRA vs. LoRA: Comprendere le differenze#

Quando esplori il parameter-efficient fine-tuning (PEFT), spesso ti chiederai in cosa differisce QLoRA dal tradizionale LoRA (Low-Rank Adaptation). LoRA standard blocca i pesi del modello originale e addestra matrici di basso rango per adattare il modello a nuovi dati. Tuttavia, solitamente mantiene il modello base in precisione a 16 o 32 bit. QLoRA fa un passo fondamentale in avanti comprimendo il modello base a una precisione di 4 bit prima di applicare gli adattatori LoRA. Ciò riduce drasticamente l'occupazione di memoria, consentendo a un modello da 65 miliardi di parametri di adattarsi a una singola GPU da 48 GB, un'impresa matematicamente impossibile con LoRA standard.

Link to this sectionApplicazioni nel mondo reale#

  • Chatbot e assistenti aziendali: Le aziende utilizzano regolarmente QLoRA per eseguire il fine-tuning di modelli open-source come Llama 3 di Meta su dati aziendali proprietari. Questo consente alle organizzazioni di creare assistenti AI altamente accurati e specifici per il dominio che operano su infrastrutture di cloud computing locali e sicure, senza costi hardware esorbitanti.
  • Implementazioni di Edge AI: Poiché i modelli basati su testo si espandono in domini visivi tramite vision-language models (VLMs), QLoRA consente agli sviluppatori di adattare enormi architetture multimodali per ambienti con hardware limitato. Queste ottimizzazioni leggere sono ampiamente utilizzate dai team di ricerca di Google AI per portare funzionalità di ragionamento avanzate su telefoni cellulari e sensori remoti.

Link to this sectionAddestramento efficiente nella visione artificiale#

La filosofia alla base di QLoRA — massimizzare l'accuratezza matematica riducendo al contempo le richieste hardware — è condivisa tra i moderni flussi di lavoro di computer vision (CV). Ad esempio, Ultralytics YOLO26 è progettato nativamente per apprendere in modo efficiente e distribuirsi istantaneamente su dispositivi edge a basso consumo. Gli sviluppatori che lavorano con set di dati di visione complessi possono sfruttare la Ultralytics Platform per un addestramento cloud senza interruzioni, che gestisce intrinsecamente l'ottimizzazione della memoria e la dimensione dei batch.

Di seguito è riportato un esempio pratico di come puoi addestrare un modello di visione efficiente utilizzando l'Automatic Mixed Precision (AMP), un concetto strettamente correlato agli obiettivi di risparmio di memoria di QLoRA:

from ultralytics import YOLO

# Load the highly efficient Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model utilizing mixed-precision (amp) to save GPU memory
# Similar to QLoRA, this optimizes hardware resources during training runs
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, amp=True)

Affidandosi a una gestione robusta dei dati e ad algoritmi di scalatura automatica del gradiente, i modelli si addestrano più velocemente e si adattano facilmente alle GPU standard, accelerando il percorso verso il successo nella distribuzione di modelli di computer vision negli ambienti di produzione aziendali.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning