Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Retrieval Augmented Generation (RAG)

Esplora come la Retrieval Augmented Generation (RAG) ottimizza gli LLM con dati in tempo reale. Impara a costruire pipeline multimodali usando Ultralytics YOLO26 per la RAG visiva.

La Retrieval Augmented Generation (RAG) è una tecnica avanzata nel campo dell'intelligenza artificiale che ottimizza l'output di un Large Language Model (LLM) facendo riferimento a una base di conoscenza autorevole esterna ai suoi dati di addestramento. I modelli generativi tradizionali si basano esclusivamente su informazioni statiche apprese durante l'addestramento iniziale, il che può portare a risposte obsolete o a inesattezze presentate con sicurezza, note come hallucinations. La RAG colma questa lacuna recuperando informazioni pertinenti e aggiornate da fonti esterne—come database aziendali, notizie correnti o manuali tecnici—e fornendole al modello come contesto prima che venga generata una risposta. Questo processo garantisce che gli output dell'IA non siano solo linguisticamente coerenti, ma anche fattualmente accurati e basati su dati specifici.

Link to this sectionCome funzionano i sistemi RAG#

L'architettura di un sistema RAG coinvolge solitamente due fasi principali: recupero e generazione. Questo flusso di lavoro consente agli sviluppatori di mantenere un foundation model senza la costosa necessità di un frequente riaddestramento.

  1. Recupero: Quando un utente invia una query, il sistema esegue innanzitutto una semantic search all'interno di un sistema di archiviazione specializzato chiamato vector database. Questo database contiene dati convertiti in rappresentazioni numeriche note come embeddings, permettendo al sistema di trovare informazioni concettualmente simili piuttosto che limitarsi alla corrispondenza di parole chiave.

  2. Generazione: I documenti o gli snippet di dati pertinenti trovati durante il recupero vengono combinati con la domanda originale dell'utente. Questo prompt arricchito viene quindi inviato al modello generativo. Il modello utilizza questo contesto fornito per sintetizzare una risposta, assicurando che essa si basi sui fatti recuperati. Per un approfondimento sui meccanismi, IBM fornisce una guida completa sui flussi di lavoro RAG.

Link to this sectionVisual RAG: integrazione della Computer Vision#

Sebbene la RAG sia tradizionalmente basata sul testo, l'ascesa del multi-modal learning ha introdotto la "Visual RAG". In questo scenario, i modelli di computer vision fungono da meccanismo di recupero. Essi analizzano immagini o flussi video per estrarre dati testuali strutturati—come nomi di oggetti, conteggi o attività—che vengono poi forniti a un LLM per rispondere a domande sulla scena visiva.

Ad esempio, uno sviluppatore può utilizzare YOLO26 per rilevare oggetti in un'immagine e passare tale elenco di oggetti a un modello testuale per generare un report descrittivo.

from ultralytics import YOLO

# Load the YOLO26 model for state-of-the-art detection
model = YOLO("yolo26n.pt")

# Perform inference to 'retrieve' visual facts from an image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names to build a text context for an LLM
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
context_string = f"The scene contains: {', '.join(detected_classes)}."

print(context_string)
# Output example: "The scene contains: bus, person, person, person."

Link to this sectionApplicazioni nel mondo reale#

La RAG sta trasformando i settori consentendo agli AI agents di accedere in modo sicuro a dati proprietari o in tempo reale.

  • Enterprise Knowledge Bases: Le aziende utilizzano la RAG per creare chatbot interni che rispondano alle domande dei dipendenti su policy HR o documentazione tecnica. Collegando un LLM a un repository di documenti live, il sistema evita di fornire informazioni obsolete sulle policy. Per ulteriori informazioni sulle implementazioni aziendali, consulta la panoramica di Google Cloud sulla RAG in Vertex AI.
  • Supporto alle decisioni cliniche: Nell'AI in healthcare, i sistemi RAG possono recuperare la storia del paziente e recenti articoli di ricerca medica per assistere i medici nella diagnosi, garantendo che il consiglio tenga conto degli studi clinici più recenti.
  • Smart Retail Assistants: Le applicazioni che utilizzano l'AI in retail sfruttano la RAG per controllare i database dell'inventario live. Se un cliente chiede a un chatbot: "Avete queste scarpe da corsa nella taglia 10?", il modello recupera i livelli di stock in tempo reale prima di rispondere, prevenendo la frustrazione dovuta a articoli non disponibili.

Link to this sectionRAG vs. Fine-Tuning#

È fondamentale distinguere la RAG dal fine-tuning, poiché risolvono problemi diversi.

  • RAG (Retrieval Augmented Generation): Ideale per accedere a dati dinamici e che cambiano frequentemente (es. prezzi delle azioni, notizie) o dati privati non presenti nel set di addestramento pubblico. Si concentra sulla fornitura di nuove informazioni al momento dell'esecuzione.
  • Fine-Tuning: Ideale per adattare il comportamento, lo stile o la terminologia del modello. Implica l'aggiornamento dei model weights su un dataset specifico. Sebbene il fine-tuning aiuti un modello a imparare un pattern linguistico specifico (come il gergo medico), non garantisce l'accesso a fatti in tempo reale. Consulta la guida di OpenAI sul confronto tra fine-tuning e RAG per i framework decisionali.

Link to this sectionConcetti correlati#

  • LangChain: Un popolare framework open-source progettato specificamente per semplificare la creazione di applicazioni RAG collegando insieme retriever e LLM.
  • Knowledge Graph: Un modo strutturato di rappresentare i dati che può essere utilizzato come fonte di recupero, offrendo relazioni contestualmente più ricche rispetto alla semplice somiglianza vettoriale.
  • Prompt Engineering: L'arte di creare input per guidare il modello. La RAG è essenzialmente una forma automatizzata di prompt engineering in cui il "prompt" viene arricchito con dati recuperati a livello programmatico.
  • Ultralytics Platform: Mentre la RAG gestisce il lato della generazione del testo, piattaforme come questa sono essenziali per gestire la data preprocessing e l'addestramento dei modelli di visione che alimentano i dati visivi nelle pipeline RAG multimodali.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning