Agentic RAG
Esplora l'Agentic RAG per migliorare l'IA con il ragionamento autonomo. Scopri come Ultralytics YOLO26 e la Ultralytics Platform alimentano il recupero intelligente e la visione.
La Agentic Retrieval-Augmented Generation (Agentic RAG) è un'architettura avanzata di intelligenza artificiale (IA) che potenzia i sistemi di recupero tradizionali integrando agenti IA autonomi. Mentre le pipeline RAG standard operano in una sequenza lineare di "recupero-e-generazione", la Agentic RAG abilita un Large Language Model (LLM) a fungere da orchestratore intelligente. Questo agente può analizzare autonomamente il prompt dell'utente, determinare se siano necessarie informazioni esterne, formulare query di ricerca multiple, valutare i dati recuperati e affinare iterativamente la sua ricerca fino a compilare una risposta completa e accurata. Sfruttando le funzionalità di function calling e tool use, questi sistemi instradano dinamicamente le query attraverso vari database, API e strumenti analitici, riducendo significativamente le allucinazioni negli LLM quando si affrontano problemi complessi e a più fasi.
Link to this sectionCome funzionano i sistemi Agentic RAG#
L'innovazione principale della Agentic RAG risiede nella sua capacità di eseguire cicli e ragionare. I principali framework di IA agentica strutturano questo processo in flussi di lavoro dinamici e autonomi:
- Pianificazione e routing delle query: l'agente scompone domande complesse in sotto-attività più piccole e gestibili, instradando ciascuna di esse allo strumento o al database vettoriale più appropriato.
- Recupero iterativo: a differenza del recupero statico, l'agente riesamina i documenti estratti. Se il contesto è insufficiente, riformula la sua strategia di ricerca ed esegue nuovamente la query.
- Integrazione di strumenti: l'agente può scrivere ed eseguire codice, eseguire calcoli matematici o attivare modelli di machine learning (ML) per sintetizzare nuovi dati al volo.
Link to this sectionAgentic RAG vs. RAG standard#
Per implementare pipeline generative robuste, è fondamentale distinguere la Agentic RAG dai suoi concetti fondamentali:
- Standard Retrieval-Augmented Generation (RAG): opera in un unico passaggio. Recupera documenti basandosi sulla similarità semantica e genera una risposta. Fatica con logiche complesse che richiedono la sintesi di fonti di dati disparate su più passaggi.
- Agentic RAG: introduce il processo decisionale e i cicli. L'agente valuta la qualità del recupero e può attivare ricerche successive o strumenti diversi prima di finalizzare la sua generazione.
- Multimodal RAG: si concentra sul recupero di diversi tipi di dati (immagini, testo, video). La Agentic RAG può controllare una pipeline Multimodal RAG, decidendo quando cercare in un database visivo rispetto a un documento di testo.
Link to this sectionApplicazioni nel mondo reale#
La Agentic RAG sta trasformando le industrie automatizzando ricerche approfondite e complessi compiti di risoluzione dei problemi che imitano il ragionamento analitico umano.
- Sintesi della conoscenza aziendale: in contesti aziendali, un agente potrebbe ricevere il comando di "riassumere le nostre prestazioni del Q3 e confrontarle con gli ultimi guadagni del nostro principale concorrente". L'agente interroga autonomamente database finanziari interni, esegue ricerche web in tempo reale sui documenti dei concorrenti, analizza i numeri utilizzando uno strumento di calcolo e redige un brief completo.
- Ispezione autonoma della qualità: nella produzione, un agente può essere incaricato di identificare la causa principale di un guasto durante l'assemblaggio. Può attivare un modello di computer vision (CV) per ispezionare un feed video live, interrogare i registri di manutenzione storici e sintetizzare un rapporto diagnostico basato su prove visive e testuali.
Link to this sectionIntegrazione della Vision AI nei flussi di lavoro agentici#
I modelli di visione fungono da potenti strumenti sensoriali per i sistemi Agentic RAG che interagiscono con il mondo fisico. Ad esempio, un agente può utilizzare Ultralytics YOLO26 per recuperare dinamicamente il contesto visivo da un flusso di immagini o video per rispondere alle query degli utenti. Gli sviluppatori possono gestire l'annotazione dei dati e l'addestramento di questi strumenti di visione personalizzati utilizzando la Ultralytics Platform.
Il seguente esempio in Python mostra come un agente IA potrebbe invocare programmaticamente YOLO26 per estrarre osservazioni strutturate da un'immagine, raccogliendo un contesto fattuale per il suo prossimo passaggio di ragionamento.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")Collegando modelli di visione altamente capaci a motori di ragionamento, la Agentic RAG colma il divario tra il recupero statico delle conoscenze e l'intelligenza spaziale dinamica del mondo reale spatial intelligence. Per uno sguardo più approfondito al panorama in evoluzione dei sistemi autonomi, lo Stanford AI Index Report fornisce un monitoraggio completo delle capacità agentiche.






