Esplora Agentic RAG per potenziare l'intelligenza artificiale con il ragionamento autonomo. Scopri come Ultralytics e la Ultralytics potenziano il recupero e la visione intelligenti.
Agentic Retrieval-Augmented Generation (Agentic RAG) è un'architettura avanzata di intelligenza artificiale (AI) che migliora i sistemi di recupero tradizionali integrando agenti AI autonomi . Mentre le pipeline RAG standard operano in una sequenza lineare di "recupero e generazione", Agentic RAG consente a un Large Language Model (LLM) di agire come un orchestratore intelligente. Questo agente è in grado di analizzare in modo indipendente il prompt di un utente, determinare se sono necessarie informazioni esterne , formulare più query di ricerca, valutare i dati recuperati e perfezionare iterativamente la sua ricerca fino a compilare una risposta completa e accurata. Sfruttando le funzionalità di chiamata delle funzioni e di utilizzo degli strumenti, questi sistemi instradano dinamicamente le query attraverso vari database, API e strumenti analitici, riducendo significativamente le allucinazioni negli LLM quando si tratta di problemi complessi e in più fasi.
L'innovazione principale di Agentic RAG risiede nella sua capacità di ripetere e ragionare. I principali framework di IA agentica strutturano questo processo in flussi di lavoro dinamici e autonomi:
Per implementare pipeline generative robuste, è fondamentale differenziare l'Agentic RAG dai suoi concetti fondamentali:
Agentic RAG sta trasformando i settori industriali automatizzando attività di ricerca approfondita e risoluzione di problemi complessi che imitano il ragionamento analitico umano.
I modelli di visione fungono da potenti strumenti sensoriali per i sistemi RAG agentici che interagiscono con il mondo fisico. Ad esempio, un agente può utilizzare Ultralytics per recuperare dinamicamente il contesto visivo da un'immagine o da un flusso video per rispondere alle richieste degli utenti. Gli sviluppatori possono gestire l'annotazione dei dati e l'addestramento di questi strumenti di visione personalizzati utilizzando Ultralytics .
Il seguente Python mostra come un agente AI potrebbe richiamare programmaticamente YOLO26 per estrarre osservazioni strutturate da un'immagine, raccogliendo il contesto fattuale per il suo prossimo passo di ragionamento.
from ultralytics import YOLO
# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")
# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")
# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")
Collegando modelli di visione altamente performanti a motori di ragionamento, Agentic RAG colma il divario tra il recupero statico delle conoscenze e l'intelligenza spaziale dinamica e reale . Per uno sguardo più approfondito sul panorama in evoluzione dei sistemi autonomi, lo Stanford AI Index Report fornisce un monitoraggio completo delle capacità agentiche .