Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

RAG agentico

Esplora Agentic RAG per potenziare l'intelligenza artificiale con il ragionamento autonomo. Scopri come Ultralytics e la Ultralytics potenziano il recupero e la visione intelligenti.

Agentic Retrieval-Augmented Generation (Agentic RAG) è un'architettura avanzata di intelligenza artificiale (AI) che migliora i sistemi di recupero tradizionali integrando agenti AI autonomi . Mentre le pipeline RAG standard operano in una sequenza lineare di "recupero e generazione", Agentic RAG consente a un Large Language Model (LLM) di agire come un orchestratore intelligente. Questo agente è in grado di analizzare in modo indipendente il prompt di un utente, determinare se sono necessarie informazioni esterne , formulare più query di ricerca, valutare i dati recuperati e perfezionare iterativamente la sua ricerca fino a compilare una risposta completa e accurata. Sfruttando le funzionalità di chiamata delle funzioni e di utilizzo degli strumenti, questi sistemi instradano dinamicamente le query attraverso vari database, API e strumenti analitici, riducendo significativamente le allucinazioni negli LLM quando si tratta di problemi complessi e in più fasi.

Come funzionano i sistemi RAG agentici

L'innovazione principale di Agentic RAG risiede nella sua capacità di ripetere e ragionare. I principali framework di IA agentica strutturano questo processo in flussi di lavoro dinamici e autonomi:

RAG agentico vs. RAG standard

Per implementare pipeline generative robuste, è fondamentale differenziare l'Agentic RAG dai suoi concetti fondamentali:

  • Generazione standard con recupero potenziato (RAG): Funziona in un unico passaggio. Recupera i documenti in base alla somiglianza semantica e genera una risposta. Ha difficoltà con la logica complessa che richiede la sintesi di fonti di dati disparate in più passaggi.
  • RAG agentico: introduce il processo decisionale e i loop. L'agente valuta la qualità del recupero e può attivare ricerche successive o strumenti diversi prima di finalizzare la sua generazione.
  • RAG multimodale: si concentra sul recupero di diversi tipi di dati (immagini, testo, video). Il RAG agentico può controllare una pipeline RAG multimodale , decidendo quando cercare in un database visivo piuttosto che in un documento di testo.

Applicazioni nel mondo reale

Agentic RAG sta trasformando i settori industriali automatizzando attività di ricerca approfondita e risoluzione di problemi complessi che imitano il ragionamento analitico umano.

  • Sintesi delle conoscenze aziendali: In un ambiente aziendale, un agente potrebbe ricevere il comando di "riassumere la nostra performance nel terzo trimestre e confrontarla con gli ultimi guadagni del nostro principale concorrente". L'agente interroga autonomamente i database finanziari interni, effettua ricerche in tempo reale sul web per trovare i documenti depositati dai concorrenti, analizza i numeri utilizzando uno strumento di calcolo e redige una relazione completa.
  • Ispezione autonoma della qualità: nella produzione, un agente può essere incaricato di identificare la causa principale di un guasto di assemblaggio. Può attivare un modello di visione artificiale (CV) per ispezionare un feed live della telecamera, interrogare i registri di manutenzione storici e sintetizzare un rapporto diagnostico basato su prove visive e testuali .

Integrazione dell'intelligenza artificiale visiva nei flussi di lavoro agentici

I modelli di visione fungono da potenti strumenti sensoriali per i sistemi RAG agentici che interagiscono con il mondo fisico. Ad esempio, un agente può utilizzare Ultralytics per recuperare dinamicamente il contesto visivo da un'immagine o da un flusso video per rispondere alle richieste degli utenti. Gli sviluppatori possono gestire l'annotazione dei dati e l'addestramento di questi strumenti di visione personalizzati utilizzando Ultralytics .

Il seguente Python mostra come un agente AI potrebbe richiamare programmaticamente YOLO26 per estrarre osservazioni strutturate da un'immagine, raccogliendo il contesto fattuale per il suo prossimo passo di ragionamento.

from ultralytics import YOLO

# Initialize YOLO26 for the agent's visual retrieval tool
model = YOLO("yolo26n.pt")

# The agent invokes the model on an image to gather visual facts
results = model("https://ultralytics.com/images/bus.jpg")

# The agent parses the detected objects to formulate its next query or action
visual_context = [model.names[int(c)] for c in results[0].boxes.cls]
print(f"Agent Observation: I currently see {', '.join(visual_context)}.")

Collegando modelli di visione altamente performanti a motori di ragionamento, Agentic RAG colma il divario tra il recupero statico delle conoscenze e l'intelligenza spaziale dinamica e reale . Per uno sguardo più approfondito sul panorama in evoluzione dei sistemi autonomi, lo Stanford AI Index Report fornisce un monitoraggio completo delle capacità agentiche .

Potenziamento con Ultralytics YOLO

Ottieni una visione AI avanzata per i tuoi progetti. Trova oggi stesso la licenza giusta per i tuoi obiettivi.

Esplora le opzioni di licenza