Chain of Verification (CoVe)
Scopri come la Chain of Verification (CoVe) riduce le allucinazioni dei LLM. Impara a migliorare l'accuratezza fattuale usando questa tecnica di prompt engineering con Ultralytics YOLO26.
Chain of Verification (CoVe) è una tecnica avanzata di prompt engineering progettata per ridurre le imprecisioni e gli errori fattuali negli output dei Large Language Models (LLMs). Poiché i sistemi di intelligenza artificiale diventano sempre più complessi, la loro tendenza a generare informazioni false con sicurezza—un fenomeno noto come LLM hallucination—rimane una sfida significativa. CoVe affronta questo problema costringendo il modello a verificare sistematicamente le proprie risposte iniziali prima di presentare una risposta finale all'utente. Questo meccanismo di autocorrezione migliora significativamente l'affidabilità delle applicazioni di generative AI in diversi settori.
Link to this sectionCome funziona il processo di verifica#
La metodologia CoVe suddivide il processo di generazione in quattro passaggi distinti e sequenziali. Questo approccio strutturato rispecchia i flussi di lavoro di verifica dei fatti umani ed è attivamente studiato dalle principali organizzazioni di IA per migliorare la AI safety e l'allineamento.
- Bozza di una risposta iniziale: Il modello genera una risposta di base alla query dell'utente. Questa bozza potrebbe contenere affermazioni non verificate o allucinate.
- Pianifica le domande di verifica: Il modello analizza la propria bozza e genera un elenco di domande specifiche e mirate progettate per verificare le affermazioni fattuali presenti nel testo iniziale.
- Esegui verifiche indipendenti: Il modello risponde alle domande di verifica in modo indipendente, senza fare affidamento sul contesto della bozza originale. Ciò impedisce al modello di confermare semplicemente i propri pregiudizi o errori precedenti.
- Genera l'output finale verificato: Utilizzando i fatti appena verificati, il modello revisiona la bozza iniziale, eliminando le imprecisioni e presentando una risposta raffinata e veritiera.
Link to this sectionDifferenziare CoVe dalle tecniche correlate#
Sebbene CoVe venga spesso paragonato al Chain-of-Thought Prompting, i due servono a scopi diversi. Il Chain-of-Thought incoraggia un modello a "mostrare il proprio lavoro" scomponendo il ragionamento logico complesso in componenti passo-passo per risolvere un problema. Al contrario, la Chain of Verification mira specificamente all'accuratezza fattuale controllando e revisionando le affermazioni dopo che una bozza è stata prodotta. Inoltre, CoVe può essere abbinato a pipeline di Retrieval-Augmented Generation (RAG), dove il passaggio di verifica estrae dati basati sulla realtà da un vector database esterno, invece di fare affidamento esclusivamente sui pesi interni del modello.
Link to this sectionApplicazioni nel mondo reale#
CoVe è estremamente utile in ambiti in cui l'accuratezza fattuale è fondamentale. Integrando questo ciclo di autocontrollo, gli sviluppatori possono affidare ai sistemi di artificial intelligence compiti ad alto rischio.
- Assistenti medici e sanitari: Quando un'IA riassume i sintomi di un paziente o la letteratura medica, CoVe assicura che il sistema verifichi le interazioni farmacologiche, i dosaggi e i criteri diagnostici rispetto alle conoscenze mediche stabilite prima di fornire raccomandazioni.
- Reporting industriale automatizzato: Nelle fabbriche intelligenti, un LLM potrebbe generare un rapporto di sintesi basato sui registri di ispezione visiva. Combinando CoVe con modelli di computer vision, il modello linguistico può interrogare il sistema di visione per verificare se un difetto specifico sia stato effettivamente rilevato sulla linea di assemblaggio prima di finalizzare il rapporto di manutenzione giornaliero.
Link to this sectionFondare la verifica con modelli di visione#
Per migliorare il passaggio "Esegui" di CoVe, gli sviluppatori possono interrogare modelli di machine learning autorevoli per ottenere dati di verità fondamentali. Ad esempio, utilizzando Ultralytics YOLO26 per l'object detection, un LLM può verificare affermazioni fisiche riguardanti un'immagine. I team possono gestire in modo efficiente questi dataset e distribuire questi modelli di visione utilizzando l'intuitiva Ultralytics Platform.
Il seguente esempio in Python dimostra come utilizzare il pacchetto ultralytics per estrarre un elenco verificato di oggetti, che può fungere da fonte di base fattuale per un LLM che esegue un passaggio di Chain of Verification.
from ultralytics import YOLO
# Load the YOLO26n model to act as a factual verification source
model = YOLO("yolo26n.pt")
# Run inference on an image to get ground-truth detections
results = model("https://ultralytics.com/images/bus.jpg")
# Extract the class names of actually detected objects for CoVe grounding
detected_objects = [model.names[int(c)] for c in results[0].boxes.cls]
# Pass this factual list to the LLM during its verification execution step
print(f"CoVe Ground Truth Facts: {detected_objects}")
# Output example: ['bus', 'person', 'person', 'person', 'person']Integrando output deterministici provenienti da framework di visione ad alte prestazioni come PyTorch nella pipeline CoVe, gli sviluppatori possono ridurre drasticamente gli errori generativi e costruire applicazioni di multimodal AI robuste e affidabili.






