Chain of Verification (CoVe)
Découvre comment la chaîne de vérification (CoVe) réduit les hallucinations des LLM. Apprends à améliorer la précision factuelle en utilisant cette technique d'ingénierie de prompt avec Ultralytics YOLO26.
La Chaîne de vérification (CoVe) est une technique avancée de prompt engineering conçue pour réduire les inexactitudes et les erreurs factuelles dans les sorties des Large Language Models (LLMs). À mesure que les systèmes d'intelligence artificielle deviennent plus complexes, leur tendance à générer avec assurance de fausses informations — un phénomène connu sous le nom de LLM hallucination — demeure un défi important. La CoVe y remédie en obligeant le modèle à vérifier systématiquement ses propres réponses initiales avant de présenter une réponse finale à l'utilisateur. Ce mécanisme d'auto-correction améliore considérablement la fiabilité des applications d'generative AI dans divers secteurs.
Link to this sectionComment fonctionne le processus de vérification#
La méthodologie CoVe décompose le processus de génération en quatre étapes distinctes et séquentielles. Cette approche structurée reflète les flux de travail de vérification des faits humains et fait l'objet de recherches actives par les principales organisations d'IA pour améliorer la AI safety et l'alignement.
- Rédiger une réponse initiale : Le modèle génère une réponse de référence à la requête de l'utilisateur. Ce brouillon peut contenir des affirmations non vérifiées ou hallucinées.
- Planifier des questions de vérification : Le modèle analyse son propre brouillon et génère une liste de questions spécifiques et ciblées conçues pour vérifier les affirmations factuelles faites dans le texte initial.
- Exécuter des vérifications indépendantes : Le modèle répond aux questions de vérification indépendamment, sans s'appuyer sur le contexte du brouillon original. Cela empêche le modèle de simplement confirmer ses propres biais ou erreurs précédentes.
- Générer la sortie finale vérifiée : En utilisant les faits nouvellement vérifiés, le modèle révise le brouillon initial, en supprimant les inexactitudes et en présentant une réponse affinée et véridique.
Link to this sectionDifférencier la CoVe des techniques connexes#
Bien que la CoVe soit souvent comparée au Chain-of-Thought Prompting, les deux servent des objectifs différents. Le Chain-of-Thought encourage un modèle à "montrer son raisonnement" en décomposant des raisonnements logiques complexes en composants étape par étape pour résoudre un problème. En revanche, la Chaîne de vérification cible spécifiquement l'exactitude factuelle en auditant et en révisant les affirmations après la production d'un brouillon. De plus, la CoVe peut être associée à des pipelines de Retrieval-Augmented Generation (RAG), où l'étape de vérification extrait des données de vérité terrain à partir d'une vector database externe au lieu de se baser uniquement sur les poids internes du modèle.
Link to this sectionApplications concrètes#
La CoVe est extrêmement bénéfique dans les domaines où l'exactitude factuelle est critique. En intégrant cette boucle d'auto-vérification, tu peux confier aux systèmes d'artificial intelligence des tâches à plus haut risque.
- Assistants médicaux et de santé : Lorsqu'une IA résume les symptômes d'un patient ou de la littérature médicale, la CoVe garantit que le système vérifie les interactions médicamenteuses, les dosages et les critères diagnostiques par rapport aux connaissances médicales établies avant de fournir des recommandations.
- Rapports industriels automatisés : Dans les usines intelligentes, un LLM pourrait générer un rapport de synthèse basé sur des journaux d'inspection visuelle. En combinant la CoVe avec des modèles de computer vision, le modèle de langage peut interroger le système de vision pour vérifier si un défaut spécifique a réellement été détecté sur la ligne de montage avant de finaliser le rapport de maintenance quotidien.
Link to this sectionAncrer la vérification avec des modèles de vision#
Pour améliorer l'étape "Exécuter" de la CoVe, tu peux interroger des modèles de machine learning faisant autorité pour obtenir des données de vérité terrain. Par exemple, en utilisant Ultralytics YOLO26 pour la object detection, un LLM peut vérifier des affirmations physiques concernant une image. Ton équipe peut gérer efficacement ces jeux de données et déployer ces modèles de vision en utilisant l'Ultralytics Platform intuitive.
L'exemple Python suivant démontre comment utiliser le package ultralytics pour extraire une liste vérifiée d'objets, qui peut servir de source de base factuelle pour un LLM exécutant une étape de Chaîne de vérification.
from ultralytics import YOLO
# Load the YOLO26n model to act as a factual verification source
model = YOLO("yolo26n.pt")
# Run inference on an image to get ground-truth detections
results = model("https://ultralytics.com/images/bus.jpg")
# Extract the class names of actually detected objects for CoVe grounding
detected_objects = [model.names[int(c)] for c in results[0].boxes.cls]
# Pass this factual list to the LLM during its verification execution step
print(f"CoVe Ground Truth Facts: {detected_objects}")
# Output example: ['bus', 'person', 'person', 'person', 'person']En intégrant des sorties déterministes issues de frameworks de vision haute performance comme PyTorch dans le pipeline CoVe, tu peux réduire considérablement les erreurs génératives et construire des applications multimodal AI robustes et dignes de confiance.






