Découvrez les réseaux bayésiens et leur rôle dans le raisonnement probabiliste. Apprenez comment ces modèles graphiques améliorent l'IA explicable et s'associent à Ultralytics .
Un réseau bayésien est un type de modèle graphique probabiliste qui utilise un graphe acyclique dirigé (DAG) pour représenter un ensemble de variables et leurs dépendances conditionnelles. Contrairement aux algorithmes de type « boîte noire » qui se contentent de mettre en correspondance les entrées et les sorties, ces réseaux modélisent explicitement les relations de cause à effet entre différents facteurs. Cette structure permet aux scientifiques des données d'effectuer des modélisations prédictives et des raisonnements dans un contexte d' incertitude, ce qui les rend très efficaces dans les scénarios où les données peuvent être incomplètes ou où les connaissances d'experts dans un domaine doivent être combinées avec des preuves statistiques.
Au cœur de ces réseaux se trouve le théorème de Bayes, une formule mathématique utilisée pour mettre à jour les probabilités d'une hypothèse à mesure que de nouvelles preuves ou informations deviennent disponibles. Dans un réseau bayésien, les nœuds représentent des variables, telles qu'un symptôme, une lecture de capteur ou une étiquette de classification , tandis que les arêtes (flèches) représentent des dépendances probabilistes. Si un lien existe entre le nœud A et le nœud B, cela indique que A a une influence directe sur B. Cette architecture est cruciale pour l' IA explicable (XAI) car elle permet aux utilisateurs de suivre le cheminement du raisonnement du modèle, offrant une transparence souvent difficile à obtenir avec des architectures d'apprentissage profond complexes .
Ces modèles sont particulièrement pertinents dans les domaines nécessitant une évaluation rigoureuse des risques. En utilisant des distributions de probabilité conditionnelles, un réseau bayésien peut répondre à des questions sur l'état d'une variable spécifique à partir des preuves observées concernant d'autres variables. Ce processus, souvent appelé inférence probabiliste, se distingue de l'approximation de fonction effectuée par les réseaux neuronaux
Les réseaux bayésiens sont largement déployés dans les secteurs où la prise de décision nécessite de peser plusieurs facteurs incertains .
Il est important de distinguer les réseaux bayésiens des autres modèles statistiques et d'apprentissage automatique :
Alors que les réseaux bayésiens traitent des graphes causaux explicites, les modèles modernes d'apprentissage profond produisent également des scores de confiance probabilistes qui reflètent le degré de certitude. Lorsque l'on utilise des outils tels que la Ultralytics pour former des modèles sur des ensembles de données personnalisés, il est essentiel de comprendre ces probabilités pour interpréter les performances du modèle.
Python suivant montre comment accéder à la distribution de probabilité (confiance) pour une tâche de classification à l'aide d'un modèle pré-entraîné. Il illustre comment la certitude est quantifiée dans un workflow d'inférence moderne.
from ultralytics import YOLO
# Load the YOLO26n-cls classification model
model = YOLO("yolo26n-cls.pt")
# Run inference on an image source
# This returns a results object containing probability data
results = model("https://ultralytics.com/images/bus.jpg")
# Iterate through results to display class probability
for result in results:
# Access the 'probs' attribute for classification probabilities
top_class_index = result.probs.top1
confidence = result.probs.top1conf
print(f"Predicted Class Index: {top_class_index}, Confidence: {confidence:.4f}")