Glossaire

Recherche par arbre de Monte-Carlo (MCTS)

Découvrez comment l'algorithme de recherche dans l'arbre de Monte-Carlo (MCTS) est au cœur de la logique de l'IA. Apprenez à intégrer Ultralytics pour l'évaluation visuelle de l'état et la planification dans des systèmes complexes.

La recherche arborescente de Monte Carlo (MCTS) est un algorithme de recherche heuristique utilisé pour les processus décisionnels complexes, principalement dans le domaine de l'apprentissage automatique et de l'intelligence artificielle. Comme l'indique sa définition sur Wikipédia, le MCTS combine la précision des algorithmes de recherche arborescente avec la puissance de l'échantillonnage aléatoire (simulations de Monte Carlo) pour évaluer les mouvements les plus prometteurs dans un espace d'états donné. Initialement popularisé par son succès dans les jeux de société complexes, cet algorithme est désormais un élément fondamental des agents d'IA modernes et des systèmes de raisonnement avancés, y compris les modèles linguistiques de grande envergure (LLM) de pointe.

Comment fonctionne la recherche dans un arbre de Monte-Carlo

Le MCTS construit un arbre de recherche de manière incrémentielle en explorant les actions les plus prometteuses. Fonctionnant selon un processus de décision markovien, l'algorithme répète quatre phases successives jusqu'à ce que le budget de calcul ou la limite de temps soit atteint :

Sélection : en partant du nœud racine, l'algorithme parcourt l'arbre vers le bas en sélectionnant des nœuds enfants qui assurent un équilibre entre l'exploration (essayer de nouveaux chemins) et l'exploitation (privilégier les chemins ayant généré des récompenses élevées par le passé). La formule de la limite supérieure de confiance appliquée aux arbres (UCT) est une méthode standard utilisée pour gérer ce compromis.
Extension : à moins que le nœud sélectionné ne mette fin à la simulation, un ou plusieurs nœuds enfants sont ajoutés afin d'étendre l'arbre de recherche vers des états inexplorés.
Simulation (déploiement) : une simulation rapide, souvent aléatoire, est effectuée à partir du nœud nouvellement développé jusqu’à la fin du scénario afin de prédire le résultat.
Rétropropagation : le résultat de la simulation est répercuté en amont dans l'arbre, ce qui met à jour les statistiques de réussite et les valeurs de tous les nœuds parcourus afin d'orienter les sélections futures.

Applications de l'IA dans le monde réel

Une étude approfondie des méthodes de recherche arborescente de Monte Carlo met en évidence leur polyvalence pour résoudre des problèmes impliquant des espaces de recherche gigantesques et impossibles à traiter par des méthodes classiques.

Jeux : la méthode MCTS a acquis une renommée mondiale lorsque Google l'a utilisée pour développer AlphaGo, créant ainsi la première IA à battre un champion du monde humain au jeu de go. En associant la méthode MCTS à des réseaux neuronaux, le système a pu évaluer efficacement des états du plateau trop complexes pour être traités par une recherche par force brute classique.
Raisonnement des grands modèles de langage (LLM) et IA agentique : en 2024 et 2025, les chercheurs ont de plus en plus intégré les algorithmes MCTS aux grands modèles de langage afin d’améliorer les capacités de réflexion et de logique du « Système 2 ». Par exemple, des recherches récentes sur la conception heuristique automatisée démontrent comment les algorithmes MCTS aident les LLM à gérer des optimisations complexes. De même, la combinaison des MCTS et des LLM améliore considérablement les performances en matière de réponse à des questions basées sur une base de connaissances et de raisonnement mathématique en évaluant plusieurs chemins logiques potentiels avant de s’engager sur une réponse. Des organisations telles qu’OpenAI exploitent des mécanismes d’inférence basés sur la recherche dans leurs modèles avancés, comme l’o1 d’OpenAI, afin d’améliorer considérablement la précision de la résolution de problèmes.
Robotique et planification autonome : la méthode MCTS est utilisée dans l'optimisation logistique et des itinéraires, les véhicules autonomes et la segmentation des actions robotiques pour simuler des états futurs et évoluer en toute sécurité dans des environnements physiques complexes.

MCTS et concepts connexes

Pour bien comprendre les MCTS, il est utile de les distinguer des techniques d'IA apparentées :

Apprentissage par renforcement (RL): Alors que l'apprentissage par renforcement (RL) entraîne les modèles au fil du temps pour qu'ils apprennent une stratégie globale, le MCTS est généralement un algorithme de planification utilisé lors de l'inférence en temps réel pour déterminer la meilleure action immédiate à partir d'un état donné. Cependant, ces deux approches sont souvent combinées ; les modèles d'apprentissage par renforcement peuvent fournir la valeur heuristique pour les nœuds du MCTS.
Tree of Thoughts (ToT): ToT est un cadre de génération de prompts spécialement conçu pour les modèles de langage de grande capacité (LLM). Il s'inspire largement de l'algorithme MCTS, en structurant la génération de langage sous la forme d'un arbre où chaque nœud représente une « pensée ». L'algorithme MCTS constitue le fondement algorithmique plus général sur lequel s'appuient ToT et les cadres similaires.

Intégration de l'IA visuelle dans les MCTS

Dans le domaine de l'IA incarnée ou des systèmes autonomes, la perception visuelle sert souvent d'évaluateur d'état pour un nœud MCTS. En s'appuyant sur Ultralytics , un agent peut rapidement analyser un environnement afin de calculer un score heuristique pendant la phase de simulation.

Voici un exemple conceptuel illustrant comment utiliser unYOLO Ultralytics pour calculer une récompense de nœud simple lors d'un déploiement MCTS.

from ultralytics import YOLO

# Load an Ultralytics YOLO26 model for state evaluation
model = YOLO("yolo26n.pt")


def evaluate_mcts_state(image_state):
    # Run inference to evaluate the visual environment
    results = model(image_state, verbose=False)

    # Example heuristic: Reward the MCTS path if an 'obstacle' is successfully avoided
    # Assume class 0 is 'obstacle'. Reward is 1 if path is clear, 0 if blocked.
    obstacle_detected = any(box.cls == 0 for box in results[0].boxes)
    return 0 if obstacle_detected else 1


# Simulate a rollout step
reward = evaluate_mcts_state("path_simulation_view.jpg")
print(f"MCTS Rollout Reward: {reward}")

Pour les développeurs qui souhaitent déployer à grande échelle de tels agents intelligents, la Ultralytics propose des outils performants pour l'entraînement et le déploiement des modèles de vision sous-jacents. Cela facilite considérablement l'intégration d'une perception rapide et fiable dans des architectures de recherche complexes construites à l'aide de bibliothèques mathématiques standard ou de frameworks d'apprentissage automatique tels que PyTorch et TensorFlow.

Recherche par arbre de Monte-Carlo (MCTS)

Exportation vers plus de 17 formats. Déploiement dans 43 régions du monde.

Entraînez YOLO26 sur des GPU H100 pour 2,39 $/heure.

Des licences d'entreprise flexibles pour donner vie à vos projets d'IA visuelle.

Des licences d'entreprise conçues pour dynamiser votre prochain projet

Étiquetez jusqu'à 10 fois plus vite grâce à l'annotation intelligente

Annoter. Entraîner. Déployer. Le tout sur une seule et même plateforme.

Comment fonctionne la recherche dans un arbre de Monte-Carlo

Applications de l'IA dans le monde réel

MCTS et concepts connexes

Intégration de l'IA visuelle dans les MCTS

En savoir plus dans cette catégorie

Ultralytics l'AMD Dev Day de Shanghai : quand l'IA locale rencontre les systèmes agentiques

Les temps forts de la présence Ultralytics l'Embedded Vision Summit 2026

Ultralytics YOLO à DEEPX : inférence IA en périphérie pour l'IA physique

Construisons ensemble l'avenir de l'IA !

Recherche par arbre de Monte-Carlo (MCTS)

Exportation vers plus de 17 formats. Déploiement dans 43 régions du monde.

Entraînez YOLO26 sur des GPU H100 pour 2,39 $/heure.

Des licences d'entreprise flexibles pour donner vie à vos projets d'IA visuelle.

Des licences d'entreprise conçues pour dynamiser votre prochain projet

Étiquetez jusqu'à 10 fois plus vite grâce à l'annotation intelligente

Annoter. Entraîner. Déployer. Le tout sur une seule et même plateforme.

Comment fonctionne la recherche dans un arbre de Monte-Carlo

Applications de l'IA dans le monde réel

MCTS et concepts connexes

Intégration de l'IA visuelle dans les MCTS

En savoir plus dans cette catégorie

Ultralytics l'AMD Dev Day de Shanghai : quand l'IA locale rencontre les systèmes agentiques

Les temps forts de la présence Ultralytics l'Embedded Vision Summit 2026

Ultralytics YOLO à DEEPX : inférence IA en périphérie pour l'IA physique

Construisons ensemble l'avenir de l'IA !

Annoter. Entraîner. Déployer. Le tout sur une seule et même plateforme.