Glossaire

Modèles de raisonnement

Découvrez comment les modèles de raisonnement IA vont au-delà de la simple reconnaissance de formes pour aboutir à une déduction logique. Découvrez comment Ultralytics et la Ultralytics optimisent le raisonnement visuel.

Les modèles de raisonnement représentent une évolution significative dans le domaine de l'intelligence artificielle, allant au-delà de la simple correspondance de modèles pour effectuer des déductions logiques en plusieurs étapes, résoudre des problèmes et prendre des décisions. Contrairement aux architectures traditionnelles d'apprentissage profond qui s'appuient fortement sur les corrélations statistiques trouvées dans de vastes ensembles de données, les modèles de raisonnement sont conçus pour « réfléchir » à un problème. Ils utilisent souvent des techniques telles que la chaîne de pensée ou des blocs-notes internes pour décomposer les requêtes complexes en étapes intermédiaires avant de générer une réponse finale. Cette capacité leur permet d'aborder des tâches nécessitant des mathématiques, du codage et un raisonnement scientifique avec une précision bien supérieure à celle des grands modèles linguistiques (LLM) standard.

Mécanismes fondamentaux du raisonnement

Le passage au raisonnement implique d'entraîner les modèles à générer leur propre monologue interne ou trace de raisonnement. Les développements récents en 2024 et 2025, tels que la série OpenAI o1, ont démontré que l'allocation d'un temps de calcul plus important au « raisonnement en temps d'inférence » améliore considérablement les performances. En utilisant des stratégies d'apprentissage par renforcement, ces modèles apprennent à vérifier leurs propres étapes, à revenir en arrière lorsqu'ils detect et à affiner leur logique avant de présenter une solution. Cela contraste avec les anciens modèles qui se contentaient de prédire le token le plus probable suivant en fonction de la probabilité.

Applications concrètes

Les modèles de raisonnement trouvent leur place dans des flux de travail sophistiqués où la précision est primordiale.

Ingénierie logicielle complexe : au-delà de la simple complétion de code, les modèles de raisonnement peuvent concevoir des modules logiciels entiers. Ils peuvent comprendre les dépendances entre plusieurs fichiers, déboguer des erreurs logiques complexes et optimiser les algorithmes en simulant des chemins d'exécution. Cette capacité est cruciale pour les opérations d'apprentissage automatique (MLOps) où les pipelines automatisés doivent être robustes.
Découvertes scientifiques et recherche : dans des domaines tels que l' IA dans le secteur de la santé, ces modèles aident les chercheurs en analysant des données cliniques contradictoires afin de suggérer des diagnostics potentiels ou des interactions médicamenteuses. Par exemple, les progrèsGoogle en matière de raisonnement mathématique montrent comment l'IA peut résoudre de nouveaux problèmes géométriques, une compétence directement transposable aux simulations physiques et à la biologie structurale.

Distinguer les modèles de raisonnement des modèles d'apprentissage automatique standard (LLM)

Il est important de différencier les « modèles de raisonnement » de l'IA générative à usage général.

LLM standard (par exemple, GPT-4, Llama 3) : il s'agit principalement de modèles de base optimisés pour la fluidité, la créativité et la vitesse. Ils excellent dans la génération et la synthèse de texte, mais ont souvent du mal avec les tâches nécessitant une logique stricte, ce qui conduit à des hallucinations.
Modèles de raisonnement (par exemple, OpenAI o1, Google 1.5 Pro) : ils sont spécialisés ou optimisés pour privilégier la justesse logique plutôt que la vitesse. Ils utilisent intrinsèquement un processus de « réflexion lente » (réflexion du système 2) par rapport à la « réflexion rapide » (système 1) des modèles standard. Ils sont donc moins adaptés au chat en temps réel, mais supérieurs pour les tâches de modélisation prédictive nécessitant une grande fidélité.

Raisonnement visuel avec la vision par ordinateur

Si le raisonnement textuel est bien connu, le raisonnement visuel est un domaine en pleine expansion. Il consiste à interpréter des scènes visuelles complexes pour répondre à des questions « pourquoi » ou « comment », plutôt que simplement « quoi ». En combinant la détection d'objets à grande vitesse à partir de modèles tels que Ultralytics avec un moteur de raisonnement, les systèmes peuvent analyser les relations de cause à effet dans les flux vidéo.

Par exemple, dans les véhicules autonomes, un système doit non seulement detect piéton, mais aussi déduire que « le piéton regarde son téléphone et marche vers le bord du trottoir, et qu'il pourrait donc s'engager sur la chaussée ».

L'exemple suivant montre comment extraire des données structurées à l'aide de YOLO26, qui peuvent ensuite être intégrées dans un modèle de raisonnement afin de tirer des conclusions sur une scène.

from ultralytics import YOLO

# Load the YOLO26 model for high-accuracy detection
model = YOLO("yolo26n.pt")

# Run inference on an image containing multiple objects
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names and coordinates for logic processing
# A reasoning model could use this data to determine spatial relationships
detections = []
for r in results:
    for box in r.boxes:
        detections.append(
            {"class": model.names[int(box.cls)], "confidence": float(box.conf), "bbox": box.xywh.tolist()}
        )

print(f"Structured data for reasoning: {detections}")

L'avenir de l'IA raisonnante

La trajectoire de l'IA s'oriente vers l' intelligence artificielle générale (AGI), où les capacités de raisonnement seront centrales. Nous assistons à une convergence où l' apprentissage multimodal permet aux modèles de raisonner simultanément à partir de textes, de codes, d'enregistrements audio et de vidéos. Des plateformes telles que Ultralytics évoluent pour prendre en charge ces flux de travail complexes, permettant aux utilisateurs de gérer des ensembles de données qui alimentent à la fois la perception visuelle et l'entraînement au raisonnement logique.

Pour en savoir plus sur les fondements techniques, la lecture d' articles de recherche sur la chaîne de pensée permet de mieux comprendre comment les invites peuvent libérer des capacités de raisonnement latentes. De plus, la compréhension de l' IA neuro-symbolique aide à contextualiser la manière dont la logique et les réseaux neuronaux sont combinés pour créer des systèmes plus robustes.

Modèles de raisonnement

Former les modèlesYOLO d'Ultralytics pour rationaliser les flux de travail dans tous les secteurs d'activité

Solution de licence d'entreprise flexible pour dynamiser votre innovation

Former des modèles d'IA en quelques secondes avec Ultralytics YOLO

Mécanismes fondamentaux du raisonnement

Applications concrètes

Distinguer les modèles de raisonnement des modèles d'apprentissage automatique standard (LLM)

Raisonnement visuel avec la vision par ordinateur

L'avenir de l'IA raisonnante

En savoir plus dans cette catégorie

12 cas d'utilisation de l'imagerie aérienne grâce à la vision par ordinateur

Qu'est-ce que l'estimation monoculaire de la profondeur ? Aperçu général

Un aperçu de l'utilisationYOLO Ultralytics pour la détection des menaces par l'IA

Rejoindre la communauté Ultralytics