Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Agent d'IA

Explorez l'univers des agents IA. Découvrez comment ces systèmes autonomes utilisent Ultralytics pour percevoir, raisonner et agir en temps réel afin de résoudre des tâches complexes.

Un agent IA est un système autonome capable de percevoir son environnement, de raisonner à l'aide d'une logique complexe pour prendre des décisions et d'entreprendre des actions spécifiques afin d'atteindre des objectifs définis. Contrairement à un modèle d'apprentissage automatique statique, qui traite passivement les données d'entrée pour produire une sortie, un agent fonctionne de manière dynamique dans un flux de travail continu. Ces systèmes constituent la couche « active » de l' intelligence artificielle, comblant le fossé entre les prédictions numériques et l'exécution dans le monde réel. En utilisant la mémoire et l'apprentissage adaptatif, les agents peuvent gérer des tâches allant de l'automatisation logicielle à la navigation physique sans intervention humaine constante.

La boucle perception-raisonnement-action

La fonctionnalité d'un agent IA repose sur un processus cyclique souvent décrit comme la boucle perception-action. Cette architecture permet à l'agent d'interagir de manière significative avec son environnement.

  1. Perception (détection) : l'agent recueille des informations sur le monde qui l'entoure. Dans les applications de vision par ordinateur, l'agent utilise des caméras comme « yeux ». Il utilise des modèles à grande vitesse tels que YOLO26 pour effectuer la détection ou la segmentation d'objets, en convertissant les pixels bruts en données structurées.
  2. Raisonnement (réflexion) : l'agent traite les données perçues en fonction de ses objectifs. Cette étape intègre souvent des modèles linguistiques à grande échelle (LLM) pour la compréhension sémantique ou des algorithmes d'apprentissage par renforcement afin d' optimiser les stratégies de prise de décision. Les agents avancés peuvent planifier plusieurs étapes à l'avance, tout comme un joueur d'échecs qui anticipe les coups futurs.
  3. Action (exécution) : sur la base de son raisonnement, l'agent exécute une tâche. Il peut s'agir d'une action numérique , telle que l'interrogation d'une base de données ou l'envoi d'une alerte, ou d'une action physique en robotique, telle qu'un bras robotisé prélevant un article spécifique sur un tapis roulant.

Agent IA vs modèle IA

Il est important de faire la distinction entre un agent et un modèle, car ils jouent des rôles différents dans la pile technologique.

  • Modèle d'IA : un modèle est un moteur mathématique, tel qu'un réseau neuronal, entraîné à reconnaître des modèles. Il s'agit d'un outil qui fournit des prédictions (par exemple, « ceci est une voiture ») mais n'agit pas intrinsèquement sur celles-ci.
  • Agent IA : un agent est le système global qui utilise des modèles comme outils. Il possède une capacité d'action, c'est-à-dire la capacité d'initier le changement. Par exemple, alors qu'un modèle identifie un feu rouge, l'agent décide d' actionner les freins.

Applications concrètes

Les agents IA transforment les industries en automatisant les flux de travail qui nécessitent une flexibilité cognitive.

  • Fabrication intelligente : dans le domaine de l' automatisation industrielle, des agents visuels surveillent les chaînes de production. Si un défaut est identifié par un système de contrôle qualité, l'agent peut arrêter les machines de manière autonome et enregistrer l'incident, évitant ainsi le gaspillage.
  • Logistique autonome : les entrepôts utilisent des robots agents pour la gestion des stocks. Ces agents naviguent dans des environnements dynamiques à l'aide de la technologie SLAM (localisation et cartographie simultanées) et de modèles de vision pour localiser, prélever et transporter efficacement les colis.

Construction d'un agent de vision simple

Les développeurs peuvent créer des agents de base en combinant des modèles de perception avec une logique conditionnelle. Python suivant illustre un « agent de sécurité » simple utilisant le ultralytics paquet. L'agent détecte une personne et décide de déclencher ou non une alerte en fonction du niveau de confiance du modèle.

from ultralytics import YOLO

# Load the YOLO26 model (The Agent's Perception)
model = YOLO("yolo26n.pt")

# 1. Perceive: The agent analyzes an image
results = model("bus.jpg")

# 2. Reason & 3. Act: Decision logic based on perception
for result in results:
    # Check if a 'person' (class 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Person detected! Initiating security protocol.")
    else:
        print("ACTION: Area clear. Continuing surveillance.")

Concepts connexes

  • IA en périphérie: pour réagir en temps réel, les agents fonctionnent souvent localement sur du matériel tel que le NVIDIA , ce qui minimise la latence en traitant les données à la source plutôt que dans le cloud.
  • Intelligence artificielle générale (AGI): Alors que les agents actuels sont spécialisés (IA étroite), l'AGI fait référence à des agents hypothétiques capables d'effectuer n'importe quelle tâche intellectuelle qu'un humain peut accomplir.
  • IA générative: les agents modernes utilisent fréquemment l'IA générative pour créer des réponses ou du code dynamiques, agissant comme des assistants capables de générer du contenu dans le cadre de leur flux de travail.

Pour ceux qui souhaitent former les modèles sous-jacents de leurs agents, la Ultralytics offre un environnement simplifié pour l'annotation des ensembles de données et la gestion des cycles de formation. Pour en savoir plus sur les architectures d'agents, consultez les recherches menées par des organisations telles que Stanford HAI et DeepMind.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant