Agent d'IA
Explorez l'univers des agents IA. Découvrez comment ces systèmes autonomes utilisent Ultralytics pour percevoir, raisonner et agir en temps réel afin de résoudre des tâches complexes.
Un agent IA est un système autonome capable de percevoir son environnement, de raisonner à l'aide d'une logique complexe
pour prendre des décisions et d'entreprendre des actions spécifiques afin d'atteindre des objectifs définis. Contrairement à un
modèle d'apprentissage automatique statique, qui traite passivement
les données d'entrée pour produire une sortie, un agent fonctionne de manière dynamique dans un flux de travail continu. Ces systèmes constituent
la couche « active » de l'
intelligence artificielle, comblant le
fossé entre les prédictions numériques et l'exécution dans le monde réel. En utilisant la mémoire et l'apprentissage adaptatif, les agents peuvent gérer des
tâches allant de l'automatisation logicielle à la navigation physique sans intervention humaine constante.
La boucle perception-raisonnement-action
La fonctionnalité d'un agent IA repose sur un processus cyclique souvent décrit comme la
boucle perception-action. Cette architecture permet à l'agent d'interagir de manière significative avec son
environnement.
-
Perception (détection) : l'agent recueille des informations sur le monde qui l'entoure. Dans les
applications de vision par ordinateur, l'agent utilise des
caméras comme « yeux ». Il utilise des modèles à grande vitesse tels que
YOLO26 pour effectuer la
détection ou la segmentation d'objets, en convertissant les pixels bruts
en données structurées.
-
Raisonnement (réflexion) : l'agent traite les données perçues en fonction de ses objectifs. Cette étape
intègre souvent
des modèles linguistiques à grande échelle (LLM) pour la
compréhension sémantique ou des
algorithmes d'apprentissage par renforcement afin d'
optimiser les stratégies de prise de décision. Les agents avancés peuvent planifier plusieurs étapes à l'avance, tout comme un joueur d'échecs qui
anticipe les coups futurs.
-
Action (exécution) : sur la base de son raisonnement, l'agent exécute une tâche. Il peut s'agir d'une action numérique
, telle que l'interrogation d'une base de données ou l'envoi d'une alerte, ou d'une action physique en
robotique, telle qu'un bras robotisé prélevant un article spécifique
sur un tapis roulant.
Agent IA vs modèle IA
Il est important de faire la distinction entre un agent et un modèle, car ils jouent des rôles différents dans la pile technologique.
-
Modèle d'IA : un modèle est un moteur mathématique, tel qu'un
réseau neuronal, entraîné à reconnaître des modèles.
Il s'agit d'un outil qui fournit des prédictions (par exemple, « ceci est une voiture ») mais n'agit pas intrinsèquement sur celles-ci.
-
Agent IA : un agent est le système global qui utilise des modèles comme outils. Il possède une
capacité d'action, c'est-à-dire la capacité d'initier le changement. Par exemple, alors qu'un modèle identifie un feu rouge, l'agent décide d'
actionner les freins.
Applications concrètes
Les agents IA transforment les industries en automatisant les flux de travail qui nécessitent une flexibilité cognitive.
-
Fabrication intelligente : dans le domaine de l'
automatisation industrielle, des agents visuels surveillent les
chaînes de production. Si un défaut est identifié par un
système de contrôle qualité, l'agent peut arrêter les machines de manière autonome et enregistrer l'incident, évitant ainsi le gaspillage.
-
Logistique autonome : les entrepôts utilisent des robots agents pour la gestion des stocks. Ces agents
naviguent dans des environnements dynamiques à l'aide de la
technologie SLAM (localisation et cartographie simultanées)
et de modèles de vision pour localiser, prélever et transporter efficacement les colis.
Construction d'un agent de vision simple
Les développeurs peuvent créer des agents de base en combinant des modèles de perception avec une logique conditionnelle. Python suivant
illustre un « agent de sécurité » simple utilisant le ultralytics paquet. L'agent détecte une
personne et décide de déclencher ou non une alerte en fonction du niveau de confiance du modèle.
from ultralytics import YOLO
# Load the YOLO26 model (The Agent's Perception)
model = YOLO("yolo26n.pt")
# 1. Perceive: The agent analyzes an image
results = model("bus.jpg")
# 2. Reason & 3. Act: Decision logic based on perception
for result in results:
# Check if a 'person' (class 0) is detected with high confidence
if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
print("ACTION: Person detected! Initiating security protocol.")
else:
print("ACTION: Area clear. Continuing surveillance.")
Concepts connexes
-
IA en périphérie: pour réagir en temps réel, les agents
fonctionnent souvent localement sur du matériel tel que le
NVIDIA , ce qui minimise la latence en traitant les
données à la source plutôt que dans le cloud.
-
Intelligence artificielle générale (AGI):
Alors que les agents actuels sont spécialisés (IA étroite), l'AGI fait référence à des agents hypothétiques capables d'effectuer n'importe quelle
tâche intellectuelle qu'un humain peut accomplir.
-
IA générative: les agents modernes
utilisent fréquemment l'IA générative pour créer des réponses ou du code dynamiques, agissant comme des assistants capables de générer du contenu dans le cadre de
leur flux de travail.
Pour ceux qui souhaitent former les modèles sous-jacents de leurs agents, la
Ultralytics offre un environnement simplifié pour l'annotation des
ensembles de données et la gestion des cycles de formation. Pour en savoir plus sur les architectures d'agents, consultez les recherches menées par des
organisations telles que Stanford HAI et
DeepMind.