Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Agent d'IA

Découvrez ce qu'est un agent d'IA et comment ces systèmes autonomes alimentent l'automatisation moderne. Découvrez leur boucle percevoir-penser-agir et leur rôle dans la vision par ordinateur et la robotique.

Un agent d'intelligence artificielle est un système autonome conçu pour percevoir son environnement, raisonner sur la manière d'atteindre des objectifs spécifiques et prendre des mesures pour atteindre ces objectifs. des objectifs spécifiques, et prendre des mesures pour atteindre ces objectifs. Contrairement à un modèle d'IA statique qui qui traite simplement les données d'entrée pour produire des données de sortie, un agent d'IA fonctionne en boucle : il recueille des données, prend des décisions sur la base de ces données et exécute des tâches sans intervention humaine constante. prendre des décisions sur la base de ces données et exécuter des tâches sans intervention humaine constante. Cette capacité fait des agents les "faiseurs" du monde de l'intelligence artificielle, comblant le fossé entre l'analyse de données abstraites et l'impact sur le monde réel.

La boucle perception-pensée-action

La fonctionnalité de base d'un agent d'intelligence artificielle est définie par son cycle opérationnel, souvent appelé "boucle perception-action". boucle perception-action. Ce processus continu permet à l'agent de s'adapter à des environnements changeants et de s'améliorer au fil du temps.

  1. Percevoir (Sensing) : L'agent recueille des informations sur son environnement à l'aide de capteurs. Dans le Dans le contexte de la vision par ordinateur (VA), ces "yeux" sont des caméras ou des systèmes LiDAR qui capturent des données visuelles. "yeux" sont des caméras ou des systèmes LiDAR qui capturent des données visuelles.
  2. Penser (traitement et prise de décision) : L'agent traite les données sensorielles à l'aide d'un "cerveau" - typiquement un modèle d'apprentissage automatique (ML) ou un grand modèle de langage (LLM). Il analyse l'état actuel par rapport à ses objectifs et détermine le meilleur plan d'action. Les agents avancés peuvent utiliser l 'apprentissage par renforcement pour apprendre les stratégies optimales par essais et erreurs.
  3. Act (Exécution) : L'agent exécute la décision choisie à l'aide d'actionneurs. En robotique, il peut s'agir En robotique, il peut s'agir de déplacer un bras mécanique ; en logiciel, il peut s'agir d'envoyer une demande d'API, d'écrire un fichier ou de déclencher une alerte. alerte.

Agents d'IA et modèles d'IA

Il est essentiel de faire la distinction entre un agent d'IA et un modèle d'IA, car ces termes sont souvent confondus.

  • Modèle d'IA : Un moteur mathématique (comme YOLO11) entraîné à reconnaître des modèles ou à faire des prédictions. Il est passif ; il attend des données et renvoie un résultat. Il s'agit d'un outil sophistiqué, comme une encyclopédie numérique ou un appareil photo à grande vitesse. encyclopédie numérique ou un appareil photo à grande vitesse.
  • Agent d'IA : Un système autonome qui utilise un ou plusieurs modèles comme outils pour atteindre un objectif. L'agent gère le flux de travail, se souvient des interactions passées et s'engage activement dans le monde. Si le modèle est le moteur, l'agent est le conducteur.

Applications concrètes

Les agents d'IA transforment les industries en automatisant des flux de travail complexes qui nécessitaient auparavant une supervision humaine.

Fabrication intelligente et robotique

Dans le secteur industriel, l'IA dans la robotique alimente des agents qui supervisent le contrôle de la qualité. agents qui supervisent le contrôle de la qualité. Un agent d'inspection visuelle équipé d'un modèle de détection d'objets peut surveiller un convoyeur. Lorsqu'il perçoit un défaut, il ne se contente pas d'enregistrer l'erreur ; il déclenche un bras robotique (l'actionneur) pour retirer immédiatement l'article défectueux. immédiatement l'article défectueux. Cette boucle autonome augmente l'efficacité et réduit les déchets.

Véhicules autonomes

Les voitures auto-conduites font partie des exemples les plus sophistiqués d'agents d'IA. exemples les plus sophistiqués d'agents d'intelligence artificielle. Elles utilisent une série de capteurs pour percevoir les lignes de démarcation, les panneaux de signalisation et les piétons. piétons. L'agent embarqué traite ce flux de données en temps réel afin de prendre des décisions cruciales pour la vie du conducteur, comme la direction, l'accélération ou le freinage, afin de naviguer en toute sécurité d'un point à un autre, accélérer ou freiner pour naviguer en toute sécurité d'un point A à un point B. Des entreprises comme Waymo sont à la pointe de la technologie. Waymo sont à l'avant-garde du déploiement de ces véhicules autonomes sur les routes publiques.

Construction d'un agent de vision simple

Les développeurs peuvent créer des agents basés sur la vision en utilisant des modèles tels que YOLO11 comme moteur de perception. L'exemple Python exemple Python suivant montre un simple "agent de sécurité" qui perçoit une image, vérifie la présence de personnes non autorisées et agit en déclenchant une alerte simulée. agit en déclenchant une alerte simulée.

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

Concepts connexes

  • Apprentissage par renforcement: A méthode de formation dans laquelle les agents apprennent à prendre des décisions en recevant des récompenses ou des pénalités. et la robotique complexe.
  • Edge AI: déploiement d'agents directement sur des sur des appareils locaux (comme des caméras ou des drones) plutôt que dans le nuage, ce qui permet une inférence et une action plus rapides en temps réel. d 'inférence et d'action en temps réel.
  • Intelligence générale artificielle (AGI) : Un état futur théorique dans lequel un agent possède la capacité de comprendre, d'apprendre et d'appliquer des connaissances à un large éventail de tâches, à l'instar d'un être humain. une grande variété de tâches, à l'instar d'un être humain.

Pour en savoir plus sur l'architecture des agents intelligents, consultez les ressources suivantes IBM et Stanford University offrent des perspectives académiques et industrielles approfondies.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant