Glossar

KI-Agent

Erfahren Sie, was ein KI-Agent ist und wie diese autonomen Systeme die moderne Automatisierung vorantreiben. Entdecken Sie ihren Wahrnehmen-Denken-Handeln-Kreislauf und ihre Rolle in den Bereichen Computer Vision und Robotik.

Ein KI-Agent ist ein autonomes System, das seine Umgebung wahrnimmt, Überlegungen darüber anstellt, wie bestimmte Ziele erreicht werden können bestimmte Ziele zu erreichen, und Handlungen zu unternehmen, um diese Ziele zu erreichen. Anders als ein statisches KI-Modell, das einfach verarbeitet, arbeitet ein KI-Agent in einer kontinuierlichen Schleife - er sammelt Daten, trifft Entscheidungen auf der Entscheidungen auf der Grundlage dieser Daten und führt Aufgaben ohne ständiges menschliches Eingreifen aus. Diese Fähigkeit macht Agenten zu den "Machern" in der Welt der künstlichen Intelligenz und überbrücken die Kluft zwischen abstrakter Datenanalyse und realer Wirkung.

Die Wahrnehmungs-Denk-Handlungs-Schleife

Die Kernfunktionalität eines KI-Agenten wird durch seinen Betriebszyklus definiert, der oft als Wahrnehmungs-Aktions-Schleife. Dieser kontinuierliche Prozess ermöglicht es dem Agenten, sich an veränderte Umgebungen anzupassen und sich mit der Zeit zu verbessern.

Wahrnehmen (Sensing): Der Agent sammelt mit Hilfe von Sensoren Informationen über seine Umgebung. Im Kontext Kontext der Computer Vision (CV) sind diese "Augen" sind Kameras oder LiDAR-Systeme, die visuelle Daten erfassen.
Denken (Verarbeitung und Entscheidungsfindung): Der Agent verarbeitet den sensorischen Input mit Hilfe eines "Gehirn" - typischerweise ein Modell des maschinellen Lernens (ML) oder ein Large Language Model (LLM). Er analysiert den aktuellen Zustand anhand seiner Ziele und bestimmt die beste Vorgehensweise. Fortgeschrittene Agenten können Verstärkungslernen einsetzen, um optimale Strategien durch Versuch und Irrtum.
Handeln (Ausführen): Der Agent führt die gewählte Entscheidung mithilfe von Aktoren aus. In der Robotik könnte dies in der Robotik das Bewegen eines mechanischen Arms, in der Software das Senden einer API-Anfrage, das Schreiben einer Datei oder das Auslösen eines Alarm auslösen.

KI-Agenten vs. KI-Modelle

Es ist wichtig, zwischen einem KI-Agenten und einem KI-Modell zu unterscheiden, da diese Begriffe oft verwechselt werden.

KI-Modell: Eine mathematische Maschine (wie YOLO11), die darauf trainiert ist, Muster zu erkennen oder Vorhersagen zu treffen. Es ist passiv; es wartet auf Eingaben und liefert ein Ergebnis. Betrachten Sie es als ein hochentwickeltes Werkzeug, wie eine digitale Enzyklopädie oder eine Hochgeschwindigkeitskamera.
KI-Agent: Ein autonomes System, das ein oder mehrere Modelle als Werkzeuge verwendet, um ein Ziel zu erreichen. Der Agent verwaltet den Arbeitsablauf, erinnert sich an vergangene Interaktionen und setzt sich aktiv mit der Welt auseinander. Wenn das Modell der der Motor ist, ist der Agent der Fahrer.

Anwendungsfälle in der Praxis

KI-Agenten verändern die Industrie, indem sie komplexe Arbeitsabläufe automatisieren, die bisher von Menschen überwacht werden mussten.

Intelligente Fertigung und Robotik

In der Industrie steuert die KI in der Robotik Agenten, die die Qualitätskontrolle überwachen. Ein Agent für die visuelle Inspektion, der mit einem Objekterkennungsmodell kann ein Förderband Band überwachen. Wenn er einen Defekt feststellt, protokolliert er nicht nur den Fehler, sondern löst einen Roboterarm (den Aktor) aus, der das fehlerhafte Teil das fehlerhafte Stück sofort zu entfernen. Dieser autonome Kreislauf erhöht die Effizienz und reduziert den Ausschuss.

Autonome Fahrzeuge

Selbstfahrende Autos sind eines der fortschrittlichsten Beispiele für KI-Agenten. Sie nutzen eine Reihe von Sensoren, um Fahrbahnmarkierungen, Verkehrsschilder und Fußgänger zu erkennen. Fußgänger. Der bordeigene Agent verarbeitet diesen Datenstrom in Echtzeit, um lebenswichtige Entscheidungen zu treffen - Lenken, Beschleunigen oder Bremsen, um sicher von Punkt A nach Punkt B zu navigieren. Waymo stehen an vorderster Front beim Einsatz dieser autonomen Fahrzeuge auf öffentlichen Straßen.

Aufbau eines einfachen Vision-Agenten

Entwickler können visuelle Agenten entwickeln, die Modelle wie YOLO11 als Wahrnehmungsmotor verwenden. Das folgende Python Beispiel demonstriert einen einfachen "Sicherheitsagenten", der ein Bild wahrnimmt, auf unbefugte Personen prüft und handelt, indem er einen simulierten Alarm auslöst.

from ultralytics import YOLO

# Load the YOLO11 model (The Agent's "Brain" for perception)
model = YOLO("yolo11n.pt")

# 1. Perceive: The agent captures/receives visual data
results = model("secure_zone.jpg")

# 2. Think & 3. Act: The agent evaluates the scene and takes action
for result in results:
    # Check if a 'person' (class ID 0) is detected with high confidence
    if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
        print("ACTION: Security Alert! Person detected in restricted area.")
    else:
        print("ACTION: Log entry - Area secure.")

KI-Agent

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Die Wahrnehmungs-Denk-Handlungs-Schleife

KI-Agenten vs. KI-Modelle

Anwendungsfälle in der Praxis

Intelligente Fertigung und Robotik

Autonome Fahrzeuge

Aufbau eines einfachen Vision-Agenten

Verwandte Konzepte

Mehr in dieser Kategorie lesen

Verstehen, warum Annotationen durch Menschen entscheidend sind

Was ist Datensatzdestillation? Ein kurzer Überblick

Die Oakley Meta AI-Brille definiert mit Vision AI die Welt der Brillen neu.

Werden Sie Mitglied der Ultralytics