Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Cookie-Einstellungen
Indem Sie auf „Alle Cookies akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Website-Navigation zu verbessern, die Website-Nutzung zu analysieren und unsere Marketingbemühungen zu unterstützen. Mehr Infos
Erfahren Sie, wie agentische KI-Systeme Computer Vision-Modelle verwenden, um visuelle Daten autonom zu analysieren, aus Erfahrungen zu lernen und sich an veränderte Bedingungen anzupassen.
Künstliche Intelligenz (KI) und Computer Vision helfen Maschinen, die Welt zu sehen und zu verstehen. Dank der jüngsten Fortschritte erleben wir einen Sprung nach vorn – KI-Innovationen, die nicht nur wahrnehmen, sondern auch denken, planen und selbstständig handeln. In einem früheren Artikel haben wir erörtert, wie Vision Agents in der Lage sind, visuelle Daten zu verarbeiten, zu analysieren und Maßnahmen zu ergreifen.
Heute werden wir ein ähnliches Konzept untersuchen: Agentic AI. Agentic AI-Systeme sind so konzipiert, dass sie unabhängig agieren und über menschenähnliche Denk- und Problemlösungsfähigkeiten verfügen, um definierte Ziele zu erreichen. Im Gegensatz zu traditionellen KI-Systemen, die sich auf die Erledigung einzelner Aufgaben mit vordefinierten Anweisungen konzentrieren, kann Agentic AI autonom planen und handeln, um Aufgaben auszuführen. Diese Agenten können sogar aus früheren Interaktionen lernen und Entscheidungen ohne menschliches Zutun treffen.
Wenn es um Computer Vision geht, können agentische KI-Systeme Techniken wie die Objekterkennung mithilfe von Computer-Vision-Modellen wie Ultralytics YOLO11 nutzen, um visuelle Daten in Echtzeit zu analysieren, Objekte zu erkennen, räumliche Beziehungen zu verstehen und autonome Entscheidungen auf der Grundlage ihrer Umgebung zu treffen.
Was ist Agentic AI?
Im Kern sind agentische KI-Systeme mit autonomen, zielorientierten Denk-, adaptiven Problemlösungs- und kontinuierlichen Lernfähigkeiten ausgestattet. Sie verwenden KI-Agenten, um ihre Umgebung zu verstehen, Entscheidungen zu treffen und Aufgaben auszuführen. Diese KI-Agenten verwenden Computer-Vision-Modelle, Techniken des bestärkenden Lernens und große Sprachmodelle (LLMs), um komplexe Aufgaben auszuführen. Dies macht sie ideal für die Automatisierung von Geschäftsprozessen und die Verbesserung der Entscheidungsfindung.
In einem Lager kann beispielsweise ein Agentic-AI-System, das mit Computer Vision ausgestattet ist, Pakete erkennen, den Lagerbestand verfolgen und Hindernisse ohne menschliches Zutun umfahren. Mithilfe von Reinforcement Learning kann es seine Bewegungseffizienz im Laufe der Zeit verbessern und die besten Routen lernen, um Staus zu vermeiden. In der Zwischenzeit kann ein LLM-gestützter Chatbot die Mitarbeiter unterstützen, indem er Fragen beantwortet und betriebliche Verbesserungen vorschlägt, wodurch der gesamte Workflow effizienter wird.
Abb. 1. Eine Übersicht, wie Agentic AI funktioniert.
Der Hauptunterschied zwischen einer traditionellen KI-Lösung und einer Agentic-KI-Lösung besteht darin, dass Agentic-KI vorausschauend denken und sich an veränderte Situationen anpassen kann. Traditionelle Computer-Vision-Systeme eignen sich hervorragend zum Erkennen von Objekten oder zum Klassifizieren von Bildern, aber sie können ihr Verhalten nicht dynamisch anpassen. Sie benötigen einen Menschen, der eingreift und hilft, Modelle neu zu trainieren oder feinabzustimmen. Agentic AI hingegen verwendet fortschrittliche Techniken des maschinellen Lernens, um sich im Laufe der Zeit durch Interaktion mit ihrer Umgebung zu verbessern.
Vergleich von Agentic AI mit anderen fortschrittlichen KI-Innovationen
KI entwickelt sich rasant weiter, wobei neue Konzepte wie generative KI, agentische Automatisierung und Computer Vision in verschiedenen Branchen schnell übernommen werden. Vergleichen wir diese Technologien, um besser zu verstehen, was agentische KI auszeichnet.
Der Unterschied zwischen generativer KI und agentischer KI
Wenn Sie bereits Tools wie ChatGPT verwendet haben, sind Sie bereits mit generativer KI vertraut. Dieser Zweig der KI ist auf die Erstellung von Inhalten spezialisiert, wie z. B. Text, Bilder oder Code, basierend auf Benutzeranfragen. Während generative KI die Kreativität und Ideenerkundung verbessert, folgt sie gelernten Mustern und operiert innerhalb vordefinierter Einschränkungen, wodurch ihr die Fähigkeit fehlt, autonome Entscheidungen zu treffen oder unabhängige Ziele zu verfolgen.
Im Gegensatz dazu verfolgt Agentic AI aktiv Ziele. Sie kann sich dynamisch an ihre Umgebung anpassen, ohne dass ein kontinuierlicher menschlicher Input erforderlich ist. Anstatt nur Inhalte zu generieren, ergreift sie Maßnahmen und löst Probleme autonom.
Agentic Automation und Agentic AI sind eng miteinander verbunden
Agentic Automation und Agentic AI gehen Hand in Hand, wobei Agentic AI die Intelligenz bereitstellt, die die Automatisierung antreibt. Betrachten Sie ein Computer Vision-basiertes Sicherheitssystem.
Das agentische KI-System analysiert die Situation, entscheidet über die beste Reaktion und handelt selbstständig. Wenn beispielsweise eine mit Computer Vision integrierte KI-Überwachungskamera einen Eindringling entdeckt, sendet das agentische KI-System nicht nur eine Warnung, sondern prüft, ob die Person ein Mitarbeiter ist, verriegelt bei Bedarf Türen, verfolgt ihre Bewegung und schickt sogar eine Drohne zur Überwachung.
Agentic Automation stellt sicher, dass alle diese Aktionen reibungslos zusammenarbeiten. Sie verbindet verschiedene Systeme wie Überwachungskameras, Türschlösser und Drohnen, sodass diese automatisch und synchron reagieren können. Während Agentic AI die Entscheidungen trifft, stellt Agentic Automation sicher, dass diese Entscheidungen effizient ausgeführt werden, ohne dass ein menschliches Eingreifen erforderlich ist.
Abb. 2. Vergleich von Agentic AI und Agentic Automation. Bild vom Autor.
Wie Agentic AI funktioniert
Nachdem wir nun ein besseres Verständnis dafür haben, was Agentic AI ist, wollen wir untersuchen, wie sie funktioniert.
Agentic AI-Systeme arbeiten nach einem zyklischen Prozess aus Wahrnehmung, Entscheidungsfindung, Handlung und Anpassung, der ihnen hilft, im Laufe der Zeit zu lernen und sich zu verbessern. Diese kontinuierliche Schleife ermöglicht es diesen Systemen, selbstständig zu funktionieren und komplexe Ziele zu erreichen.
Hier ein kurzer Überblick über die Schritte, die in der kontinuierlichen Schleife enthalten sind:
Wahrnehmung: Das agentische KI-System sammelt und analysiert Daten von Kameras, Sensoren und Benutzerinteraktionen, um seine Umgebung besser zu verstehen.
Entscheidungsfindung: Das System bewertet verschiedene Optionen, prognostiziert mögliche Ergebnisse und wählt die beste Aktion auf der Grundlage von Überlegungen und Risikobewertung aus.
Aktion: Sobald eine Entscheidung getroffen wurde, führt das System Aufgaben aus, indem es physische Geräte steuert, mit anderen Systemen interagiert oder Ausgaben generiert.
Anpassung: Das System lernt aus Erfahrungen mithilfe von Feedback und wendet maschinelles Lernen und Reinforcement Learning an, um die Leistung im Laufe der Zeit zu verbessern, insbesondere bei komplexeren Aufgaben.
Gehen wir als Nächstes einige Beispiele aus der Praxis für agentische KI in Aktion durch. Diese Systeme werden in verschiedenen Branchen eingesetzt und helfen Maschinen, Daten zu analysieren und unabhängige Entscheidungen zu treffen, um die Ergebnisse zu verbessern.
Agentic AI in der Medikamentenentwicklung
Die Wirkstoffforschung umfasst mehrere Schlüsselphasen, von der Identifizierung biologischer Ziele, die mit Krankheiten in Verbindung stehen, bis hin zum Screening potenzieller Verbindungen, der Optimierung ihrer chemischen Strukturen und der Durchführung präklinischer Tests. Es ist ein komplexer und zeitaufwändiger Prozess, der umfangreiche Datenanalysen und Experimente erfordert, um wirksame und sichere Behandlungen zu finden.
Agentic AI, integriert mit Computer Vision, hilft bei der Automatisierung wichtiger Schritte wie der chemischen Synthese, wodurch der Prozess schneller und effizienter wird. Chemische Synthese ist der Prozess der Kombination verschiedener chemischer Verbindungen, um neue Substanzen, wie z. B. pharmazeutische Medikamente, durch kontrollierte Reaktionen zu erzeugen. Traditionell mussten Wissenschaftler Faktoren wie Temperatur, Lösungsmittelzusammensetzung und Kristallisationszeitpunkt manuell durch Ausprobieren anpassen.
Agentic AI-Systeme können Reaktionen in Echtzeit überwachen, visuelle Veränderungen wie Farbverschiebungen oder Kristallbildung analysieren und sofort Entscheidungen treffen. Wenn das System beispielsweise feststellt, dass eine Reaktion nicht wie erwartet verläuft, kann es sofort die Temperatur anpassen oder die notwendigen Chemikalien hinzufügen, um den Prozess zu optimieren. Indem das System kontinuierlich aus vergangenen Reaktionen lernt, verbessert es seine Genauigkeit im Laufe der Zeit, wodurch die Notwendigkeit manueller Eingriffe reduziert und die Arzneimittelentwicklung beschleunigt wird.
Abb. 4. Ein Beispiel für einen automatisierten Laboraufbau.
E-Commerce mit agentischer KI neu erfinden
Agentic AI verändert die Art und Weise, wie wir online einkaufen, indem sie das Erlebnis persönlicher, effizienter und automatisierter gestaltet. Anstatt nur Produkte basierend auf früheren Käufen zu empfehlen, kann Agentic AI das Surfverhalten analysieren, vorhersagen, was ein Kunde als Nächstes wünschen könnte, und Produktvorschläge in Echtzeit anpassen.
Mithilfe von Computer Vision kann Agentic AI auch visuelle Suchanfragen analysieren und Produktbilder erkennen, um genauere Empfehlungen zu geben. Wenn beispielsweise jemand häufig nach Turnschuhen sucht, kann das Agentic AI-System Trendstile hervorheben, Rabatte anbieten oder passendes Zubehör vorschlagen. Es kann auch die Preisgestaltung und Werbeaktionen basierend auf der Nachfrage optimieren, wodurch das Einkaufen dynamischer wird.
Über Empfehlungen hinaus verbessert Agentic AI die Logistik im E-Commerce durch die Verwaltung von Lagerbeständen, die Vorhersage von Nachbestellungen und die Automatisierung der Auftragsabwicklung. Computer Vision ermöglicht es Agentic-AI-Systemen, den Lagerbestand in Echtzeit zu verfolgen, verlegte Artikel zu identifizieren und sicherzustellen, dass Produkte korrekt kategorisiert werden. Wenn sich ein Artikel schnell verkauft, kann das System eine Nachbestellung auslösen oder Alternativen vorschlagen. Indem Agentic AI im Laufe der Zeit lernt und sich anpasst, macht sie das Online-Shopping schneller, intelligenter und nahtloser für Kunden und Unternehmen.
Wie man ein agentisches KI-System aufbaut
Nachdem wir uns nun reale Beispiele für Agentic AI angesehen haben, wollen wir erörtern, wie man eine solche aufbaut.
Wenn Sie eine Computer-Vision-basierte Anwendung entwickeln, kann die Verwendung der neuesten Modelle wie Ultralytics YOLO11 Ihrem agentischen KI-System helfen, seine Umgebung besser zu verstehen. Mit seiner Unterstützung für verschiedene Computer-Vision-Aufgaben kann YOLO11 es agentischen KI-Systemen ermöglichen, visuelle Daten genau zu analysieren.
Hier erfahren Sie, wie Sie ein Agentic-KI-System mit YOLO11 erstellen können:
Ziele definieren: Definieren Sie klar den Zweck, die Ziele und die spezifischen Aufgaben des KI-Agenten, die er ausführen muss, um seine beabsichtigte Funktionalität zu erreichen.
YOLO11 trainieren: Sammeln Sie relevante Bild- und Videodaten, beschriften Sie diese und trainieren Sie YOLO11 benutzerdefiniert basierend auf Ihrer spezifischen Anwendung.
YOLO11 integrieren: Verbinden Sie YOLO11 mit einem KI-Framework, das Echtzeitanalyse und Entscheidungsfindung auf der Grundlage erkannter visueller Daten ermöglicht.
Autonomes Treffen von Entscheidungen ermöglichen: Richten Sie Logik- oder Modelle für maschinelles Lernen ein, die es dem KI-Agenten ermöglichen, auf der Grundlage der Erkennungen von YOLO11 Maßnahmen zu ergreifen, wie z. B. das Auslösen von Warnmeldungen, das Anpassen von Einstellungen oder das Steuern von Robotersystemen.
Feedbackschleifen einbauen: Implementieren Sie ein selbstlernendes System, bei dem YOLO11 seine Genauigkeit durch erneutes Training mit neuen Daten verfeinert und so seine Modellleistung im Laufe der Zeit verbessert.
Abb. 5. So erstellen Sie ein agentisches KI-System mit YOLO11. Bild vom Autor.
Vor- und Nachteile eines agentischen KI-Systems
Hier sind einige der wichtigsten Vorteile, die agentische KI-Systeme in verschiedene Branchen einbringen können:
Erhöhte Effizienz: Agentic AI-Systeme können komplexe, zeitaufwändige Aufgaben automatisieren, Fehler reduzieren und menschliche Arbeitskräfte für höherwertige Tätigkeiten freisetzen.
Skalierbarkeit: Diese Systeme können problemlos an verschiedene Branchen angepasst werden und bei Bedarf wachsen, um größere Arbeitslasten zu bewältigen.
Kostenreduzierung: Durch die Reduzierung des Bedarfs an manueller Arbeit und die Optimierung von Abläufen hilft Agentic AI Unternehmen, Ausgaben zu senken und Ressourcen effektiver zu nutzen.
Agentic AI bietet zwar viele Vorteile in verschiedenen Sektoren, aber es ist auch wichtig, sich der potenziellen Einschränkungen bewusst zu sein, die damit einhergehen. Hier sind einige wichtige Punkte, die Sie beachten sollten:
Verzerrung (Bias) in KI: Agentische KI-Systeme können Verzerrungen aus Trainingsdaten übernehmen, was zu unfairen oder ungenauen Ergebnissen führt, insbesondere in Bereichen wie Einstellung und Strafverfolgung.
Mangel an Transparenz: Viele KI-Modelle funktionieren wie "Black Boxes", was es schwierig macht zu verstehen, wie sie Entscheidungen treffen, was in Branchen wie dem Gesundheitswesen und dem Finanzwesen ein Problem sein kann.
Herausforderungen bei der Regulierung: Die Entwicklung von Agentic AI schreitet schneller voran als die Vorschriften, was zu rechtlichen Unsicherheiten und inkonsistenten globalen Compliance-Standards führt.
Insgesamt ist es wichtig, bei allen Vorteilen von Agentic-KI-Systemen ein Gleichgewicht mit ethischen Erwägungen, Transparenz und angemessener Regulierung zu wahren, um sicherzustellen, dass sie verantwortungsvoll eingesetzt werden.
Wesentliche Erkenntnisse
In Kombination mit Vision-KI-Modellen wie YOLO11 können agentische KI-Systeme die Funktionsweise der Automatisierung verändern. Von selbstfahrenden Autos über Online-Shopping bis hin zum Gesundheitswesen helfen diese Systeme Unternehmen, autonom und schneller zu arbeiten.
Es müssen jedoch noch Herausforderungen wie Voreingenommenheit, mangelnde Transparenz und unklare Vorschriften angegangen werden. Da sich agentische KI-Systeme verbessern, wird es entscheidend sein, das richtige Gleichgewicht zwischen Innovation und Verantwortung zu finden, um diese Innovationen optimal zu nutzen.