Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

Agentic AI und Computer Vision: Die Zukunft der Automatisierung

Abirami Vina

4 Min. Lesezeit

12. Februar 2025

Erfahren Sie, wie agentische KI-Systeme Computer Vision-Modelle verwenden, um visuelle Daten autonom zu analysieren, aus Erfahrungen zu lernen und sich an veränderte Bedingungen anzupassen.

Künstliche Intelligenz (KI) und Computer Vision helfen Maschinen, die Welt zu sehen und zu verstehen. Dank der jüngsten Fortschritte erleben wir einen Sprung nach vorn – KI-Innovationen, die nicht nur wahrnehmen, sondern auch denken, planen und selbstständig handeln. In einem früheren Artikel haben wir erörtert, wie Vision Agents in der Lage sind, visuelle Daten zu verarbeiten, zu analysieren und Maßnahmen zu ergreifen. 

Heute werden wir ein ähnliches Konzept untersuchen: Agentic AI. Agentic AI-Systeme sind so konzipiert, dass sie unabhängig agieren und über menschenähnliche Denk- und Problemlösungsfähigkeiten verfügen, um definierte Ziele zu erreichen. Im Gegensatz zu traditionellen KI-Systemen, die sich auf die Erledigung einzelner Aufgaben mit vordefinierten Anweisungen konzentrieren, kann Agentic AI autonom planen und handeln, um Aufgaben auszuführen. Diese Agenten können sogar aus früheren Interaktionen lernen und Entscheidungen ohne menschliches Zutun treffen. 

Im Bereich der Computer Vision können agentenbasierte KI-Systeme Techniken wie die Objekterkennung mit Hilfe von Computer Vision Modellen wie Ultralytics YOLO11 nutzen, um visuelle Daten in Echtzeit zu analysieren, Objekte zu erkennen, räumliche Beziehungen zu verstehen und autonome Entscheidungen auf der Grundlage ihrer Umgebung zu treffen.

Was ist Agentic AI?

Im Kern sind agentische KI-Systeme mit autonomen, zielorientierten Denk-, adaptiven Problemlösungs- und kontinuierlichen Lernfähigkeiten ausgestattet. Sie verwenden KI-Agenten, um ihre Umgebung zu verstehen, Entscheidungen zu treffen und Aufgaben auszuführen. Diese KI-Agenten verwenden Computer-Vision-Modelle, Techniken des bestärkenden Lernens und große Sprachmodelle (LLMs), um komplexe Aufgaben auszuführen. Dies macht sie ideal für die Automatisierung von Geschäftsprozessen und die Verbesserung der Entscheidungsfindung.

In einem Lagerhaus zum Beispiel kann ein agentenbasiertes KI-System, das mit Computer Vision ausgestattet ist, Pakete detect , track Bestand track und Hindernisse ohne menschliches Zutun umfahren. Mithilfe von Reinforcement Learning kann es seine Bewegungseffizienz im Laufe der Zeit verbessern, indem es die besten Routen lernt, um Staus zu vermeiden. In der Zwischenzeit kann ein LLM-gesteuerter Chatbot die Mitarbeiter bei der Beantwortung von Fragen unterstützen und betriebliche Verbesserungen vorschlagen, wodurch der gesamte Arbeitsablauf effizienter wird.

__wf_reserved_inherit
Abb. 1. Eine Übersicht, wie Agentic AI funktioniert.

Der Hauptunterschied zwischen einer traditionellen KI-Lösung und einer Agentic-KI-Lösung besteht darin, dass Agentic-KI vorausschauend denken und sich an veränderte Situationen anpassen kann. Traditionelle Computer-Vision-Systeme eignen sich hervorragend zum Erkennen von Objekten oder zum Klassifizieren von Bildern, aber sie können ihr Verhalten nicht dynamisch anpassen. Sie benötigen einen Menschen, der eingreift und hilft, Modelle neu zu trainieren oder feinabzustimmen. Agentic AI hingegen verwendet fortschrittliche Techniken des maschinellen Lernens, um sich im Laufe der Zeit durch Interaktion mit ihrer Umgebung zu verbessern.

Vergleich von Agentic AI mit anderen fortschrittlichen KI-Innovationen

KI entwickelt sich rasant weiter, wobei neue Konzepte wie generative KI, agentische Automatisierung und Computer Vision in verschiedenen Branchen schnell übernommen werden. Vergleichen wir diese Technologien, um besser zu verstehen, was agentische KI auszeichnet.

Der Unterschied zwischen generativer KI und agentischer KI

Wenn Sie bereits Tools wie ChatGPTverwendet haben, sind Sie bereits mit generativer KI vertraut. Dieser Zweig der KI ist auf die Erstellung von Inhalten wie Text, Bilder oder Code auf der Grundlage von Benutzereingaben spezialisiert. Generative KI fördert zwar die Kreativität und Ideenfindung, folgt aber gelernten Mustern und arbeitet innerhalb vordefinierter Grenzen, ohne die Fähigkeit, autonome Entscheidungen zu treffen oder unabhängige Ziele zu verfolgen.

Im Gegensatz dazu verfolgt Agentic AI aktiv Ziele. Sie kann sich dynamisch an ihre Umgebung anpassen, ohne dass ein kontinuierlicher menschlicher Input erforderlich ist. Anstatt nur Inhalte zu generieren, ergreift sie Maßnahmen und löst Probleme autonom.

Agentic Automation und Agentic AI sind eng miteinander verbunden

Agentic Automation und Agentic AI gehen Hand in Hand, wobei Agentic AI die Intelligenz bereitstellt, die die Automatisierung antreibt. Betrachten Sie ein Computer Vision-basiertes Sicherheitssystem. 

Das agentische KI-System analysiert die Situation, entscheidet über die beste Reaktion und handelt selbstständig. Wenn beispielsweise eine mit Computer Vision integrierte KI-Überwachungskamera einen Eindringling entdeckt, sendet das agentische KI-System nicht nur eine Warnung, sondern prüft, ob die Person ein Mitarbeiter ist, verriegelt bei Bedarf Türen, verfolgt ihre Bewegung und schickt sogar eine Drohne zur Überwachung.

Agentic Automation stellt sicher, dass alle diese Aktionen reibungslos zusammenarbeiten. Sie verbindet verschiedene Systeme wie Überwachungskameras, Türschlösser und Drohnen, sodass diese automatisch und synchron reagieren können. Während Agentic AI die Entscheidungen trifft, stellt Agentic Automation sicher, dass diese Entscheidungen effizient ausgeführt werden, ohne dass ein menschliches Eingreifen erforderlich ist. 

__wf_reserved_inherit
Abb. 2. Vergleich von Agentic AI und Agentic Automation. Bild vom Autor.

Wie Agentic AI funktioniert

Nachdem wir nun ein besseres Verständnis dafür haben, was Agentic AI ist, wollen wir untersuchen, wie sie funktioniert. 

Agentic AI-Systeme arbeiten nach einem zyklischen Prozess aus Wahrnehmung, Entscheidungsfindung, Handlung und Anpassung, der ihnen hilft, im Laufe der Zeit zu lernen und sich zu verbessern. Diese kontinuierliche Schleife ermöglicht es diesen Systemen, selbstständig zu funktionieren und komplexe Ziele zu erreichen.

Hier ein kurzer Überblick über die Schritte, die in der kontinuierlichen Schleife enthalten sind:

  • Wahrnehmung: Das agentische KI-System sammelt und analysiert Daten von Kameras, Sensoren und Benutzerinteraktionen, um seine Umgebung besser zu verstehen.
  • Entscheidungsfindung: Das System bewertet verschiedene Optionen, prognostiziert mögliche Ergebnisse und wählt die beste Aktion auf der Grundlage von Überlegungen und Risikobewertung aus.
  • Aktion: Sobald eine Entscheidung getroffen wurde, führt das System Aufgaben aus, indem es physische Geräte steuert, mit anderen Systemen interagiert oder Ausgaben generiert.
  • Anpassung: Das System lernt aus Erfahrungen mithilfe von Feedback und wendet maschinelles Lernen und Reinforcement Learning an, um die Leistung im Laufe der Zeit zu verbessern, insbesondere bei komplexeren Aufgaben.
__wf_reserved_inherit
Abb. 3. Funktionsweise von Agentic AI.

Anwendungsfälle von Agentic AI in der Praxis

Gehen wir als Nächstes einige Beispiele aus der Praxis für agentische KI in Aktion durch. Diese Systeme werden in verschiedenen Branchen eingesetzt und helfen Maschinen, Daten zu analysieren und unabhängige Entscheidungen zu treffen, um die Ergebnisse zu verbessern.

Agentic AI in der Medikamentenentwicklung

Die Wirkstoffforschung umfasst mehrere Schlüsselphasen, von der Identifizierung biologischer Ziele, die mit Krankheiten in Verbindung stehen, bis hin zum Screening potenzieller Verbindungen, der Optimierung ihrer chemischen Strukturen und der Durchführung präklinischer Tests. Es ist ein komplexer und zeitaufwändiger Prozess, der umfangreiche Datenanalysen und Experimente erfordert, um wirksame und sichere Behandlungen zu finden.

Agentic AI, integriert mit Computer Vision, hilft bei der Automatisierung wichtiger Schritte wie der chemischen Synthese, wodurch der Prozess schneller und effizienter wird. Chemische Synthese ist der Prozess der Kombination verschiedener chemischer Verbindungen, um neue Substanzen, wie z. B. pharmazeutische Medikamente, durch kontrollierte Reaktionen zu erzeugen. Traditionell mussten Wissenschaftler Faktoren wie Temperatur, Lösungsmittelzusammensetzung und Kristallisationszeitpunkt manuell durch Ausprobieren anpassen.

Agentic AI-Systeme können Reaktionen in Echtzeit überwachen, visuelle Veränderungen wie Farbverschiebungen oder Kristallbildung analysieren und sofort Entscheidungen treffen. Wenn das System beispielsweise feststellt, dass eine Reaktion nicht wie erwartet verläuft, kann es sofort die Temperatur anpassen oder die notwendigen Chemikalien hinzufügen, um den Prozess zu optimieren. Indem das System kontinuierlich aus vergangenen Reaktionen lernt, verbessert es seine Genauigkeit im Laufe der Zeit, wodurch die Notwendigkeit manueller Eingriffe reduziert und die Arzneimittelentwicklung beschleunigt wird.

__wf_reserved_inherit
Abb. 4. Ein Beispiel für einen automatisierten Laboraufbau.

E-Commerce mit agentischer KI neu erfinden

Agentic AI verändert die Art und Weise, wie wir online einkaufen, indem sie das Erlebnis persönlicher, effizienter und automatisierter gestaltet. Anstatt nur Produkte basierend auf früheren Käufen zu empfehlen, kann Agentic AI das Surfverhalten analysieren, vorhersagen, was ein Kunde als Nächstes wünschen könnte, und Produktvorschläge in Echtzeit anpassen. 

Mithilfe von Computer Vision kann Agentic AI auch visuelle Suchanfragen analysieren und Produktbilder erkennen, um genauere Empfehlungen zu geben. Wenn beispielsweise jemand häufig nach Turnschuhen sucht, kann das Agentic AI-System Trendstile hervorheben, Rabatte anbieten oder passendes Zubehör vorschlagen. Es kann auch die Preisgestaltung und Werbeaktionen basierend auf der Nachfrage optimieren, wodurch das Einkaufen dynamischer wird.

Über Empfehlungen hinaus verbessert die agenturgestützte KI die E-Commerce-Logistik, indem sie Bestände verwaltet, Nachbestellungen vorhersagt und die Auftragsabwicklung automatisiert. Mithilfe von Computer Vision können agenturgestützte KI-Systeme Lagerbestände in Echtzeit track , verlegte Artikel identifizieren und sicherstellen, dass die Produkte korrekt kategorisiert sind. Wenn ein Artikel schnell ausverkauft ist, kann das System die Wiederauffüllung des Bestands veranlassen oder Alternativen vorschlagen. Durch Lernen und Anpassung im Laufe der Zeit macht die agenturgestützte KI das Online-Shopping schneller, intelligenter und nahtloser für Kunden und Unternehmen.

Wie man ein agentisches KI-System aufbaut 

Nachdem wir uns nun reale Beispiele für Agentic AI angesehen haben, wollen wir erörtern, wie man eine solche aufbaut. 

Wenn Sie eine auf Computer Vision basierende Anwendung entwickeln, kann die Verwendung der neuesten Modelle wie Ultralytics YOLO11 Ihrem agentenbasierten KI-System helfen, seine Umgebung besser zu verstehen. Mit seiner Unterstützung für verschiedene Computer-Vision-Aufgaben kann YOLO11 es agentenbasierten KI-Systemen ermöglichen, visuelle Daten genau zu analysieren.

Hier erfahren Sie, wie Sie mit YOLO11 ein agentenbasiertes KI-System aufbauen können:

  • Ziele definieren: Definieren Sie klar den Zweck, die Ziele und die spezifischen Aufgaben des KI-Agenten, die er ausführen muss, um seine beabsichtigte Funktionalität zu erreichen.
  • Trainieren Sie YOLO11: Sammeln Sie relevante Bild- und Videodaten, beschriften Sie sie und trainieren Sie YOLO11 auf der Grundlage Ihrer spezifischen Anwendung.
  • Integrieren Sie YOLO11: Verbinden Sie YOLO11 mit einem KI-Framework, das Echtzeit-Analysen und Entscheidungsfindung auf der Grundlage von erkannten visuellen Daten ermöglicht.
  • Ermöglichen Sie autonome Entscheidungen: Richten Sie Logik- oder maschinelle Lernmodelle ein, die es dem KI-Agenten ermöglichen, auf der Grundlage der Erkennungen von YOLO11 Maßnahmen zu ergreifen, wie z. B. das Auslösen von Warnungen, das Anpassen von Einstellungen oder die Steuerung von Robotersystemen.
  • Feedback-Schleifen einbauen: Implementieren Sie ein selbstlernendes System, bei dem YOLO11 seine Genauigkeit durch erneutes Training mit neuen Daten verfeinert und so seine Modellleistung mit der Zeit verbessert.
__wf_reserved_inherit
Abbildung 5. Wie man ein agentenbasiertes KI-System mit YOLO11 aufbaut. Bild vom Autor.

Vor- und Nachteile eines agentischen KI-Systems

Hier sind einige der wichtigsten Vorteile, die agentische KI-Systeme in verschiedene Branchen einbringen können:

  • Erhöhte Effizienz: Agentic AI-Systeme können komplexe, zeitaufwändige Aufgaben automatisieren, Fehler reduzieren und menschliche Arbeitskräfte für höherwertige Tätigkeiten freisetzen.
  • Skalierbarkeit: Diese Systeme können problemlos an verschiedene Branchen angepasst werden und bei Bedarf wachsen, um größere Arbeitslasten zu bewältigen.
  • Kostenreduzierung: Durch die Reduzierung des Bedarfs an manueller Arbeit und die Optimierung von Abläufen hilft Agentic AI Unternehmen, Ausgaben zu senken und Ressourcen effektiver zu nutzen.

Agentic AI bietet zwar viele Vorteile in verschiedenen Sektoren, aber es ist auch wichtig, sich der potenziellen Einschränkungen bewusst zu sein, die damit einhergehen. Hier sind einige wichtige Punkte, die Sie beachten sollten:

  • Verzerrung (Bias) in KI: Agentische KI-Systeme können Verzerrungen aus Trainingsdaten übernehmen, was zu unfairen oder ungenauen Ergebnissen führt, insbesondere in Bereichen wie Einstellung und Strafverfolgung.
  • Mangel an Transparenz: Viele KI-Modelle funktionieren wie "Black Boxes", was es schwierig macht zu verstehen, wie sie Entscheidungen treffen, was in Branchen wie dem Gesundheitswesen und dem Finanzwesen ein Problem sein kann.
  • Herausforderungen bei der Regulierung: Die Entwicklung von Agentic AI schreitet schneller voran als die Vorschriften, was zu rechtlichen Unsicherheiten und inkonsistenten globalen Compliance-Standards führt.

Insgesamt ist es wichtig, bei allen Vorteilen von Agentic-KI-Systemen ein Gleichgewicht mit ethischen Erwägungen, Transparenz und angemessener Regulierung zu wahren, um sicherzustellen, dass sie verantwortungsvoll eingesetzt werden.

Wesentliche Erkenntnisse

In Kombination mit Vision-KI-Modellen wie YOLO11 können agentenbasierte KI-Systeme die Art und Weise, wie Automatisierung funktioniert, verändern. Von selbstfahrenden Autos über Online-Shopping bis hin zum Gesundheitswesen - diese Systeme helfen Unternehmen, autonom und schneller zu arbeiten. 

Es müssen jedoch noch Herausforderungen wie Voreingenommenheit, mangelnde Transparenz und unklare Vorschriften angegangen werden. Da sich agentische KI-Systeme verbessern, wird es entscheidend sein, das richtige Gleichgewicht zwischen Innovation und Verantwortung zu finden, um diese Innovationen optimal zu nutzen.

Treten Sie unserer Community und unserem GitHub-Repository bei, um mehr über KI zu erfahren. Entdecken Sie verschiedene Anwendungen von KI in der Fertigung und Computer Vision im Gesundheitswesen auf unseren Lösungsseiten. Probieren Sie unsere Ultralytics YOLO aus, um noch heute mit Computer Vision zu beginnen!

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten