Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten

Verhaltens-KI macht Computer Vision wirkungsvoller

Abirami Vina

4 Min. Lesezeit

6. Januar 2025

Seien Sie dabei, wenn wir David Scotts YOLO Vision 2024-Keynote über KI-gesteuerte Verhaltensanalyse und ihre realen Anwendungen in Bereichen wie der Tierhaltung wiederholen.

Seit vielen Jahren konzentrieren sich Innovationen im Bereich Computer Vision auf Aufgaben wie die Objekterkennung - die Identifizierung von Objekten wie einem Hund oder einem Auto in Bildern und Videos. Diese Ansätze haben Anwendungen in Bereichen wie autonomen Fahrzeugen, Fertigung und Gesundheitswesen ermöglicht. 

Diese Aufgaben konzentrieren sich jedoch oft nur darauf, zu identifizieren, was ein Objekt ist. Was wäre, wenn Vision-AI-Systeme noch einen Schritt weiter gehen könnten? Anstatt beispielsweise einfach einen Hund zu erkennen, könnte er verstehen, dass der Hund einem Ball hinterherjagt oder dass ein Auto plötzlich bremst, weil ein Fußgänger die Straße überquert. Diese Verlagerung von der einfachen Erkennung zum kontextuellen Verständnis stellt einen wichtigen Schritt hin zu einer intelligenteren, kontextbezogenen Verhaltens-KI dar.

Auf der YOLO Vision 2024 (YV24), der jährlichen Hybrid-Veranstaltung von Ultralytics, auf der die Fortschritte im Bereich Vision AI gefeiert werden, stand das Konzept der AI-gesteuerten Verhaltensanalyse im Mittelpunkt eines interessanten Vortrags von David Scott, CEO von The Main Branch.

In seinem Vortrag untersuchte David den Übergang von grundlegenden Computer-Vision-Aufgaben zur Verhaltensverfolgung. Mit über 25 Jahren Erfahrung im Aufbau modernster Technologieanwendungen zeigte er die Auswirkungen dieses Sprungs auf. Er betonte, wie die Entschlüsselung von Mustern und Verhaltensweisen Branchen wie die Landwirtschaft und den Tierschutz verändert.

In diesem Artikel werden wir die Highlights von Davids Vortrag durchgehen und untersuchen, wie Behavioral Tracking KI praktischer macht. 

Herausforderungen bei der Einführung von KI verstehen

David Scott begann seine Keynote mit einem mutigen Realitätscheck und sagte: “Ein Kollege von mir sagt oft: ‘Wissenschaft verkauft sich nicht’, was viele von uns hier vor den Kopf stößt, weil wir Wissenschaft wirklich mögen. KI ist wirklich cool - warum sollten die Leute sie nicht einfach kaufen? Aber die Realität ist, dass die Leute sie nicht einfach kaufen wollen, nur weil wir sie cool finden; sie brauchen einen Grund, sie zu kaufen.”

Er erklärte weiter, dass der Fokus in seiner Firma, The Main Branch, immer darauf liegt, reale Probleme mit KI zu lösen und nicht nur ihre Fähigkeiten zu demonstrieren. Viele Kunden kommen herein und wollen darüber sprechen, wie sie KI im Allgemeinen einsetzen können, aber er sieht das als einen rückwärtsgewandten Ansatz - es ist, als hätte man eine Lösung ohne ein Problem. Stattdessen arbeiten sie mit Kunden zusammen, die spezifische Herausforderungen mitbringen, damit sie KI-Lösungen entwickeln können, die tatsächlich etwas bewirken.

__wf_reserved_inherit
Abb. 1. David Scott auf der Bühne bei YV24.

David teilte auch mit, dass ihre Arbeit oft über das bloße Erkennen von Objekten in einer Szene hinausgeht. Festzustellen, was vorhanden ist, ist nur der erste Schritt. Der eigentliche Wert besteht darin, herauszufinden, was mit diesen Informationen anzufangen ist und wie man sie innerhalb der größeren Wertschöpfungskette nutzbar macht. 

Verhaltens-Tracking-Technologie: der Schlüssel zu umsetzbarer KI

Ein entscheidender Schritt, um KI wirklich nützlich zu machen, ist die Weiterentwicklung über grundlegende Computer-Vision-Aufgaben wie Objekterkennung hinaus und die Nutzung dieser Erkenntnisse für die Verhaltensverfolgung. David betonte, dass sich Behavioral AI auf das Verständnis von Aktionen und Mustern konzentriert, nicht nur auf die Identifizierung von Objekten. Dies ermöglicht es der KI, aussagekräftige Ereignisse zu erkennen und umsetzbare Erkenntnisse zu liefern.

Als Beispiel nannte er ein Tier, das sich auf dem Boden wälzt, was auf eine Krankheit hinweisen könnte. Während Menschen ein Tier nicht rund um die Uhr beobachten können, können KI-gesteuerte Überwachungssysteme mit Verhaltensverfolgungsfunktionen dies tun. Solche Lösungen können Objekte kontinuierlich überwachen, bestimmte Verhaltensweisen detect , einen Alarm senden und rechtzeitiges Handeln ermöglichen. Auf diese Weise werden Rohdaten in etwas Praktisches und Wertvolles verwandelt.

David demonstrierte auch, dass dieser Ansatz KI nicht nur interessant, sondern auch wirklich wirkungsvoll macht. Durch die Auseinandersetzung mit realen Problemen, wie der Überwachung von Verhaltensweisen und dem Handeln auf deren Grundlage, kann die Verhaltensverfolgung zu einem wichtigen Bestandteil effektiver KI-Lösungen in verschiedenen Branchen werden.

Behavioral AI zum Leben erwecken

David Scott erläuterte dann, wie Ultralytics YOLOv8ein Computer-Vision-Modell, einen Durchbruch für die Projekte seines Teams zur Verhaltensverfolgung darstellte. Es bot ihnen eine solide Grundlage für die Erkennung, Klassifizierung und Verfolgung von Objekten. Sein Team ging noch einen Schritt weiter und trainierte YOLOv8 so, dass es sich auf die Überwachung von Verhaltensweisen im Zeitverlauf konzentrierte, wodurch es praktischer und hilfreicher für reale Situationen wurde.

Interessant ist, dass mit der Veröffentlichung von Ultralytics YOLO11können Lösungen wie die von The Main Branch noch zuverlässiger und genauer werden. Dieses neueste Modell bietet Funktionen wie verbesserte Präzision und schnellere Verarbeitung, die seine Fähigkeit, Verhaltensweisen track , verbessern. Wir werden dies genauer erörtern, nachdem wir ein besseres Verständnis für die Anwendungen der verhaltensbasierten KI erlangt haben.

Als Nächstes wollen wir die Lösungen untersuchen, über die David gesprochen hat, und wie die Technologie zur Verfolgung von Verhaltensweisen in realen Anwendungen eingesetzt wird, um alltägliche Herausforderungen zu lösen und eine sinnvolle Wirkung zu erzielen.

HerdSense mit KI-gestützter Verhaltensanalyse

Zunächst berichtete David von einer spannenden Herausforderung, die sie mit einem Projekt namens HerdSense in Angriff genommen haben, bei dem es um die Überwachung des Gesundheitszustands von Tausenden von Kühen in einem riesigen Mastbetrieb ging. Ziel war es, das Verhalten der einzelnen Kühe track , um mögliche Gesundheitsprobleme zu erkennen. Das bedeutete, Zehntausende von Tieren gleichzeitig im Auge zu behalten, und das war keine einfache Aufgabe.

__wf_reserved_inherit
Abb. 2. HerdSense konzentriert sich auf die Überwachung und Identifizierung von Kühen mithilfe von Verhaltens-KI.

Um mit der Lösung des Problems der Identifizierung jeder Kuh und der Verfolgung ihres Verhaltens zu beginnen, veranstaltete Davids Team einen zweitägigen Workshop, um jedes mögliche Verhalten zu skizzieren, das sie überwachen mussten. Sie identifizierten insgesamt über 200 Verhaltensweisen.

Jedes der 200 Verhaltensweisen hing davon ab, einzelne Kühe genau erkennen zu können, da alle Daten an bestimmte Tiere gebunden sein mussten. Ein großes Problem war die Verfolgung von Kühen, wenn sie sich in Gruppen zusammenkauerten, was es erschwerte, einzelne Tiere zu sehen. 

Davids Team entwickelte ein Computer-Vision-System, um sicherzustellen, dass jede Kuh immer eindeutig identifiziert wurde, selbst in schwierigen Situationen. Sie konnten bestätigen, dass derselben Kuh immer dieselbe ID zugewiesen wurde, selbst wenn sie aus dem Blickfeld verschwand, sich mit anderen vermischte oder später wieder auftauchte.

Überwachung der Pferdegesundheit mit Computer Vision

Im Anschluss daran stellte David ein weiteres faszinierendes Projekt vor, bei dem ähnliche Techniken zur Verhaltensüberwachung von Pferden eingesetzt wurden. Bei diesem Projekt brauchte Davids Team nicht track IDs der einzelnen Pferde nicht so genau verfolgen wie bei den Kühen. Stattdessen konzentrierten sie sich auf bestimmte Verhaltensweisen und verfolgten Details wie das Fressverhalten und das allgemeine Aktivitätsniveau, um etwaige Gesundheitsprobleme frühzeitig zu erkennen. Das Erkennen kleiner Verhaltensänderungen könnte zu einem schnelleren Eingreifen führen, um eine bessere Versorgung zu gewährleisten und Probleme zu verhindern, bevor sie ernst werden.

__wf_reserved_inherit
Abb. 3. Überwachung von Pferden mit Hilfe von Verhaltens-KI.

Warum verhaltensbezogene KI nicht so einfach ist, wie sie scheint

David erörterte auch die Komplexität der Verhaltensverfolgung anhand eines faszinierenden Beispiels. Bei der Suche nach Möglichkeiten zur Verbesserung der Verhaltensanalyse stieß sein Team auf ein Unternehmen, das behauptete, Ladendiebstahl durch die Analyse bestimmter Körperhaltungen detect , z. B. wenn jemand die Hand in der Tasche hat. Auf den ersten Blick schien dies eine clevere Idee zu sein - bestimmte Bewegungen könnten doch auf verdächtiges Verhalten hindeuten, oder?

__wf_reserved_inherit
Abb. 4. Die Herausforderungen der Verhaltensverfolgungstechnologie verstehen.

Bei seinen weiteren Nachforschungen erkannte David jedoch die Grenzen dieser Methode. Eine einzelne Pose, wie z. B. eine Hand in der Hosentasche, bedeutet nicht zwangsläufig, dass jemand einen Ladendiebstahl begeht. Es könnte einfach darauf hindeuten, dass die Person entspannt ist, nachdenkt oder sogar friert. Das Problem bei der Fokussierung auf isolierte Posen besteht darin, dass der größere Kontext ignoriert wird. Verhalten ist nicht nur eine einzelne Handlung, sondern ein Muster von Handlungen im Laufe der Zeit, das von Kontext und Absicht geprägt ist.

David betonte, dass die echte Verhaltensverfolgung weitaus komplexer ist und einen ganzheitlichen Ansatz erfordert. Es geht darum, Handlungsabfolgen zu analysieren und zu verstehen, was sie im Gesamtbild bedeuten. Während die KI-Branche Fortschritte macht, merkte er an, dass noch Arbeit zu leisten ist, um die Verhaltensverfolgung so weiterzuentwickeln, dass sie aussagekräftige und genaue Erkenntnisse liefert.

Entwicklung intelligenterer Vision-KI-Modelle, die Aktionen verstehen

Anschließend nahm David die Zuhörer mit hinter die Kulissen, um ihnen zu zeigen, wie sein Team mit Hilfe von YOLOv8 eine Computer-Vision-Lösung zur Überwachung des Gesundheitszustands von Kühen entwickelt hat und welche Möglichkeiten die Posenschätzung bietet.

Sie begannen mit der Erstellung eines benutzerdefinierten Datensatzes für die Pose-Schätzung einer Kuh, wobei sie die Standardanzahl der Keypoints von 17 auf 145 erhöhten, um das Modell bei der Bewegungsanalyse zu verbessern. Anschließend wurde das Modell mit einem riesigen Datensatz von über 2 Millionen Bildern und 110 Millionen Verhaltensbeispielen trainiert. 

Mithilfe einer fortschrittlichen Hardware-Infrastruktur konnte Davids Team das Modell in nur zwei Tagen trainieren, statt Wochen, die es auf herkömmlicher Hardware gebraucht hätte. Das trainierte Modell wurde dann in einen benutzerdefinierten Verhaltenstracker integriert, der mehrere Videobilder gleichzeitig analysierte, um Muster in den Handlungen der Kühe detect .

Das Ergebnis war eine KI-gesteuerte Lösung, die acht verschiedene Verhaltensweisen von Kühen wie Fressen, Trinken und Liegen detect und track kann, um kleine Verhaltensänderungen zu erkennen, die auf gesundheitliche Probleme hinweisen könnten. So können Landwirte schnell handeln und das Herdenmanagement verbessern.

Die Zukunft der Verhaltens-KI

David schloss seinen Vortrag mit einer wichtigen Lektion für das Publikum ab: "Wenn man der KI keinen Raum für Fehler gibt, programmiert man sich selbst auf Misserfolg, denn am Ende des Tages ist sie statistisch." Er wies darauf hin, dass KI trotz ihrer Stärken nicht fehlerfrei ist. Sie ist ein Werkzeug, das aus Mustern lernt, und es wird immer wieder vorkommen, dass sie etwas nicht richtig macht. Anstatt diese Fehler zu fürchten, ist es wichtig, Systeme zu entwickeln, die mit ihnen umgehen und sich im Laufe der Zeit weiter verbessern können.

Dies gilt auch für die Computer-Vision-Modelle selbst. Ultralytics YOLO11 zum Beispiel, die neueste Version der Ultralytics YOLO , wurde unter Berücksichtigung der Notwendigkeit entwickelt, die Dinge im Vergleich zu YOLOv8 auf die nächste Stufe zu heben.

 

__wf_reserved_inherit
Abb. 5. Von YOLO11 unterstützte Bildverarbeitungsaufgaben.

Insbesondere bietet YOLO11 eine bessere Leistung, vor allem im Hinblick auf Echtzeitanwendungen, bei denen es auf Präzision ankommt, wie etwa in der Landwirtschaft und im Gesundheitswesen. Mit seinen fortschrittlichen Funktionen definiert YOLO11 die Art und Weise neu, wie Branchen KI nutzen, indem es innovative Echtzeit-Einsichten liefert und ihnen hilft, Herausforderungen effektiver zu bewältigen.

Wesentliche Erkenntnisse

Davids Keynote auf der YV24 war eine Erinnerung daran, dass KI mehr ist als nur eine coole Innovation - sie ist ein leistungsstarkes Werkzeug, um reale Probleme zu lösen und die Art und Weise, wie wir leben und arbeiten, zu verbessern. Indem sie sich auf das Verhalten konzentriert, hat KI bereits Auswirkungen in Bereichen wie der Verfolgung der Tiergesundheit und der Erkennung sinnvoller Muster in alltäglichen Handlungen. 

Das Potenzial für Verhaltens-KI ist aufregend, und wir stehen erst am Anfang. Indem sie Rohdaten in verwertbare Erkenntnisse umwandelt, geht Verhaltens-KI von passiver Überwachung zu aktiver Problemlösung über. Mit ihrer Weiterentwicklung wird Verhaltens-KI intelligentere Entscheidungen vorantreiben, Prozesse rationalisieren und unser Leben sinnvoll verbessern.

Bleiben Sie mit unserer Community in Verbindung, um mehr über KI und ihre realen Anwendungen zu erfahren. Besuchen Sie unser GitHub-Repository, um Innovationen in Bereichen wie KI in der Landwirtschaft und Computer Vision in der Fertigung zu entdecken.

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten