Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024

Verhaltens-KI macht Computer Vision wirkungsvoller

Abirami Vina

4 Min. Lesezeit

6. Januar 2025

Begleite uns bei der Wiederaufnahme von David Scotts YOLO Vision 2024 Keynote über KI-gesteuerte Verhaltensanalyse und ihre realen Anwendungen in Sektoren wie der Tierhaltung.

Seit vielen Jahren konzentrieren sich Innovationen im Bereich Computer Vision auf Aufgaben wie die Objekterkennung - die Identifizierung von Objekten wie einem Hund oder einem Auto in Bildern und Videos. Diese Ansätze haben Anwendungen in Bereichen wie autonomen Fahrzeugen, Fertigung und Gesundheitswesen ermöglicht. 

Diese Aufgaben konzentrieren sich jedoch oft nur darauf, zu identifizieren, was ein Objekt ist. Was wäre, wenn Vision-AI-Systeme noch einen Schritt weiter gehen könnten? Anstatt beispielsweise einfach einen Hund zu erkennen, könnte er verstehen, dass der Hund einem Ball hinterherjagt oder dass ein Auto plötzlich bremst, weil ein Fußgänger die Straße überquert. Diese Verlagerung von der einfachen Erkennung zum kontextuellen Verständnis stellt einen wichtigen Schritt hin zu einer intelligenteren, kontextbezogenen Verhaltens-KI dar.

Auf der YOLO Vision 2024 (YV24), der jährlichen Hybridveranstaltung von Ultralytics zur Feier der Fortschritte im Bereich Vision AI, stand das Konzept der KI-gesteuerten Verhaltensanalyse im Mittelpunkt eines interessanten Vortrags von David Scott, CEO von The Main Branch.

In seinem Vortrag untersuchte David den Übergang von grundlegenden Computer-Vision-Aufgaben zur Verhaltensverfolgung. Mit über 25 Jahren Erfahrung im Aufbau modernster Technologieanwendungen zeigte er die Auswirkungen dieses Sprungs auf. Er betonte, wie die Entschlüsselung von Mustern und Verhaltensweisen Branchen wie die Landwirtschaft und den Tierschutz verändert.

In diesem Artikel werden wir die Highlights von Davids Vortrag durchgehen und untersuchen, wie Behavioral Tracking KI praktischer macht. 

Herausforderungen bei der Einführung von KI verstehen

David Scott begann seine Keynote mit einem mutigen Realitätscheck und sagte: “Ein Kollege von mir sagt oft: ‘Wissenschaft verkauft sich nicht’, was viele von uns hier vor den Kopf stößt, weil wir Wissenschaft wirklich mögen. KI ist wirklich cool - warum sollten die Leute sie nicht einfach kaufen? Aber die Realität ist, dass die Leute sie nicht einfach kaufen wollen, nur weil wir sie cool finden; sie brauchen einen Grund, sie zu kaufen.”

Er erklärte weiter, dass der Fokus in seiner Firma, The Main Branch, immer darauf liegt, reale Probleme mit KI zu lösen und nicht nur ihre Fähigkeiten zu demonstrieren. Viele Kunden kommen herein und wollen darüber sprechen, wie sie KI im Allgemeinen einsetzen können, aber er sieht das als einen rückwärtsgewandten Ansatz - es ist, als hätte man eine Lösung ohne ein Problem. Stattdessen arbeiten sie mit Kunden zusammen, die spezifische Herausforderungen mitbringen, damit sie KI-Lösungen entwickeln können, die tatsächlich etwas bewirken.

__wf_reserved_inherit
Abb. 1. David Scott auf der Bühne bei YV24.

David teilte auch mit, dass ihre Arbeit oft über das bloße Erkennen von Objekten in einer Szene hinausgeht. Festzustellen, was vorhanden ist, ist nur der erste Schritt. Der eigentliche Wert besteht darin, herauszufinden, was mit diesen Informationen anzufangen ist und wie man sie innerhalb der größeren Wertschöpfungskette nutzbar macht. 

Verhaltens-Tracking-Technologie: der Schlüssel zu umsetzbarer KI

Ein entscheidender Schritt, um KI wirklich nützlich zu machen, ist die Weiterentwicklung über grundlegende Computer-Vision-Aufgaben wie Objekterkennung hinaus und die Nutzung dieser Erkenntnisse für die Verhaltensverfolgung. David betonte, dass sich Behavioral AI auf das Verständnis von Aktionen und Mustern konzentriert, nicht nur auf die Identifizierung von Objekten. Dies ermöglicht es der KI, aussagekräftige Ereignisse zu erkennen und umsetzbare Erkenntnisse zu liefern.

Er nannte als Beispiel ein Tier, das sich auf dem Boden wälzt, was auf eine Krankheit hindeuten könnte. Während Menschen ein Tier nicht rund um die Uhr beobachten können, können dies KI-gestützte Überwachungssysteme mit Verhaltensverfolgung. Solche Lösungen können Objekte kontinuierlich überwachen, bestimmte Verhaltensweisen erkennen, einen Alarm senden und rechtzeitiges Handeln ermöglichen. Dies verwandelt Rohdaten in etwas Praktisches und Wertvolles.

David demonstrierte auch, dass dieser Ansatz KI nicht nur interessant, sondern auch wirklich wirkungsvoll macht. Durch die Auseinandersetzung mit realen Problemen, wie der Überwachung von Verhaltensweisen und dem Handeln auf deren Grundlage, kann die Verhaltensverfolgung zu einem wichtigen Bestandteil effektiver KI-Lösungen in verschiedenen Branchen werden.

Behavioral AI zum Leben erwecken

David Scott veranschaulichte dann, wie Ultralytics YOLOv8, ein Computer-Vision-Modell, ein Durchbruch für die Verhaltensverfolgungsprojekte seines Teams war. Es gab ihnen eine solide Grundlage für die Erkennung, Klassifizierung und Verfolgung von Objekten. Sein Team ging auch noch einen Schritt weiter und trainierte YOLOv8 kundenspezifisch, um sich auf die Überwachung von Verhaltensweisen im Zeitverlauf zu konzentrieren, was es für reale Situationen praktischer und hilfreicher machte.

Interessanterweise können mit der Veröffentlichung von Ultralytics YOLO11 Lösungen, wie sie von The Main Branch entwickelt wurden, noch zuverlässiger und genauer werden. Dieses neueste Modell bietet Funktionen wie verbesserte Präzision und schnellere Verarbeitung, die seine Fähigkeit zur Verfolgung von Verhaltensweisen verbessern. Wir werden dies im Detail erörtern, nachdem wir ein besseres Verständnis für die Anwendungen erhalten haben, für die Verhaltens-KI eingesetzt werden kann.

Als Nächstes wollen wir die Lösungen untersuchen, über die David gesprochen hat, und wie die Technologie zur Verfolgung von Verhaltensweisen in realen Anwendungen eingesetzt wird, um alltägliche Herausforderungen zu lösen und eine sinnvolle Wirkung zu erzielen.

HerdSense mit KI-gestützter Verhaltensanalyse

Zuerst berichtete David von einer spannenden Herausforderung, die sie mit einem Projekt namens HerdSense bewältigten. Dabei ging es um die Überwachung der Gesundheit von Tausenden von Kühen auf einem riesigen Futterplatz. Ziel war es, das Verhalten einzelner Kühe zu verfolgen, um potenzielle Gesundheitsprobleme zu erkennen. Das bedeutete, Zehntausende von Tieren gleichzeitig im Auge zu behalten, was keine einfache Aufgabe war.

__wf_reserved_inherit
Abb. 2. HerdSense konzentriert sich auf die Überwachung und Identifizierung von Kühen mithilfe von Verhaltens-KI.

Um mit der Lösung des Problems der Identifizierung jeder Kuh und der Verfolgung ihres Verhaltens zu beginnen, veranstaltete Davids Team einen zweitägigen Workshop, um jedes mögliche Verhalten zu skizzieren, das sie überwachen mussten. Sie identifizierten insgesamt über 200 Verhaltensweisen.

Jedes der 200 Verhaltensweisen hing davon ab, einzelne Kühe genau erkennen zu können, da alle Daten an bestimmte Tiere gebunden sein mussten. Ein großes Problem war die Verfolgung von Kühen, wenn sie sich in Gruppen zusammenkauerten, was es erschwerte, einzelne Tiere zu sehen. 

Davids Team entwickelte ein Computer-Vision-System, um sicherzustellen, dass jede Kuh immer eindeutig identifiziert wurde, selbst in schwierigen Situationen. Sie konnten bestätigen, dass derselben Kuh immer dieselbe ID zugewiesen wurde, selbst wenn sie aus dem Blickfeld verschwand, sich mit anderen vermischte oder später wieder auftauchte.

Überwachung der Pferdegesundheit mit Computer Vision

David stellte ein weiteres faszinierendes Projekt vor, bei dem sie ähnliche Verhaltensverfolgungstechniken zur Überwachung von Pferden einsetzten. In diesem Projekt musste Davids Team die einzelnen Pferde-IDs nicht so genau verfolgen wie bei den Kühen. Stattdessen konzentrierten sie sich auf bestimmte Verhaltensweisen und verfolgten Details wie Essgewohnheiten und allgemeine Aktivitätsniveaus, um gesundheitliche Probleme frühzeitig zu erkennen. Das Erkennen kleiner Verhaltensänderungen könnte zu schnelleren Interventionen führen, um eine bessere Versorgung zu gewährleisten und Probleme zu vermeiden, bevor sie ernst werden.

__wf_reserved_inherit
Abb. 3. Überwachung von Pferden mit Hilfe von Verhaltens-KI.

Warum verhaltensbezogene KI nicht so einfach ist, wie sie scheint

David erörterte die Komplexität der Verhaltensverfolgung anhand eines faszinierenden Beispiels. Bei der Erforschung von Möglichkeiten zur Verbesserung der Verhaltensanalyse stieß sein Team auf ein Unternehmen, das behauptete, Ladendiebstahl zu erkennen, indem es bestimmte Posen analysierte, z. B. wenn jemand die Hand in der Tasche hat. Zuerst schien dies eine clevere Idee zu sein - bestimmte Bewegungen könnten auf verdächtiges Verhalten hindeuten, oder?

__wf_reserved_inherit
Abb. 4. Die Herausforderungen der Verhaltensverfolgungstechnologie verstehen.

Bei seinen weiteren Nachforschungen erkannte David jedoch die Grenzen dieser Methode. Eine einzelne Pose, wie z. B. eine Hand in der Hosentasche, bedeutet nicht zwangsläufig, dass jemand einen Ladendiebstahl begeht. Es könnte einfach darauf hindeuten, dass die Person entspannt ist, nachdenkt oder sogar friert. Das Problem bei der Fokussierung auf isolierte Posen besteht darin, dass der größere Kontext ignoriert wird. Verhalten ist nicht nur eine einzelne Handlung, sondern ein Muster von Handlungen im Laufe der Zeit, das von Kontext und Absicht geprägt ist.

David betonte, dass die echte Verhaltensverfolgung weitaus komplexer ist und einen ganzheitlichen Ansatz erfordert. Es geht darum, Handlungsabfolgen zu analysieren und zu verstehen, was sie im Gesamtbild bedeuten. Während die KI-Branche Fortschritte macht, merkte er an, dass noch Arbeit zu leisten ist, um die Verhaltensverfolgung so weiterzuentwickeln, dass sie aussagekräftige und genaue Erkenntnisse liefert.

Entwicklung intelligenterer Vision-KI-Modelle, die Aktionen verstehen

Anschließend führte David das Publikum hinter die Kulissen, um ihnen zu zeigen, wie sein Team mit Hilfe von YOLOv8 und seinen Pose-Schätzungsfunktionen eine Computer-Vision-Lösung zur Überwachung der Gesundheit von Kühen entwickelte.

Sie begannen mit der Erstellung eines benutzerdefinierten Datensatzes für die Pose-Schätzung einer Kuh, wobei sie die Standardanzahl der Keypoints von 17 auf 145 erhöhten, um das Modell bei der Bewegungsanalyse zu verbessern. Anschließend wurde das Modell mit einem riesigen Datensatz von über 2 Millionen Bildern und 110 Millionen Verhaltensbeispielen trainiert. 

Durch die Verwendung einer fortschrittlichen Hardwareinfrastruktur konnte Davids Team das Modell in nur zwei Tagen trainieren, anstatt in den Wochen, die es auf herkömmlicher Hardware gedauert hätte. Das trainierte Modell wurde dann in einen benutzerdefinierten Verhaltens-Tracker integriert, der mehrere Videobilder gleichzeitig analysierte, um Muster in den Aktionen der Kühe zu erkennen.

Das Ergebnis war eine Vision-AI-gesteuerte Lösung, die acht verschiedene Kuhverhaltensweisen wie Fressen, Trinken und Liegen erkennen und verfolgen kann, um geringfügige Verhaltensänderungen zu erkennen, die auf gesundheitliche Probleme hindeuten könnten. Dies ermöglicht es Landwirten, schnell zu handeln und das Herdenmanagement zu verbessern.

Die Zukunft der Verhaltens-KI

David schloss seinen Vortrag mit einer wichtigen Lektion für das Publikum ab: "Wenn man der KI keinen Raum für Fehler gibt, programmiert man sich selbst auf Misserfolg, denn am Ende des Tages ist sie statistisch." Er wies darauf hin, dass KI trotz ihrer Stärken nicht fehlerfrei ist. Sie ist ein Werkzeug, das aus Mustern lernt, und es wird immer wieder vorkommen, dass sie etwas nicht richtig macht. Anstatt diese Fehler zu fürchten, ist es wichtig, Systeme zu entwickeln, die mit ihnen umgehen und sich im Laufe der Zeit weiter verbessern können.

Dies gilt auch für Computer-Vision-Modelle selbst. Zum Beispiel wurde Ultralytics YOLO11, die neueste Version der Ultralytics YOLO-Modelle, mit dem Ziel entwickelt, die Dinge im Vergleich zu YOLOv8 auf die nächste Stufe zu heben.

 

__wf_reserved_inherit
Abb. 5. Von YOLO11 unterstützte Computer-Vision-Aufgaben.

Insbesondere bietet YOLO11 eine bessere Leistung, insbesondere in Bezug auf Echtzeitanwendungen, bei denen Präzision entscheidend ist, wie in der Landwirtschaft und im Gesundheitswesen. Mit seinen fortschrittlichen Funktionen definiert YOLO11 die Art und Weise, wie Industrien KI einsetzen, neu, indem es innovative Echtzeit-Einblicke bietet und ihnen hilft, Herausforderungen effektiver zu bewältigen.

Wesentliche Erkenntnisse

Davids Keynote auf der YV24 war eine Erinnerung daran, dass KI mehr ist als nur eine coole Innovation - sie ist ein leistungsstarkes Werkzeug, um reale Probleme zu lösen und die Art und Weise, wie wir leben und arbeiten, zu verbessern. Indem sie sich auf das Verhalten konzentriert, hat KI bereits Auswirkungen in Bereichen wie der Verfolgung der Tiergesundheit und der Erkennung sinnvoller Muster in alltäglichen Handlungen. 

Das Potenzial für Verhaltens-KI ist aufregend, und wir stehen erst am Anfang. Indem sie Rohdaten in verwertbare Erkenntnisse umwandelt, geht Verhaltens-KI von passiver Überwachung zu aktiver Problemlösung über. Mit ihrer Weiterentwicklung wird Verhaltens-KI intelligentere Entscheidungen vorantreiben, Prozesse rationalisieren und unser Leben sinnvoll verbessern.

Bleiben Sie mit unserer Community in Verbindung, um mehr über KI und ihre realen Anwendungen zu erfahren. Besuchen Sie unser GitHub-Repository, um Innovationen in Bereichen wie KI in der Landwirtschaft und Computer Vision in der Fertigung zu entdecken.

Lasst uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise mit der Zukunft des maschinellen Lernens

Kostenlos starten
Link in die Zwischenablage kopiert