SharkEye verwendet Ultralytics YOLOv8 zur Objekterkennung

Abirami Vina

5 Minuten lesen

28. Januar 2025

Erfahren Sie, wie SharkEye, das auf der YOLO Vision 2024 vorgestellt wurde, Ultralytics YOLOv8 für die Objekterkennung in Echtzeit und die Sicherheit am Strand nutzt.

Die Überwachung von Tieren in ihrem natürlichen Lebensraum, sei es von Rindern, die auf einem Bauernhof grasen, oder von Haien, die sich in Ufernähe bewegen, war schon immer wichtig für ihre Sicherheit und ihr Wohlbefinden. Allerdings ist es nicht einfach, sie manuell zu beobachten. Es erfordert oft stundenlange Geduld und sorgfältige Konzentration, da die Beobachter genau auf Veränderungen im Verhalten oder in der Bewegung achten müssen. Selbst dann ist es leicht, subtile, aber wichtige Anzeichen zu übersehen.

Dank künstlicher Intelligenz (KI) wird dieser Prozess immer schneller, intelligenter und weitaus effizienter, was die Belastung der menschlichen Beobachter verringert und gleichzeitig die Genauigkeit erhöht. Insbesondere kann die Computer Vision eingesetzt werden, um Tiere zu verfolgen, Gefahren zu erkennen und Entscheidungen in Echtzeit zu treffen. Aufgaben, die früher Stunden dauerten, können jetzt in Minuten erledigt werden und eröffnen neue Möglichkeiten, das Verhalten von Tieren zu verstehen.

Auf der YOLO Vision 2024 (YV24), einer jährlichen Hybrid-Veranstaltung von Ultralytics, kamen Experten und Innovatoren zusammen, um zu erkunden, wie KI alltägliche Herausforderungen meistert. Zu den vorgestellten Themen gehörten Fortschritte in der Echtzeit-Objekterkennung und der Tierüberwachung, die zeigen, wie KI die Sicherheit und Effizienz in verschiedenen Bereichen verbessert.

Einer der Höhepunkte der Veranstaltung war ein Vortrag von Jim Griffin, dem Gründer der AI Master Group, in dem er demonstrierte, wie Vision AI Strände sicherer macht, indem Haie erkannt werden, bevor sie zu nahe ans Ufer kommen. Er erläuterte, wie Ultralytics YOLOv8, ein hochmodernes Computer-Vision-Modell, eingesetzt wird, um Haie in Echtzeit zu erkennen, selbst unter schwierigen Bedingungen wie kabbeligen Wellen, Blendung und Unterwasserhindernissen.

In diesem Artikel werfen wir einen genaueren Blick auf das SharkEye-Projekt und teilen interessante Erkenntnisse aus Jims Vortrag.

Lernen Sie SharkEye kennen: Eine Anwendung für Computer Vision

Zu Beginn seines Vortrags stellte Jim den Padaro Beach vor, ein bekanntes Surfrevier in Kalifornien, in dem sich Surfer und Haie oft die gleichen Gewässer teilen. Er wies auf die eigentliche Herausforderung bei der Erkennung von Haien hin: "Natürlich ist es einfach, einen Hai zu erkennen, wenn er dich beißt, also wollten wir die Haie vorher identifizieren.

__wf_reserved_inherit
Bild 1. Jim auf der Bühne der YOLO Vision 2024.

SharkEye wurde mit Unterstützung der University of California, Santa Barbara, entwickelt, um dieses Problem anzugehen. Jim beschrieb, wie Drohnen mit hochauflösenden KI-Kameras eingesetzt wurden, um etwa 200 Fuß über dem Wasser zu fliegen und den Ozean in Echtzeit zu scannen.

Wenn ein Hai entdeckt wird, erreichen die SMS-Warnungen etwa 80 Personen, darunter Rettungsschwimmer, Besitzer von Surfshops und alle, die sich für Updates angemeldet haben. Jim wies darauf hin, dass diese Sofortbenachrichtigungen eine schnelle Reaktion ermöglichen und die Sicherheit der Strandbesucher erhöhen, wenn sich ein Hai in der Nähe des Ufers befindet.

Jim erwähnte auch, dass SharkEye über ein Live-Dashboard verfügt, auf dem die Nutzer die Hai-Erkennungsstatistiken einsehen können. Zum Beispiel hat das System in 12 Wochen zwei große und 15 kleinere Haie identifiziert, im Durchschnitt also etwas mehr als einen Hai pro Woche.

Dann stellte er Neil Nathan vor, den Wissenschaftler, der die Bemühungen um SharkEye geleitet hat. Obwohl er einen Hintergrund in Umweltstudien und nicht in Informatik hat, hat Nathan das Projekt erfolgreich geleitet. Jim betonte, dass moderne KI-Tools, wie die in SharkEye verwendeten, so konzipiert sind, dass sie zugänglich sind und auch Personen ohne technischen Hintergrund in die Lage versetzen, wirkungsvolle Lösungen zu entwickeln.

Einsatz von Ultralytics YOLOv8 zum Aufspüren von Haien

Jim ging weiter ins Detail und erläuterte, was sich unter der Haube von SharkEye verbirgt und dass es bei der Hai-Erkennungslösung nicht nur um eine einfache Objekterkennungsaufgabe ging. Sie musste mit dynamischen, unvorhersehbaren Bedingungen wie schwimmendem Seetang fertig werden, der leicht mit einem Hai verwechselt werden konnte. Im Gegensatz zur Erkennung eines stationären Objekts erfordert die Identifizierung eines Hais Präzision und Anpassungsfähigkeit, was YOLOv8 zu einer idealen Wahl macht.

Ein weiterer Vorteil von YOLOv8 war, dass es auf einer Drohne eingesetzt werden konnte, ohne auf Cloud-Server angewiesen zu sein. Jim erläuterte, wie dieser Ansatz es SharkEye ermöglichte, sofortige Warnungen zu senden - ein wesentlicher Bestandteil der Gewährleistung rechtzeitiger Reaktionen unter unvorhersehbaren Meeresbedingungen.

Objekterkennung mit nur sechs Zeilen Code

Nachdem er die Funktionsweise von SharkEye und die dahinter stehende Zusammenarbeit erläutert hatte, präsentierte Jim eine Live-Demo.

Jim Griffin begann seine Live-Demo, indem er das Publikum durch ein vertrautes Beispiel führte - ein "Hallo Welt"-Codefragment für Ultralytics YOLO-Modelle. Mit nur sechs Zeilen Python-Code zeigte er, wie ein vortrainiertes Ultralytics YOLOv8-Modell mühelos einen Bus in einem Bild erkennen kann. 

__wf_reserved_inherit
Abb. 2. Eine Demo von Jim bei der YOLO Vision 2024.

In seiner Demo kam das Modell YOLOv8 Nano zum Einsatz, eine leichte Version für Geräte mit geringem Stromverbrauch wie Drohnen. Das gleiche Modell wurde in SharkEye für die Echtzeit-Erkennung von Haien verwendet. 

Um den Kontext zu verdeutlichen, erwähnte Jim, dass das Modell in der Demo auf COCO128 trainiert wurde, einer kleineren Teilmenge des weit verbreiteten COCO-Datensatzes. Der COCO-Datensatz enthält über 20.000 Bilder aus 80 verschiedenen Objektkategorien. Während COCO128 gut für schnelle Demonstrationen geeignet ist, wies er darauf hin, dass SharkEye etwas Robusteres benötigt - einen anwendungsspezifischen Datensatz zur Hai-Erkennung, der die Komplexität realer Szenarien bewältigen kann.

Kundenspezifisches Training YOLOv8 für SharkEye 

Laut Jim bestand der schwierigste Teil des SharkEye-Projekts nicht darin, das KI-Modell zu trainieren, sondern die richtigen Daten zu sammeln. Er kommentiert: "Die Hauptarbeit bei diesem Projekt war nicht die KI. Die Hauptarbeit bei diesem Projekt bestand darin, diese Drohnen fünf Jahre lang zu fliegen, die Bilder aus diesen Videos herauszufiltern und sie entsprechend zu kennzeichnen."

Er beschrieb, wie das Team 15.000 Bilder am Padaro Beach sammelte. Jedes Bild musste manuell beschriftet werden, um zwischen Haien, Seetang und anderen Objekten im Wasser unterscheiden zu können. Dieser Prozess war zwar langwierig und anspruchsvoll, legte aber den Grundstein für alles, was danach kam.

__wf_reserved_inherit
Abb. 3. Einsatz von Drohnen zur Aufnahme von Haibildern für die Objekterkennung in Echtzeit.

Sobald der Datensatz fertig war, wurde Ultralytics YOLOV8 auf ihm trainiert. Jim sagte: "Das eigentliche Training war nicht der schwierige Teil - es dauerte nur 20 Stunden auf T4-GPUs [Graphics Processing Units]." Er fügte hinzu, dass die Zeit mit leistungsfähigerer Hardware, z. B. A100-Grafikprozessoren, auf bis zu fünf Stunden hätte verkürzt werden können.

Bewertung von SharkEye: Präzision vor Rückruf

Anschließend erläuterte Jim, wie die Leistung von SharkEye bewertet wurde. Er erläuterte, dass die wichtigste Kennzahl die Präzision war - wie genau das System die tatsächlichen Haie identifizierte. SharkEye erreichte eine beeindruckende Genauigkeit von 92 %. Damit erwies sich das Modell als äußerst effektiv bei der genauen Identifizierung von Haien inmitten der komplexen Meeresumgebung.

Als er die Bedeutung der Genauigkeit genauer untersuchte, stellte Jim klar, warum in diesem Fall die Genauigkeit wichtiger war als die Rückrufquote. "Meistens sind die Leute an der Wiedererkennung interessiert, vor allem in Bereichen wie dem Gesundheitswesen, wo das Übersehen eines positiven Falls kritisch sein kann. Aber in diesem Fall wussten wir nicht, wie viele Haie es da draußen gab, also ging es uns um die Präzision", erklärte er. SharkEye sorgte dafür, dass Fehlalarme auf ein Minimum reduziert wurden, indem es sich auf die Präzision konzentrierte, was es Rettungsschwimmern und anderen Einsatzkräften erleichterte, schnell zu handeln.

__wf_reserved_inherit
Abb. 4. Jim bei der Präsentation von SharkEye auf der YOLO Vision 2024.

Zum Abschluss seines Vortrags verglich er die KI mit der menschlichen Leistung und stellte fest, dass die Genauigkeit von SharkEye mit 92 % die 60 % der menschlichen Experten bei weitem übertrifft. Er betonte diesen Unterschied und sagte: "Das liegt daran, dass wir Menschen sind. Wenn wir den ganzen Tag vor einem Bildschirm sitzen und nach Haien Ausschau halten müssen, werden wir irgendwann abschweifen, egal, wie gut wir sind. Anders als Menschen ermüden KI-Modelle nicht und lassen sich nicht ablenken, was sie zu einer zuverlässigen Lösung für Aufgaben macht, die eine kontinuierliche Überwachung erfordern.

Ultralytics YOLO11: Das neueste YOLO

Ein faszinierendes Zitat aus dem Vortrag von Jim Griffin, "Sechs Zeilen Code könnten eines Tages Ihr Leben retten", fasst perfekt zusammen, wie fortschrittlich und doch zugänglich KI geworden ist. Die YOLO-Modelle von Ultralytics wurden in diesem Sinne entwickelt, um Entwicklern und Unternehmen jeder Größe den Zugang zu modernster Computer-Vision-Technologie zu ermöglichen. Ultralytics YOLO11 baut mit schnelleren Schlussfolgerungen und höherer Genauigkeit darauf auf. 

Hier ein kurzer Blick auf das, was YOLO11 auszeichnet:

  • Neu gestaltete Architektur: Die verbesserte Backbone- und Neck-Architektur ermöglicht eine bessere Merkmalsextraktion und höhere Präzision.
  • Einfacher Gebrauch: Der Zugriff erfolgt über Python-Codierung oder codierungsfreie Tools wie Ultralytics HUB.
  • Flexibilität bei verschiedenen Aufgaben: YOLO11 unterstützt Computer-Vision-Aufgaben wie Objekterkennung, Instanzsegmentierung, Bildklassifizierung, Tracking, Pose Estimation und Oriented Bounding Boxes (OBB).
  • Verbesserte Genauigkeit: YOLO11 erreicht im Vergleich zu YOLOv8m auf dem COCO-Datensatz eine um 22 % höhere durchschnittliche Genauigkeit (mAP) und liefert damit präzisere Erkennungen.

Dank dieser Funktionen eignet sich YOLO11 hervorragend für die Verfolgung von Tierverhalten in dynamischen Umgebungen, sei es auf einem Bauernhof oder in freier Wildbahn.

Die wichtigsten Erkenntnisse

Die Fortschritte im Bereich der künstlichen Intelligenz erleichtern die Bewältigung realer Herausforderungen, indem sie praktische Werkzeuge für verschiedene Bereiche bereitstellen. So können beispielsweise Computer-Vision-Modelle wie YOLO11 für die Echtzeitüberwachung und -verfolgung von Tieren eingesetzt werden, selbst unter schwierigen Bedingungen. 

Jim Griffins Keynote bei YV24 veranschaulichte, wie YOLOv8 genutzt werden kann, um komplexe Probleme mit minimalem Programmieraufwand zu lösen. Das Projekt SharkEye, das Drohnen mit KI zur Hai-Erkennung in Echtzeit kombiniert, zeigte, wie Technologie die Sicherheit am Strand verbessern kann. 

Es war eine faszinierende Fallstudie darüber, wie zugänglich KI Menschen mit unterschiedlichem Hintergrund in die Lage versetzt, effektive Lösungen zu entwickeln. Die fortschreitende Entwicklung der KI verändert Branchen und ermöglicht es dem Einzelnen, ihr Potenzial zu nutzen, um die Welt sicherer, intelligenter und effizienter zu machen.

Werden Sie Teil unserer Community und erkunden Sie unser GitHub-Repository, um tiefer in die KI einzutauchen. Von Computer Vision in der Landwirtschaft bis hin zu KI in selbstfahrenden Autos- sehen Sie, wie diese Technologien Innovationen vorantreiben. Informieren Sie sich über unsere Lizenzierungsoptionen und beginnen Sie noch heute mit Ihren KI-Projekten!

Lassen Sie uns gemeinsam die Zukunft
der KI gestalten!

Beginnen Sie Ihre Reise in die Zukunft des maschinellen Lernens

Kostenloser Start
Link in die Zwischenablage kopiert