Yolo Vision Shenzhen
Shenzhen
Iscriviti ora

SharkEye utilizza Ultralytics YOLOv8 per il rilevamento degli oggetti

Scoprite come SharkEye, presentato a YOLO Vision 2024, sfrutta Ultralytics YOLOv8 per il rilevamento di oggetti in tempo reale e la sicurezza in spiaggia.

Monitorare gli animali nei loro habitat naturali, che si tratti di bestiame al pascolo in una fattoria o di squali che si muovono vicino alla riva, è sempre stato importante per la loro sicurezza e il loro benessere. Tuttavia, osservarli manualmente non è facile. Spesso può richiedere ore di pazienza e attenzione, poiché gli osservatori devono osservare attentamente eventuali cambiamenti nel comportamento o nel movimento. Anche in questo caso, è facile perdere segnali sottili ma importanti.

Grazie all'intervento dell'intelligenza artificiale (AI), questo processo sta diventando più veloce, più intelligente e molto più efficiente, riducendo lo sforzo degli osservatori umani e migliorando la precisione. In particolare, la computer vision può essere utilizzata per track animali, individuare i pericoli e prendere decisioni in tempo reale. Compiti che un tempo richiedevano ore possono ora essere svolti in pochi minuti, aprendo nuove strade alla comprensione del comportamento animale.

In occasione di YOLO Vision 2024 (YV24), un evento ibrido annuale ospitato da Ultralytics, esperti e innovatori si sono riuniti per esplorare come l'IA sta affrontando le sfide quotidiane. Tra gli argomenti presentati, i progressi nel rilevamento di oggetti in tempo reale e nel monitoraggio degli animali, a dimostrazione di come l'IA stia migliorando la sicurezza e l'efficienza in vari settori.

Uno dei momenti salienti dell'evento è stato l'intervento di Jim Griffin, fondatore di AI Master Group, che ha dimostrato come Vision AI stia rendendo più sicure le spiagge individuando gli squali prima che si avvicinino troppo alla riva. Ha spiegato come hanno utilizzato Ultralytics YOLOv8un modello di visione computerizzata all'avanguardia, per identificare con precisione gli squali in tempo reale, anche in condizioni difficili come onde agitate, riflessi e ostacoli subacquei.

In questo articolo, esamineremo più da vicino il progetto SharkEye e condivideremo interessanti approfondimenti dal discorso di Jim.

Conoscere SharkEye: Un'applicazione di computer vision

Jim ha iniziato il suo intervento presentando Padaro Beach, una nota destinazione per il surf in California dove surfisti e squali spesso condividono le stesse acque. Sottolineando la vera sfida dell'individuazione degli squali, ha detto: "Ovviamente è facile detect uno squalo se ti morde, quindi quello che volevamo fare era identificare gli squali in anticipo".

__wf_reserved_inherit
Figura 1. Jim sul palco di YOLO Vision 2024.

SharkEye è stato creato per affrontare questo problema, con il supporto dell'Università della California, Santa Barbara. Jim ha descritto come i droni con telecamere AI ad alta risoluzione sono stati utilizzati per volare a circa 200 piedi sopra l'acqua, scansionando l'oceano in tempo reale.

Se viene rilevato uno squalo, gli avvisi SMS raggiungono circa 80 persone, tra cui bagnini, proprietari di negozi di surf e chiunque si sia iscritto per ricevere aggiornamenti. Jim ha sottolineato come queste notifiche istantanee consentano risposte rapide, mantenendo i bagnanti più sicuri quando uno squalo è vicino alla riva.

Jim ha anche menzionato che SharkEye dispone di una dashboard live dove gli utenti possono vedere le statistiche di rilevamento degli squali. Ad esempio, in 12 settimane, il sistema ha identificato due grandi squali e 15 più piccoli, con una media di poco più di uno squalo a settimana.

Ha quindi presentato Neil Nathan, lo scienziato che ha guidato gli sforzi dietro SharkEye. Nonostante avesse un background in studi ambientali piuttosto che in informatica, Nathan ha guidato con successo il progetto. Jim ha sottolineato come gli strumenti di intelligenza artificiale moderni, come quelli utilizzati in SharkEye, siano progettati per essere accessibili, consentendo a persone provenienti da contesti non tecnici di sviluppare soluzioni di grande impatto.

Utilizzo di Ultralytics YOLOv8 per detect squali

Approfondendo i dettagli, Jim ha spiegato cosa c'è sotto il cofano di SharkEye e come la soluzione per il rilevamento degli squali non si limiti a un semplice compito di rilevamento di oggetti. Doveva affrontare condizioni dinamiche e imprevedibili, come le alghe galleggianti che potevano essere facilmente scambiate per squali. A differenza dell'individuazione di un oggetto fermo, l'identificazione di uno squalo richiede precisione e adattabilità, rendendo YOLOv8 la scelta ideale.

Un altro vantaggio di YOLOv8 è che può essere implementato su un drone senza fare affidamento sui server cloud. Jim ha spiegato come questo approccio abbia permesso a SharkEye di inviare avvisi immediati, una parte essenziale per garantire risposte tempestive in condizioni oceaniche imprevedibili.

Object detection con sole sei righe di codice

Dopo aver evidenziato come funziona SharkEye e lo sforzo collaborativo che ne è alla base, Jim ha presentato una demo dal vivo.

Jim Griffin ha iniziato la sua dimostrazione dal vivo guidando il pubblico attraverso un esempio familiare: un frammento di codice "hello world" per i modelliYOLO diUltralytics . Con sole sei righe di codice Python , ha mostrato come un modello Ultralytics YOLOv8 pre-addestrato possa detect senza problemi un autobus in un'immagine. 

__wf_reserved_inherit
Figura 2. Una dimostrazione di Jim a YOLO Vision 2024.

La sua dimostrazione ha utilizzato il modello YOLOv8 Nano, una versione leggera per dispositivi a bassa potenza come i droni. Lo stesso modello è stato utilizzato in SharkEye per il rilevamento degli squali in tempo reale. 

Per fornire un contesto più ampio, Jim ha detto che il modello della dimostrazione è stato addestrato su COCO128, un sottoinsieme più piccolo del datasetCOCO , ampiamente utilizzato . Il dataset COCO contiene oltre 20.000 immagini di 80 diverse categorie di oggetti. Sebbene COCO128 vada bene per le dimostrazioni veloci, ha sottolineato che SharkEye aveva bisogno di qualcosa di più robusto, un dataset per il rilevamento degli squali specifico per le applicazioni, in grado di gestire le complessità degli scenari reali.

Addestramento personalizzato di YOLOv8 per SharkEye 

Secondo Jim, la parte più difficile del progetto SharkEye non è stata l'addestramento del modello AI, ma la raccolta dei dati giusti. Ha commentato: "Il lavoro principale di questo progetto non è stato l'AI. Il lavoro principale di questo progetto è stato far volare quei droni per cinque anni, selezionare le immagini da quei video e taggarle in modo appropriato."

Ha descritto come il team ha raccolto 15.000 immagini a Padaro Beach. Ogni immagine doveva essere etichettata manualmente per distinguere tra squali, alghe e altri oggetti nell'acqua. Sebbene il processo sia stato lento e impegnativo, ha gettato le basi per tutto ciò che è seguito.

__wf_reserved_inherit
Fig. 3. Utilizzo di droni per acquisire immagini di squali per l'object detection in tempo reale.

Una volta pronto il set di dati, Ultralytics YOLOV8 è stato addestrato su misura. Jim ha dichiarato: "L'addestramento vero e proprio non è stata la parte più difficile: ci sono volute solo 20 ore su GPU T4 [unità di elaborazione grafica]". Ha anche aggiunto che il tempo avrebbe potuto essere ridotto a meno di cinque ore con hardware più potente, come le GPU A100.

Valutazione di SharkEye: Precisione rispetto al richiamo

Successivamente, Jim ha discusso di come sono state valutate le prestazioni di SharkEye. Ha illustrato che la metrica chiave era la precisione: quanto accuratamente il sistema identificava gli squali reali. Con SharkEye che ha raggiunto un'impressionante precisione del 92%, il modello si è dimostrato altamente efficace nell'identificare accuratamente gli squali nel complesso ambiente oceanico.

Approfondendo l'importanza della precisione, Jim ha chiarito perché la precisione contava più del richiamo in questo caso. "La maggior parte delle volte, le persone sono interessate al richiamo, specialmente in aree come l'assistenza sanitaria dove perdere un caso positivo può essere critico. Ma in questo caso, non sapevamo quanti squali ci fossero là fuori, quindi ciò a cui tenevamo era la precisione", ha spiegato. SharkEye ha garantito che i falsi allarmi fossero ridotti al minimo concentrandosi sulla precisione, rendendo più facile per i bagnini e altri soccorritori agire rapidamente.

__wf_reserved_inherit
Figura 4. Jim presenta SharkEye a YOLO Vision 2024.

Ha concluso il suo intervento confrontando l'IA con le prestazioni umane, osservando che la precisione del 92% di SharkEye superava di gran lunga l'accuratezza del 60% degli esperti umani. Ha sottolineato questo divario, dicendo: "È perché siamo umani. Non importa quanto esperti possiate essere voi o io, se dobbiamo stare seduti davanti a uno schermo tutto il giorno a cercare squali, alla fine, lasceremo vagare le nostre menti". A differenza delle persone, i modelli di IA non si stancano né si distraggono, il che li rende una soluzione affidabile per le attività che richiedono un monitoraggio continuo.

Ultralytics YOLO11: l'ultimo YOLO

Un'intrigante citazione tratta dall'intervento di Jim Griffin, "Sei righe di codice potrebbero salvarvi la vita un giorno", coglie perfettamente quanto l'intelligenza artificiale sia diventata avanzata ma accessibile. I modelliYOLO di Ultralytics sono stati creati con questo obiettivo, rendendo la tecnologia di computer vision all'avanguardia accessibile a sviluppatori e aziende di ogni dimensione. Ultralytics YOLO11 si basa su questo principio con inferenze più rapide e una maggiore precisione. 

Ecco un rapido sguardo a ciò che distingue YOLO11 :

  • Architettura riprogettata: la sua architettura backbone e neck migliorata consente una migliore estrazione delle caratteristiche e una maggiore precisione.
  • Facilità d'uso: Si può accedere attraverso la codifica Python o strumenti no-code come Ultralytics HUB.
  • Flessibilità tra i compiti: YOLO11 supporta attività di computer vision come il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, il tracking, la stima della posa e le bounding box orientate (OBB).
  • Accuratezza migliorata: YOLO11 raggiunge una precisione mediamAP) superiore del 22% rispetto a YOLOv8m sul set di dati COCO , fornendo rilevamenti più precisi.

Queste caratteristiche rendono YOLO11 ideale per il monitoraggio del comportamento degli animali in ambienti dinamici, sia in fattoria che in natura.

Punti chiave

I progressi dell'intelligenza artificiale della visione rendono più facile affrontare le sfide del mondo reale, fornendo strumenti pratici per vari settori. Ad esempio, modelli di computer vision come YOLO11 possono essere utilizzati per il monitoraggio e la localizzazione in tempo reale degli animali, anche in condizioni difficili. 

Il keynote di Jim Griffin a YV24 ha illustrato come YOLOv8 possa essere utilizzato per risolvere problemi complessi con un minimo di codifica. Il progetto SharkEye, che combina i droni con l'intelligenza artificiale per il rilevamento degli squali in tempo reale, ha mostrato come la tecnologia possa migliorare la sicurezza sulle spiagge. 

È stato un affascinante case study su come l'AI accessibile consenta a persone di diversa estrazione di creare soluzioni efficaci. Mentre l'AI continua a evolversi, sta trasformando i settori e consentendo agli individui di sfruttare il suo potenziale per rendere il mondo un luogo più sicuro, intelligente ed efficiente.

Entra a far parte della nostra community ed esplora il nostro repository GitHub per approfondire la conoscenza dell'AI. Dalla computer vision in agricoltura all'AI nelle auto a guida autonoma, scopri come queste tecnologie stanno guidando l'innovazione. Dai un'occhiata alle nostre opzioni di licenza per iniziare oggi stesso i tuoi progetti di AI!

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis