Comprendi come SharkEye, presentato a YOLO Vision 2024, sfrutta Ultralytics YOLOv8 per il rilevamento di oggetti in tempo reale e la sicurezza delle spiagge.

Comprendi come SharkEye, presentato a YOLO Vision 2024, sfrutta Ultralytics YOLOv8 per il rilevamento di oggetti in tempo reale e la sicurezza delle spiagge.

Monitorare gli animali nei loro habitat naturali, che si tratti di bestiame al pascolo in una fattoria o di squali che si muovono vicino alla riva, è sempre stato importante per la loro sicurezza e il loro benessere. Tuttavia, osservarli manualmente non è facile. Spesso può richiedere ore di pazienza e attenzione, poiché gli osservatori devono osservare attentamente eventuali cambiamenti nel comportamento o nel movimento. Anche in questo caso, è facile perdere segnali sottili ma importanti.
Grazie all'intervento dell'intelligenza artificiale (AI), questo processo sta diventando più rapido, intelligente ed efficiente, riducendo il carico di lavoro degli osservatori umani e migliorando al contempo la precisione. In particolare, la computer vision può essere utilizzata per tracciare gli animali, individuare i pericoli e prendere decisioni in tempo reale. Compiti che un tempo richiedevano ore possono ora essere svolti in pochi minuti, aprendo nuove strade per comprendere il comportamento degli animali.
Al YOLO Vision 2024 (YV24), un evento ibrido annuale ospitato da Ultralytics, esperti e innovatori si sono riuniti per esplorare come l'AI sta affrontando le sfide quotidiane. Alcuni degli argomenti presentati includevano i progressi nel rilevamento di oggetti in tempo reale e nel monitoraggio degli animali, dimostrando come l'AI sta migliorando la sicurezza e l'efficienza in vari settori.
Uno dei momenti salienti dell'evento è stato il discorso di Jim Griffin, fondatore di AI Master Group, in cui ha dimostrato come la Vision AI sta rendendo le spiagge più sicure rilevando gli squali prima che si avvicinino troppo alla riva. Ha spiegato come hanno utilizzato Ultralytics YOLOv8, un modello di computer vision all'avanguardia, per identificare accuratamente gli squali in tempo reale, anche in condizioni difficili come onde agitate, riflessi e ostacoli subacquei.
In questo articolo, esamineremo più da vicino il progetto SharkEye e condivideremo interessanti approfondimenti dal discorso di Jim.
Jim ha iniziato il suo intervento presentando Padaro Beach, una rinomata destinazione per il surf in California, dove surfisti e squali spesso condividono le stesse acque. Evidenziando la vera sfida del rilevamento degli squali, ha condiviso: "Certo, è facile rilevare uno squalo se ti morde, quindi quello che volevamo fare è identificare gli squali in anticipo."

SharkEye è stato creato per affrontare questo problema, con il supporto dell'Università della California, Santa Barbara. Jim ha descritto come i droni con telecamere AI ad alta risoluzione sono stati utilizzati per volare a circa 200 piedi sopra l'acqua, scansionando l'oceano in tempo reale.
Se viene rilevato uno squalo, gli avvisi SMS raggiungono circa 80 persone, tra cui bagnini, proprietari di negozi di surf e chiunque si sia iscritto per ricevere aggiornamenti. Jim ha sottolineato come queste notifiche istantanee consentano risposte rapide, mantenendo i bagnanti più sicuri quando uno squalo è vicino alla riva.
Jim ha anche menzionato che SharkEye dispone di una dashboard live dove gli utenti possono vedere le statistiche di rilevamento degli squali. Ad esempio, in 12 settimane, il sistema ha identificato due grandi squali e 15 più piccoli, con una media di poco più di uno squalo a settimana.
Ha quindi presentato Neil Nathan, lo scienziato che ha guidato gli sforzi dietro SharkEye. Nonostante avesse un background in studi ambientali piuttosto che in informatica, Nathan ha guidato con successo il progetto. Jim ha sottolineato come gli strumenti di intelligenza artificiale moderni, come quelli utilizzati in SharkEye, siano progettati per essere accessibili, consentendo a persone provenienti da contesti non tecnici di sviluppare soluzioni di grande impatto.
Entrando più nel dettaglio, Jim ha spiegato cosa c'è sotto il cofano di SharkEye e come la soluzione di rilevamento degli squali non si limitasse a un semplice compito di object detection. Doveva affrontare condizioni dinamiche e imprevedibili come le alghe galleggianti, che potevano essere facilmente scambiate per squali. A differenza dell'individuazione di un oggetto statico, l'identificazione di uno squalo richiede precisione e adattabilità, rendendo YOLOv8 la scelta ideale.
Un altro vantaggio di YOLOv8 era la possibilità di essere implementato su un drone senza fare affidamento su server cloud. Jim ha spiegato come questo approccio abbia permesso a SharkEye di inviare avvisi immediati, un elemento essenziale per garantire risposte tempestive in condizioni oceaniche imprevedibili.
Dopo aver evidenziato come funziona SharkEye e lo sforzo collaborativo che ne è alla base, Jim ha presentato una demo dal vivo.
Jim Griffin ha iniziato la sua demo dal vivo illustrando al pubblico un esempio familiare: uno snippet di codice "hello world" per i modelli Ultralytics YOLO. Con sole sei righe di codice Python, ha mostrato come un modello Ultralytics YOLOv8 pre-addestrato potesse facilmente rilevare un autobus in un'immagine.

La sua demo utilizzava il modello YOLOv8 Nano, una versione leggera per dispositivi a bassa potenza come i droni. Lo stesso modello è stato utilizzato in SharkEye per il rilevamento in tempo reale degli squali.
Per fornire maggiori informazioni, Jim ha menzionato che il modello nella demo era stato addestrato su COCO128, un sottoinsieme più piccolo del dataset COCO ampiamente utilizzato. Il dataset COCO contiene oltre 20.000 immagini in 80 diverse categorie di oggetti. Sebbene COCO128 funzioni bene per dimostrazioni rapide, ha sottolineato che SharkEye aveva bisogno di qualcosa di più robusto: un dataset di rilevamento degli squali specifico per l'applicazione, in grado di gestire le complessità degli scenari del mondo reale.
Secondo Jim, la parte più difficile del progetto SharkEye non è stata l'addestramento del modello AI, ma la raccolta dei dati giusti. Ha commentato: "Il lavoro principale di questo progetto non è stato l'AI. Il lavoro principale di questo progetto è stato far volare quei droni per cinque anni, selezionare le immagini da quei video e taggarle in modo appropriato."
Ha descritto come il team ha raccolto 15.000 immagini a Padaro Beach. Ogni immagine doveva essere etichettata manualmente per distinguere tra squali, alghe e altri oggetti nell'acqua. Sebbene il processo sia stato lento e impegnativo, ha gettato le basi per tutto ciò che è seguito.

Una volta che il dataset è stato pronto, Ultralytics YOLOV8 è stato addestrato in modo personalizzato su di esso. Jim ha detto: "L'addestramento vero e proprio non è stata la parte difficile: ci sono volute solo 20 ore su GPU T4 [Graphics processing units]." Ha anche aggiunto che il tempo avrebbe potuto essere ridotto a sole cinque ore con hardware più potente, come le GPU A100.
Successivamente, Jim ha discusso di come sono state valutate le prestazioni di SharkEye. Ha illustrato che la metrica chiave era la precisione: quanto accuratamente il sistema identificava gli squali reali. Con SharkEye che ha raggiunto un'impressionante precisione del 92%, il modello si è dimostrato altamente efficace nell'identificare accuratamente gli squali nel complesso ambiente oceanico.
Approfondendo l'importanza della precisione, Jim ha chiarito perché la precisione contava più del richiamo in questo caso. "La maggior parte delle volte, le persone sono interessate al richiamo, specialmente in aree come l'assistenza sanitaria dove perdere un caso positivo può essere critico. Ma in questo caso, non sapevamo quanti squali ci fossero là fuori, quindi ciò a cui tenevamo era la precisione", ha spiegato. SharkEye ha garantito che i falsi allarmi fossero ridotti al minimo concentrandosi sulla precisione, rendendo più facile per i bagnini e altri soccorritori agire rapidamente.

Ha concluso il suo intervento confrontando l'IA con le prestazioni umane, osservando che la precisione del 92% di SharkEye superava di gran lunga l'accuratezza del 60% degli esperti umani. Ha sottolineato questo divario, dicendo: "È perché siamo umani. Non importa quanto esperti possiate essere voi o io, se dobbiamo stare seduti davanti a uno schermo tutto il giorno a cercare squali, alla fine, lasceremo vagare le nostre menti". A differenza delle persone, i modelli di IA non si stancano né si distraggono, il che li rende una soluzione affidabile per le attività che richiedono un monitoraggio continuo.
Una citazione interessante dal discorso di Jim Griffin, "Sei righe di codice potrebbero salvarti la vita un giorno", cattura perfettamente come l'IA avanzata ma accessibile sia diventata. I modelli Ultralytics YOLO sono stati creati con questo in mente, rendendo la tecnologia di computer vision all'avanguardia accessibile a sviluppatori e aziende di tutte le dimensioni. Ultralytics YOLO11 si basa su questo con inferenze più veloci e maggiore accuratezza.
Ecco una rapida occhiata a ciò che distingue YOLO11:
Queste caratteristiche rendono YOLO11 ideale per il monitoraggio del comportamento animale in ambienti dinamici, sia in una fattoria che in natura.
I progressi nella Vision AI stanno semplificando la gestione delle sfide del mondo reale, fornendo strumenti pratici per vari settori. Ad esempio, i modelli di computer vision come YOLO11 possono essere utilizzati per il monitoraggio in tempo reale degli animali, anche in condizioni difficili.
Il keynote di Jim Griffin allo YV24 ha illustrato come YOLOv8 possa essere utilizzato per risolvere problemi complessi con una quantità minima di codice. Il progetto SharkEye, che combina droni e AI per il rilevamento di squali in tempo reale, ha dimostrato come la tecnologia possa migliorare la sicurezza delle spiagge.
È stato un affascinante case study su come l'AI accessibile consenta a persone di diversa estrazione di creare soluzioni efficaci. Mentre l'AI continua a evolversi, sta trasformando i settori e consentendo agli individui di sfruttare il suo potenziale per rendere il mondo un luogo più sicuro, intelligente ed efficiente.
Entra a far parte della nostra community ed esplora il nostro repository GitHub per approfondire la conoscenza dell'AI. Dalla computer vision in agricoltura all'AI nelle auto a guida autonoma, scopri come queste tecnologie stanno guidando l'innovazione. Dai un'occhiata alle nostre opzioni di licenza per iniziare oggi stesso i tuoi progetti di AI!