Facendo clic su "Accetta tutti i cookie", l'utente accetta la memorizzazione dei cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzarne l'utilizzo e contribuire alle nostre iniziative di marketing. Per saperne di più
Impostazioni dei cookie
Facendo clic su "Accetta tutti i cookie", l'utente accetta la memorizzazione dei cookie sul proprio dispositivo per migliorare la navigazione del sito, analizzarne l'utilizzo e contribuire alle nostre iniziative di marketing. Per saperne di più
Ripercorrete con noi il keynote YOLO Vision 2024 di David Scott sull'analisi del comportamento guidata dall'intelligenza artificiale e le sue applicazioni reali in settori come l'allevamento.
Per molti anni, le innovazioni nel campo della computer vision si sono concentrate su compiti come il rilevamento di oggetti, ovvero l'identificazione di oggetti come un cane o un'automobile in immagini e video. Questi approcci hanno consentito applicazioni in settori come i veicoli autonomi, la produzione e la sanità.
Tuttavia, questi compiti spesso si concentrano solo sull'identificazione di un oggetto. E se i sistemi Vision AI potessero fare un passo avanti? Ad esempio, invece di rilevare semplicemente un cane, potrebbero capire che il cane sta inseguendo una palla o che un'auto sta frenando improvvisamente perché un pedone sta attraversando. Questo passaggio dal riconoscimento di base alla comprensione contestuale rappresenta una svolta importante verso un'intelligenza artificiale comportamentale più intelligente e consapevole del contesto.
In occasione di YOLO Vision 2024 (YV24), l'evento ibrido annuale di Ultralytics che celebra i progressi della Vision AI, il concetto di analisi del comportamento guidata dall'AI è stato al centro dell'attenzione durante un interessante intervento di David Scott, CEO di The Main Branch.
Nel suo intervento, David ha esplorato la transizione dalle attività di computer vision di base al tracciamento comportamentale. Con oltre 25 anni di esperienza nella realizzazione di applicazioni tecnologiche all'avanguardia, ha illustrato l'impatto di questo salto. Ha sottolineato come la decodifica di schemi e comportamenti stia rimodellando settori come l'agricoltura e il benessere degli animali.
In questo articolo, ripercorreremo i punti salienti dell'intervento di David ed esploreremo come il tracciamento comportamentale renda l'IA più pratica.
Comprendere le sfide dell'adozione dell'IA
David Scott ha iniziato il suo keynote con una coraggiosa verifica della realtà e ha detto: "Un mio collega dice spesso: "La scienza non vende", il che offende molti di noi qui perché ci piace molto la scienza. L'intelligenza artificiale è davvero fantastica: perché la gente non dovrebbe comprarla? Ma la realtà è che la gente non vuole comprarla solo perché noi pensiamo che sia bella; ha bisogno di un motivo per comprarla".
Ha poi spiegato che nella sua azienda, The Main Branch, l'attenzione è sempre rivolta a risolvere problemi reali con l'IA, non solo a mostrarne le capacità. Molti clienti vengono a parlarci di come utilizzare l'IA in generale, ma lui lo considera un approccio arretrato: è come avere una soluzione senza un problema. L'azienda lavora invece con clienti che presentano sfide specifiche, in modo da poter creare soluzioni di IA che facciano effettivamente la differenza.
Figura 1. David Scott sul palco di YV24.
David ha anche condiviso che il loro lavoro spesso va oltre il semplice riconoscimento degli oggetti in una scena. Individuare ciò che c'è è solo il primo passo. Il vero valore deriva dal capire cosa fare con quelle informazioni e renderle utili all'interno di una catena di valore più ampia.
La tecnologia di tracciamento comportamentale: la chiave per un'IA attivabile
Un passo fondamentale per rendere l'IA veramente utile è andare oltre le attività di computer vision di base, come il rilevamento degli oggetti, e utilizzare queste intuizioni per il tracciamento comportamentale. David ha sottolineato che l'IA comportamentale si concentra sulla comprensione delle azioni e dei modelli, non solo sull'identificazione degli oggetti. In questo modo l'IA è in grado di riconoscere eventi significativi e di fornire informazioni utili.
Ha fatto l'esempio di un animale che si rotola sul pavimento, che potrebbe indicare una malattia. Mentre le persone non possono sorvegliare un animale 24 ore su 24, i sistemi di sorveglianza basati sull'intelligenza artificiale con funzionalità di tracciamento comportamentale possono farlo. Queste soluzioni sono in grado di monitorare continuamente gli oggetti, rilevare comportamenti specifici, inviare un allarme e consentire un'azione tempestiva. Questo trasforma i dati grezzi in qualcosa di pratico e prezioso.
David ha anche dimostrato che questo approccio rende l'IA non solo interessante, ma anche realmente impattante. Affrontando problemi reali, come monitorare i comportamenti e agire di conseguenza, il tracciamento comportamentale può diventare una parte fondamentale di soluzioni di IA efficaci in vari settori.
Dare vita all'IA comportamentale
David Scott ha poi illustrato come Ultralytics YOLOv8, un modello di computer vision, abbia rappresentato una svolta per i progetti di tracciamento comportamentale del suo team. Ha fornito loro una solida base per rilevare, classificare e tracciare gli oggetti. Il suo team ha fatto un ulteriore passo avanti e ha addestrato YOLOv8 in modo da concentrarsi sul monitoraggio dei comportamenti nel tempo, rendendolo più pratico e utile per le situazioni del mondo reale.
È interessante notare che con il rilascio di Ultralytics YOLO11, soluzioni come quelle create da The Main Branch possono diventare ancora più affidabili e precise. Quest'ultimo modello offre caratteristiche come una maggiore precisione e un'elaborazione più veloce che migliorano la sua capacità di tracciare i comportamenti. Ne parleremo in modo più approfondito dopo aver compreso meglio le applicazioni per le quali l'intelligenza artificiale comportamentale può essere utilizzata.
Esploriamo quindi le soluzioni di cui ha parlato David e come la tecnologia di tracciamento comportamentale viene utilizzata in applicazioni reali per risolvere le sfide quotidiane e avere un impatto significativo.
HerdSense con analisi del comportamento guidata dall'intelligenza artificiale
In primo luogo, David ha condiviso un'entusiasmante sfida affrontata con un progetto chiamato HerdSense, che prevedeva il monitoraggio della salute di migliaia di mucche in un enorme allevamento. L'obiettivo era seguire il comportamento delle singole mucche per identificare potenziali problemi di salute. Ciò significava tenere d'occhio decine di migliaia di animali contemporaneamente, e non era un compito semplice.
Figura 2. HerdSense si è concentrato sul monitoraggio e sull'identificazione delle vacche utilizzando l'IA comportamentale.
Per iniziare a risolvere il problema dell'identificazione di ogni vacca e del monitoraggio dei suoi comportamenti, il team di David ha condotto un workshop di due giorni per delineare ogni possibile comportamento da monitorare. In totale hanno identificato oltre 200 comportamenti.
Ognuno dei 200 comportamenti dipendeva dalla capacità di riconoscere con precisione le singole mucche, poiché tutti i dati dovevano essere legati a specifici animali. Una delle principali preoccupazioni è stata quella di seguire le mucche quando si raggruppavano in gruppi, il che rendeva difficile vedere i singoli animali.
Il team di David ha sviluppato un sistema di visione computerizzata per garantire che ogni mucca fosse identificata in modo coerente, anche in situazioni difficili. Sono stati in grado di confermare che alla stessa mucca sarebbe stato assegnato sempre lo stesso ID, anche se fosse scomparsa dalla vista, si fosse mescolata ad altre o fosse riapparsa in seguito.
Monitoraggio della salute dei cavalli con la computer vision
Poi David ha presentato un altro affascinante progetto in cui sono state applicate tecniche di tracciamento comportamentale simili per monitorare i cavalli. In questo progetto, il team di David non ha avuto bisogno di tracciare i dati identificativi dei singoli cavalli così da vicino come hanno fatto con le mucche. Si sono invece concentrati su comportamenti specifici e hanno monitorato dettagli come i modelli alimentari e i livelli generali di attività per individuare tempestivamente eventuali problemi di salute. L'identificazione di piccoli cambiamenti nel comportamento potrebbe portare a interventi più rapidi per fornire cure migliori e prevenire i problemi prima che diventino gravi.
Figura 3. Monitoraggio dei cavalli con l'aiuto dell'IA comportamentale.
Perché l'intelligenza artificiale comportamentale non è così semplice come sembra
David ha anche discusso la complessità del tracciamento comportamentale attraverso un esempio intrigante. Mentre era alla ricerca di modi per migliorare l'analisi comportamentale, il suo team si è imbattuto in un'azienda che sosteneva di poter rilevare il taccheggio analizzando pose specifiche, come quella di chi tiene la mano in tasca. All'inizio sembrava un'idea intelligente: certi movimenti potevano suggerire un comportamento sospetto, giusto?
Figura 4. Comprendere le sfide della tecnologia di tracciamento comportamentale.
Tuttavia, quando David ha approfondito la ricerca, si è reso conto dei limiti di questo metodo. Una singola posa, come una mano in tasca, non significa necessariamente che qualcuno stia rubando. Potrebbe semplicemente indicare che è rilassato, che sta pensando o che ha freddo. Il problema di concentrarsi su pose isolate è che si ignora il contesto più ampio. Il comportamento non è una singola azione, ma un insieme di azioni che si susseguono nel tempo, modellate dal contesto e dall'intento.
David ha sottolineato che il vero tracking comportamentale è molto più complesso e richiede un approccio olistico. Si tratta di analizzare sequenze di azioni e di capire cosa significano in un quadro più ampio. Sebbene il settore dell'intelligenza artificiale stia facendo passi da gigante, ha osservato che c'è ancora del lavoro da fare per far progredire il tracciamento comportamentale in modo da fornire informazioni significative e accurate.
Creazione di modelli AI di visione più intelligenti che comprendono le azioni
Successivamente, David ha portato il pubblico dietro le quinte per mostrare come il suo team ha costruito una soluzione di computer vision per monitorare la salute delle mucche con l'aiuto di YOLOv8 e le sue capacità di stima della posa.
Hanno iniziato creando un set di dati personalizzato per la stima della posa di una mucca, aumentando il numero standard di punti chiave da 17 a 145 per rendere il modello migliore nell'analisi del movimento. Quindi, il modello è stato addestrato su un enorme set di dati composto da oltre 2 milioni di immagini e 110 milioni di esempi comportamentali.
Utilizzando un'infrastruttura hardware avanzata, il team di David è stato in grado di addestrare il modello in soli due giorni, invece delle settimane che sarebbero state necessarie con un hardware convenzionale. Il modello addestrato è stato poi integrato con un tracker di comportamento personalizzato che ha analizzato più fotogrammi video simultaneamente per rilevare gli schemi nelle azioni delle mucche.
Il risultato è stato una soluzione di visione guidata dall'intelligenza artificiale in grado di rilevare e seguire otto diversi comportamenti delle vacche, come mangiare, bere e sdraiarsi, per individuare piccoli cambiamenti comportamentali che potrebbero segnalare problemi di salute. Ciò consente agli allevatori di agire rapidamente e di migliorare la gestione della mandria.
La strada da percorrere per l'IA comportamentale
David ha concluso il suo intervento condividendo una lezione importante con il pubblico: "Se non date all'IA lo spazio per fallire, vi state preparando al fallimento perché, in fin dei conti, è una statistica". Ha sottolineato che l'IA, nonostante i suoi punti di forza, non è impeccabile. È uno strumento che impara dai modelli e ci saranno sempre momenti in cui non riuscirà a fare bene le cose. Invece di temere questi errori, la chiave è costruire sistemi in grado di gestirli e continuare a migliorare nel tempo.
Questo vale anche per i modelli di computer vision. Ad esempio, Ultralytics YOLO11, l'ultima versione dei modelli Ultralytics YOLO, è stata realizzata tenendo conto della necessità di portare le cose a un livello superiore rispetto a YOLOv8.
Figura 5. Compiti di visione artificiale supportati da YOLO11.
In particolare, YOLO11 offre prestazioni migliori, soprattutto per quanto riguarda le applicazioni in tempo reale in cui la precisione è fondamentale, come l'agricoltura e la sanità. Grazie alle sue caratteristiche avanzate, YOLO11 sta ridefinendo il modo in cui le industrie utilizzano l'IA, fornendo intuizioni innovative in tempo reale e aiutandole ad affrontare le sfide in modo più efficace.
Punti di forza
Il keynote di David a YV24 ha ricordato che l'IA è più di una semplice innovazione: è uno strumento potente per risolvere problemi reali e migliorare il nostro modo di vivere e lavorare. Concentrandosi sul comportamento, l'IA sta già avendo un impatto in settori come il monitoraggio della salute degli animali e il riconoscimento di modelli significativi nelle azioni quotidiane.
Il potenziale dell'IA comportamentale è entusiasmante e siamo solo all'inizio. Trasformando i dati grezzi in informazioni utili, l'IA comportamentale passa dal monitoraggio passivo alla risoluzione attiva dei problemi. Con l'ulteriore sviluppo, l'IA comportamentale è destinata a prendere decisioni più intelligenti, a semplificare i processi e ad apportare miglioramenti significativi alle nostre vite.