Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Vision AI

L'AI può rilevare le azioni umane? Esplorare il riconoscimento delle attività

Dalle app di fitness al monitoraggio dei pazienti, scopri come la computer vision affronta la domanda: l'AI può rilevare le azioni umane in contesti del mondo reale?

ABAbirami Vina
6 min read
AI che rileva le azioni umane attraverso il riconoscimento delle attività

La vita quotidiana è piena di piccoli movimenti a cui raramente pensiamo. Attraversare una stanza, sedersi a una scrivania o salutare un amico può sembrarci naturale, ma rilevarli con l'IA è molto più complicato. Ciò che per gli umani è naturale si traduce in qualcosa di molto più complesso quando una macchina cerca di comprenderlo.

Questa capacità è nota come riconoscimento delle attività umane (HAR) e permette ai computer di rilevare e interpretare modelli nel comportamento umano. Un'app di fitness è un ottimo esempio di HAR in azione. Tracciando i passi e le routine di allenamento, mostra come l'IA possa monitorare le attività quotidiane.

Vedendo il potenziale dell'HAR, molti settori hanno iniziato ad adottare questa tecnologia. Infatti, si prevede che il mercato del riconoscimento delle azioni umane supererà i 12,56 miliardi di dollari entro il 2033.

Una parte significativa di questo progresso è guidata dalla computer vision, un ramo dell'IA che consente alle macchine di analizzare dati visivi, come immagini e video. Con la computer vision e il riconoscimento delle immagini, l'HAR si è evoluto da concetto di ricerca a parte pratica ed entusiasmante delle applicazioni di IA all'avanguardia.

In questo articolo esploreremo cos'è l'HAR, i diversi metodi utilizzati per riconoscere le azioni umane e come la computer vision aiuti a rispondere alla domanda: l'IA può rilevare le azioni umane nelle applicazioni del mondo reale? Iniziamo!

Link to this sectionCos'è il riconoscimento delle azioni umane?#

Il riconoscimento delle azioni umane rende possibile ai sistemi informatici comprendere le attività o le azioni umane analizzando i movimenti del corpo. A differenza del semplice rilevamento di una persona in un'immagine, l'HAR può aiutare a identificare cosa sta facendo la persona. Ad esempio, distinguere tra camminare e correre, riconoscere un cenno della mano o notare quando qualcuno cade.

Le basi dell'HAR risiedono nei modelli di movimento e postura. Un leggero cambiamento nel posizionamento delle braccia o delle gambe di una persona può segnalare una varietà di azioni. Catturando e interpretando questi dettagli sottili, i sistemi HAR possono ottenere informazioni significative dai movimenti del corpo.

Per ottenere questo risultato, il riconoscimento delle azioni umane combina molteplici tecnologie come il machine learning, i modelli di deep learning, la computer vision e l'elaborazione delle immagini, che lavorano insieme per analizzare i movimenti del corpo e interpretare le azioni umane con maggiore precisione.

Il riconoscimento delle attività umane abbraccia diversi rami dell'informatica

Fig 1. Il riconoscimento delle attività umane coinvolge diversi rami dell'informatica (Fonte: cell.com)

I primi sistemi HAR erano molto più limitati. Potevano gestire solo poche azioni semplici e ripetitive in ambienti controllati e spesso incontravano difficoltà in situazioni del mondo reale.

Oggi, grazie all'IA e a grandi quantità di dati video, l'HAR ha fatto notevoli passi avanti sia in termini di precisione che di robustezza. I sistemi moderni possono riconoscere una vasta gamma di attività con una precisione molto maggiore, rendendo la tecnologia pratica per settori come l'assistenza sanitaria, la sicurezza e i dispositivi interattivi.

Link to this sectionDiversi metodi per rilevare le azioni umane#

Ora che abbiamo una comprensione migliore di cosa sia il riconoscimento delle azioni umane, diamo un'occhiata ai diversi modi in cui le macchine possono rilevare le azioni umane.

Ecco alcuni dei metodi comuni:

  • Metodi basati su sensori: Dispositivi intelligenti come accelerometri, wearable e smartphone possono catturare segnali direttamente dal corpo umano. Possono mostrare modelli di movimento come camminare, correre o persino stare fermi. Un contapassi su uno smartwatch è un ottimo esempio di questo metodo.
  • Metodi basati sulla visione: Le telecamere abbinate alla computer vision analizzano immagini e video per tracciare come il corpo appare e si muove fotogramma dopo fotogramma. Ciò consente il riconoscimento di attività più complesse. TV controllate tramite gesti o sistemi di gioco si basano su questo metodo.
  • Metodi multimodali: È una combinazione di sensori e telecamere che crea un sistema più affidabile, poiché una fonte può confermare ciò che rileva l'altra. Ad esempio, un wearable può registrare il movimento mentre una telecamera verifica la postura, una configurazione spesso utilizzata nel rilevamento delle cadute per l'assistenza agli anziani.

Link to this sectionIl ruolo dei dataset nel riconoscimento delle attività umane#

Per qualsiasi modello o sistema HAR, i dataset sono il punto di partenza. Un dataset HAR è una raccolta di esempi, come video clip, immagini o dati di sensori, che catturano azioni come camminare, sedersi o salutare. Questi esempi vengono utilizzati per addestrare i modelli di IA a riconoscere i modelli nel movimento umano, che possono poi essere applicati in contesti di vita reale.

La qualità dei dati di addestramento influisce direttamente sulle prestazioni di un modello. Dati puliti e coerenti rendono più facile per il sistema riconoscere le azioni con precisione.

Ecco perché i dataset vengono spesso pre-elaborati prima dell'addestramento. Un passaggio comune è la normalizzazione, che scala i valori in modo coerente per ridurre gli errori e prevenire l'overfitting (quando un modello ha buone prestazioni sui dati di addestramento ma ha difficoltà con nuovi dati).

Per misurare le prestazioni dei modelli oltre l'addestramento, i ricercatori si affidano a metriche di valutazione e dataset di benchmark che consentono test e confronti equi. Collezioni popolari come UCF101, HMDB51 e Kinetics includono migliaia di video clip etichettati per il rilevamento delle azioni umane. Sul fronte dei sensori, i dataset raccolti da smartphone e wearable forniscono preziosi segnali di movimento che rendono i modelli di riconoscimento più robusti in diversi ambienti.

Uno scorcio di un dataset per il riconoscimento delle attività umane

Fig 2. Uno sguardo a un dataset per il riconoscimento delle attività umane. (Fonte)

Link to this sectionCome la computer vision supporta il riconoscimento delle attività umane#

Tra i diversi modi per rilevare le azioni umane, la computer vision è diventata rapidamente uno dei più popolari e studiati. Il suo vantaggio principale è che può estrarre dettagli ricchi direttamente da immagini e video. Osservando i pixel fotogramma per fotogramma e analizzando i modelli di movimento, può riconoscere le attività in tempo reale senza bisogno che le persone indossino dispositivi aggiuntivi.

I recenti progressi nel deep learning, specialmente nelle reti neurali convoluzionali (CNN), progettate per analizzare le immagini, hanno reso la computer vision più veloce, più precisa e più affidabile.

Ad esempio, i modelli di computer vision all'avanguardia ampiamente utilizzati come Ultralytics YOLO11 sono basati su questi progressi. YOLO11 supporta attività come il rilevamento di oggetti, la segmentazione di istanze, il tracciamento di persone tra i fotogrammi video e la stima delle pose umane, rendendolo un ottimo strumento per il riconoscimento delle attività umane.

Link to this sectionUna panoramica di Ultralytics YOLO11#

Ultralytics YOLO11 è un modello di vision AI progettato sia per la velocità che per la precisione. Supporta attività fondamentali di computer vision come il rilevamento di oggetti, il tracciamento di oggetti e la stima delle pose. Queste funzionalità sono particolarmente utili per il riconoscimento delle attività umane.

Il rilevamento di oggetti identifica e localizza le persone in una scena, il tracciamento segue i loro movimenti tra i fotogrammi video per riconoscere sequenze di azioni e la stima delle pose mappa le articolazioni chiave del corpo umano per distinguere tra attività simili o rilevare cambiamenti improvvisi come una caduta.

Ad esempio, le intuizioni del modello possono essere utilizzate per distinguere tra qualcuno che siede tranquillamente, poi si alza e infine alza le braccia per esultare. Queste semplici azioni quotidiane possono apparire simili a prima vista, ma hanno significati molto diversi quando vengono analizzate in sequenza.

Utilizzo di Ultralytics YOLO11 per la stima della posa

Fig 3. Utilizzo di Ultralytics YOLO11 per la stima delle pose. (Fonte)

Link to this sectionApplicazioni nel mondo reale della computer vision e dell'HAR#

Ora diamo un'occhiata più da vicino a come il riconoscimento delle attività umane alimentato dalla computer vision viene applicato in casi d'uso reali che hanno un impatto sulla nostra vita quotidiana.

Link to this sectionAssistenza sanitaria e benessere#

Nell'assistenza sanitaria, piccoli cambiamenti nel movimento possono fornire informazioni utili sulle condizioni di una persona. Ad esempio, un inciampo di un paziente anziano o l'angolazione di un arto durante la riabilitazione possono rivelare rischi o progressi. Questi segnali sono spesso facili da perdere con mezzi tradizionali, come i controlli medici.

YOLO11 può aiutare utilizzando la stima delle pose e l'analisi delle immagini per monitorare i pazienti in tempo reale. Può essere usato per rilevare cadute, tracciare esercizi di recupero e osservare attività quotidiane come camminare o fare stretching. Poiché funziona tramite analisi visiva senza bisogno di sensori o wearable, offre un modo semplice per raccogliere informazioni accurate che supportano l'assistenza al paziente.

Tracciamento dei movimenti del corpo utilizzando la stima della posa con YOLO11

Fig 4. Tracciamento dei movimenti corporei utilizzando il supporto di YOLO11 per la stima delle pose. (Fonte)

Link to this sectionSicurezza e sorveglianza#

I sistemi di sicurezza si basano sul rilevamento rapido di attività umane insolite, come qualcuno che bighellona, corre in un'area riservata o mostra un'aggressione improvvisa. Questi segnali spesso passano inosservati in ambienti affollati dove le guardie di sicurezza non possono monitorare tutto manualmente. È qui che entrano in gioco la computer vision e YOLO11.

YOLO11 rende il monitoraggio della sicurezza più semplice potenziando la videosorveglianza in tempo reale in grado di rilevare movimenti sospetti e inviare avvisi istantanei. Supporta la sicurezza della folla negli spazi pubblici e rafforza il rilevamento delle intrusioni nelle aree private.

Con questo approccio, le guardie di sicurezza possono lavorare a fianco dei sistemi di computer vision, creando un'interazione e una collaborazione uomo-macchina che consente risposte più rapide e tempestive alle attività sospette.

Link to this sectionPro e contro dell'utilizzo della computer vision per l'HAR#

Ecco alcuni dei vantaggi dell'utilizzo della computer vision per il riconoscimento delle attività umane:

  • Scalabilità: Una volta configurato, lo stesso sistema di riconoscimento può monitorare automaticamente più persone contemporaneamente, rendendolo utile per l'automazione in strutture sanitarie, fabbriche e spazi pubblici.
  • Elaborazione in tempo reale: Le soluzioni di vision AI possono essere utilizzate per analizzare i flussi video man mano che si verificano, consentendo risposte più rapide.
  • Tracciamento non invasivo: A differenza dei wearable o dei sensori, non richiede che le persone portino con sé dispositivi, consentendo un'analisi del comportamento naturale e senza sforzo.

Sebbene ci siano molti vantaggi nell'usare la computer vision per l'HAR, ci sono anche limitazioni da considerare. Ecco alcuni fattori da tenere a mente:

  • Preoccupazioni sulla privacy: Il monitoraggio basato su video può sollevare problemi relativi alla protezione dei dati e al consenso, specialmente in ambienti sensibili come case o luoghi di lavoro.
  • Potenziale bias: Se i dataset di addestramento mancano di diversità, gli algoritmi potrebbero interpretare erroneamente le azioni di determinati gruppi di persone, portando a risultati ingiusti o inaccurati.
  • Sensibilità ambientale: La precisione può diminuire a causa di scarsa illuminazione, confusione dello sfondo o persone parzialmente nascoste, il che significa che i sistemi devono essere progettati con attenzione.

Link to this sectionPunti chiave#

L'intelligenza artificiale e la computer vision stanno rendendo possibile alle macchine riconoscere le azioni umane in modo più accurato e in tempo reale. Analizzando i fotogrammi video e i modelli di movimento, questi sistemi possono identificare sia i gesti quotidiani che i cambiamenti improvvisi. Man mano che la tecnologia continua a migliorare, il riconoscimento delle attività umane sta uscendo dai laboratori di ricerca per diventare uno strumento pratico per l'assistenza sanitaria, la sicurezza e le applicazioni quotidiane.

Esplora di più sull'IA visitando il nostro repository GitHub e unendoti alla nostra community. Dai un'occhiata alle nostre pagine delle soluzioni per conoscere l'IA nella robotica e la computer vision nella produzione. Scopri le nostre opzioni di licenza per iniziare con la vision AI.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning