Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Azione Riconoscimento

Esplora il riconoscimento delle azioni (Human Activity Recognition): come i video, la stima della posa e il deep learning rilevano le azioni umane per la sanità, la sicurezza e lo sport.

Il riconoscimento delle azioni, noto anche come Human Activity Recognition (HAR), è un campo della Computer Vision (CV) che si concentra sull'identificazione e la comprensione delle azioni umane da una serie di osservazioni, in genere sequenze video. A differenza dei compiti che identificano gli oggetti nelle immagini statiche, il riconoscimento delle azioni analizza il movimento e i cambiamenti posturali nel tempo per determinare ciò che una persona sta facendo, come camminare, correre o salutare. Questa capacità consente ai sistemi di intelligenza artificiale (AI) di interpretare il comportamento umano dinamico, il che è fondamentale per creare applicazioni più interattive e consapevoli del contesto. Il mercato globale di questa tecnologia è in rapida espansione e riflette la sua crescente importanza in diversi settori.

Come funziona il riconoscimento delle azioni

I sistemi di riconoscimento delle azioni elaborano i dati visivi, principalmente quelli provenienti dai video, per classificare i movimenti umani. Il processo spesso coinvolge una combinazione di diverse tecniche di computer vision e modelli di Deep Learning (DL).

  • Ingresso dati: Il sistema inizia tipicamente con un flusso video o una sequenza di immagini. Questi dati possono essere acquisiti con telecamere standard o sensori specializzati.
  • Estrazione delle caratteristiche: Le informazioni chiave vengono estratte dai fotogrammi video. Spesso si inizia con operazioni fondamentali come il rilevamento degli oggetti per individuare le persone all'interno della scena. In seguito, si utilizza l'Object Tracking per seguire le persone su più fotogrammi, creando una comprensione temporale del loro movimento.
  • Analisi del movimento: Per comprendere l'azione specifica, i modelli si basano spesso sulla stima della posa, che identifica e traccia le articolazioni chiave del corpo. Analizzando il movimento di questi punti chiave nel tempo, il sistema può distinguere tra azioni simili, come camminare e correre.
  • Classificazione: Le architetture avanzate delle reti neurali, come le reti neurali convoluzionali 3D o una combinazione di reti neurali convoluzionali (CNN) e reti neurali ricorrenti (RNN), vengono utilizzate per classificare la sequenza di movimenti in categorie di azioni predefinite. La qualità dei dati di addestramento, spesso provenienti da dataset di riferimento su larga scala come Kinetics o UCF101, è fondamentale per l'accuratezza del modello.

Riconoscimento dell'azione e concetti correlati

È importante differenziare l'Action Recognition da altre attività CV correlate per comprenderne il ruolo unico.

  • Riconoscimento di azioni e riconoscimento di immagini: Il riconoscimento delle immagini si occupa di identificare e classificare oggetti o scene all'interno di una singola immagine statica. Il riconoscimento delle azioni, invece, estende questo concetto analizzando una sequenza di immagini per comprendere eventi dinamici e movimenti nel tempo.
  • Riconoscimento delle azioni e comprensione dei video: La comprensione dei video è un campo più ampio che comprende il riconoscimento delle azioni. Mentre il riconoscimento delle azioni si concentra specificamente sull'identificazione delle azioni, la comprensione dei video mira a una comprensione più olistica del contenuto del video, compresi i cambiamenti di scena, le interazioni con gli oggetti e la narrazione complessiva. Ad esempio, riconoscere che una persona sta aprendo una porta è un riconoscimento di azione; capire che sta entrando in una stanza per salutare qualcuno fa parte della comprensione video.
  • Riconoscimento dell'azione e stima della posa: La stima della posa è un componente spesso utilizzato nei sistemi di riconoscimento delle azioni per determinare la postura di una persona localizzando le sue articolazioni. La stima della posa fornisce i dati grezzi sul posizionamento del corpo, mentre il riconoscimento dell'azione interpreta la sequenza di queste pose per classificare l'azione eseguita.

Applicazioni nel mondo reale

Il riconoscimento delle azioni è una tecnologia chiave alla base di molti moderni sistemi di intelligenza artificiale, che consente loro di interagire con il mondo fisico e di comprenderlo in modo più sofisticato.

  • Sanità e assistenza agli anziani: nell'ambito dell'IA nella sanità, i sistemi di riconoscimento delle azioni possono monitorare i pazienti per garantire la loro sicurezza e il loro benessere. Ad esempio, questi sistemi possono essere impiegati negli ospedali o nelle case per rilevare automaticamente quando una persona anziana cade e inviare un allarme per ottenere assistenza immediata. Sono utilizzati anche nella riabilitazione fisica per monitorare se i pazienti eseguono correttamente gli esercizi.
  • Sorveglianza e sicurezza intelligenti: Oltre al semplice rilevamento del movimento, il riconoscimento delle azioni migliora il monitoraggio della sicurezza identificando comportamenti specifici. Un sistema può essere addestrato a rilevare attività sospette, come il vagabondaggio in un'area riservata o atti di vandalismo, e ad avvisare il personale di sicurezza in tempo reale. Ciò consente un approccio più proattivo alla sicurezza.
  • Analitica sportiva: Nell'analisi sportiva, gli allenatori e gli analisti utilizzano il riconoscimento delle azioni per analizzare automaticamente i movimenti dei giocatori, tracciare le metriche delle prestazioni e identificare gli schemi tattici durante una partita.
  • Interazione uomo-macchina: Il riconoscimento delle azioni è fondamentale per sviluppare sistemi di controllo basati sui gesti per qualsiasi cosa, dalle console di gioco ai dispositivi per la casa intelligente, consentendo agli utenti di interagire con la tecnologia in modo più naturale senza controller fisici.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti