Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Action Recognition

Esplora come l'action recognition identifica i comportamenti nei video. Impara a usare Ultralytics YOLO26 per la stima della posa e a costruire sistemi IA intelligenti per attività HAR.

Il riconoscimento delle azioni, noto comunemente anche come Human Activity Recognition (HAR), è un sottocampo dinamico della computer vision (CV) che si occupa di identificare e classificare comportamenti o movimenti specifici eseguiti da soggetti all'interno di dati video. Mentre il tradizionale object detection risponde alla domanda "cosa c'è nell'immagine?", il riconoscimento delle azioni affronta la questione più complessa: "cosa sta succedendo nel tempo?". Analizzando sequenze di frame anziché immagini statiche, i modelli di machine learning (ML) possono distinguere tra attività complesse come "camminare", "andare in bicicletta", "cadere" o "stringere la mano", rendendolo una componente cruciale per costruire sistemi intelligenti che comprendono l'intento e il contesto umano.

Link to this sectionConcetti e tecniche fondamentali#

Riconoscere le azioni richiede che un modello elabori sia le informazioni spaziali (l'aspetto di oggetti o persone) sia le informazioni temporali (come si muovono nel tempo). Per ottenere ciò, i moderni sistemi di artificial intelligence (AI) impiegano spesso architetture specializzate che vanno oltre le classiche convolutional neural networks (CNNs).

  • Pose Estimation: Una tecnica potente in cui il modello traccia specifici keypoints sul corpo umano, come gomiti, ginocchia e spalle. I cambiamenti geometrici in questi keypoints nel tempo forniscono un segnale forte per classificare le azioni, indipendentemente dal disordine dello sfondo.
  • Temporal Modeling: Gli algoritmi utilizzano strutture come Recurrent Neural Networks (RNNs) o reti Long Short-Term Memory (LSTM) per memorizzare i frame passati e prevedere le azioni future. Più recentemente, i Video Transformers hanno guadagnato popolarità per la loro capacità di gestire dipendenze a lungo raggio negli stream video.
  • Two-Stream Networks: Questo approccio elabora caratteristiche spaziali (frame RGB) e caratteristiche temporali (spesso utilizzando optical flow) in flussi paralleli, fondendo i dati per eseguire una classificazione finale.

Link to this sectionApplicazioni nel mondo reale#

La capacità di interpretare automaticamente il movimento umano ha un potenziale trasformativo in vari settori, migliorando sicurezza, efficienza ed esperienza utente.

  • AI in Healthcare: Il riconoscimento delle azioni è vitale per i sistemi di monitoraggio dei pazienti. Ad esempio, consente il rilevamento automatico delle cadute nelle case di cura, avvisando immediatamente il personale se un paziente collassa. Viene anche utilizzato nella riabilitazione fisica remota, dove i coach basati su AI analizzano la forma fisica degli esercizi di un paziente per garantire che esegua i movimenti correttamente e in sicurezza.
  • Sorveglianza intelligente e sicurezza: Oltre al semplice rilevamento del movimento, i sistemi di sicurezza avanzati utilizzano il riconoscimento delle azioni per identificare comportamenti sospetti, come risse, taccheggio o ingressi non autorizzati, ignorando al contempo le attività innocue. Ciò riduce i falsi allarmi e migliora il monitoraggio della sicurezza in tempo reale.

Link to this sectionImplementare l'analisi delle azioni con Ultralytics#

Un flusso di lavoro comune prevede il rilevamento delle persone e della loro posa scheletrica, seguito dall'analisi del movimento di tali articolazioni. Il modello Ultralytics YOLO26 fornisce velocità e precisione allo stato dell'arte per il passaggio iniziale di pose estimation, che costituisce la base per molte pipeline di riconoscimento delle azioni.

Il seguente esempio mostra come estrarre i keypoints scheletrici da un frame video utilizzando Python:

from ultralytics import YOLO

# Load the YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image to detect person keypoints
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    # Access the keypoints (x, y, visibility)
    if result.keypoints is not None:
        print(f"Detected keypoints shape: {result.keypoints.data.shape}")

Link to this sectionDistinguere termini correlati#

È importante differenziare il riconoscimento delle azioni da attività di computer vision simili per assicurarsi di applicare i metodi corretti.

  • Riconoscimento delle azioni vs. Object Tracking: L'object tracking si concentra sul mantenimento dell'identità di un oggetto o persona specifica mentre si sposta tra i frame (es. "La persona A si trova alla coordinata X"). Il riconoscimento delle azioni interpreta il comportamento del soggetto tracciato (es. "La persona A sta correndo").
  • Riconoscimento delle azioni vs. Video Understanding: Mentre il riconoscimento delle azioni identifica specifici atti fisici, il video understanding è un concetto più ampio che comporta la comprensione dell'intera narrazione, del contesto e delle relazioni causali all'interno di una scena video.

Link to this sectionSfide e tendenze future#

Lo sviluppo di modelli robusti di riconoscimento delle azioni presenta sfide, in particolare per quanto riguarda la necessità di grandi video datasets annotati come Kinetics-400 o UCF101. Etichettare i dati video richiede molto più tempo rispetto all'etichettatura di immagini statiche. Per affrontare questo problema, strumenti come la Ultralytics Platform aiutano a semplificare il flusso di lavoro di annotazione e addestramento.

Inoltre, l'efficienza computazionale è fondamentale. L'elaborazione di video ad alta risoluzione in tempo reale richiede notevoli risorse hardware. Il settore si sta muovendo sempre più verso l'Edge AI, ottimizzando i modelli per l'esecuzione direttamente su telecamere e dispositivi mobili al fine di ridurre la latenza e l'utilizzo della larghezza di banda. I progressi futuri mirano a migliorare la generalizzazione del modello, consentendo ai sistemi di riconoscere azioni anche da punti di vista sui quali non sono stati addestrati esplicitamente.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning