Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Guide

Cos'è la stima della posa e dove può essere utilizzata?

Scopri come funziona la stima della posa, le sue applicazioni nel mondo reale e come i modelli come Ultralytics YOLO11 consentano alle macchine di interpretare il movimento corporeo e la postura.

ABAbirami Vina
5 min read
Cos'è la stima della posa e dove può essere utilizzata

Quando vedi qualcuno curvo o in piedi con le spalle ben aperte, ti è subito chiaro se ha una postura scorretta o sicura di sé. Nessuno deve spiegartelo. Questo perché, nel tempo, abbiamo imparato naturalmente a interpretare il linguaggio del corpo.

Attraverso l'esperienza e l'osservazione, il nostro cervello è diventato molto abile nel riconoscere la postura di vari oggetti, inclusi gli esseri umani. Grazie ai recenti progressi nell'intelligenza artificiale (AI) e nella computer vision, un campo che permette alle macchine di interpretare le informazioni visive del mondo, anche le macchine stanno iniziando a imparare e replicare questa capacità.

La pose estimation è un'attività di computer vision che aiuta le macchine a determinare la posizione e l'orientamento di una persona o di un oggetto osservando immagini o video. Lo fa identificando punti chiave sul corpo, come articolazioni e arti, per capire come qualcuno, o persino qualcosa, si stia muovendo.

Questa tecnologia è ampiamente utilizzata in settori come il fitness, la sanità e l'animazione. Negli ambienti di lavoro, ad esempio, può essere utilizzata per monitorare la postura dei dipendenti e supportare iniziative di sicurezza e benessere. Modelli di computer vision come Ultralytics YOLO11 rendono tutto ciò possibile stimando le pose umane in tempo reale.

Uso di YOLO11 per monitorare la postura dei lavoratori

Fig 1. Un esempio di utilizzo di YOLO11 per monitorare la postura dei lavoratori.

In questo articolo, esamineremo più da vicino la pose estimation e come funziona, insieme a casi d'uso reali in cui sta facendo la differenza. Iniziamo!

Link to this sectionL'evoluzione della pose estimation#

La ricerca sulla pose estimation è iniziata tra la fine degli anni '60 e gli anni '70. Nel corso degli anni, gli approcci verso questa computer vision task sono passati da matematica e geometria di base a metodi più avanzati guidati dall'intelligenza artificiale.

Inizialmente, le tecniche dipendevano da angolazioni fisse della telecamera e punti di riferimento noti. Successivamente, si sono evolute includendo modelli 3D e corrispondenza di caratteristiche. Oggi, modelli di deep learning come YOLO11 possono rilevare posizioni corporee in tempo reale da immagini o video, rendendo la pose estimation più veloce e precisa che mai.

Con il miglioramento della tecnologia, i ricercatori hanno compreso le potenziali applicazioni nel monitorare e tracciare le pose di vari oggetti, specialmente umani e animali. La pose estimation è particolarmente importante perché consente agli strumenti AI di comprendere e misurare postura e movimento in modi che prima non erano possibili.

Ad esempio, permette ai computer di riconoscere gesti per un'interazione senza contatto, analizza i movimenti degli atleti per migliorarne le prestazioni, anima realisticamente i videogiochi e supporta persino la sanità monitorando i progressi di recupero dei pazienti.

Link to this sectionIn che modo è diversa dalle altre attività di computer vision?#

La pose estimation è diversa da altre attività di computer vision come l'object detection e l'instance segmentation. Queste attività si concentrano principalmente sull'identificazione e la localizzazione di oggetti all'interno di un'immagine.

L'object detection, ad esempio, disegna bounding box attorno ad elementi come persone, veicoli o animali per indicarne la presenza e la posizione. L'instance segmentation fa un ulteriore passo avanti delineando la forma precisa di ogni oggetto a livello di pixel.

Tuttavia, entrambi questi metodi si occupano principalmente di cosa sia l'oggetto e dove si trovi: non forniscono alcuna informazione su come l'oggetto sia posizionato o cosa possa stare facendo. È qui che la pose estimation diventa cruciale.

Identificando punti chiave sul corpo, come gomiti, ginocchia o persino una coda, la pose estimation può interpretare postura e movimento. Ciò consente una comprensione più profonda di azioni, gesti e dinamiche corporee, compreso il movimento nello spazio 3D.

Link to this sectionCapire come funziona la pose estimation#

I pose estimation models generalmente seguono due approcci principali: bottom-up e top-down. Nell'approccio bottom-up, il modello rileva prima i singoli punti chiave, come gomiti, ginocchia o spalle, e poi li raggruppa per capire a quale persona o oggetto appartengano. Al contrario, l'approccio top-down inizia rilevando prima ogni oggetto (come una persona nell'immagine) e poi localizza i punti chiave per quello specifico oggetto.

Metodi di stima della posa bottom-up vs. top-down

Fig 2. Metodi di pose estimation bottom-up vs. top-down.

Alcuni modelli più recenti, come YOLO11, combinano i vantaggi di entrambi gli approcci. Mantiene l'efficienza del metodo bottom-up saltando il passaggio di raggruppamento manuale, sfruttando al contempo la precisione dei sistemi top-down rilevando le persone e stimando le loro pose contemporaneamente, in un unico processo semplificato.

Link to this sectionAddestramento personalizzato di YOLO11 per la pose estimation#

Mentre esploriamo il funzionamento dei modelli di pose estimation, potresti chiederti: come imparano questi modelli a stimare la posa di oggetti diversi? È qui che entra in gioco l'idea dell'addestramento personalizzato.

L'addestramento personalizzato significa insegnare a un modello a riconoscere punti chiave specifici utilizzando i propri dati. Dato che creare un modello da zero richiede una grande quantità di immagini etichettate e molto tempo, molti scelgono il transfer learning. Questo comporta l'iniziare con un modello già addestrato su un ampio dataset, come il modello di pose estimation YOLO11, pre-addestrato sul COCO-Pose dataset, per poi affinarlo con i propri dati per un compito o un caso d'uso specifico.

Supponiamo che tu stia lavorando con pose di yoga: puoi affinare YOLO11 utilizzando immagini in cui ogni posa è etichettata con punti chiave specifici per quell'attività. Per fare ciò, avrai bisogno di un dataset personalizzato di immagini annotate da cui il modello possa imparare.

Durante l'addestramento, puoi regolare impostazioni come batch size (il numero di immagini elaborate contemporaneamente), learning rate (la velocità con cui il modello aggiorna il suo apprendimento) ed epochs (quante volte il modello cicla attraverso il dataset) per migliorare l'accuratezza. Questo rende molto più semplice creare modelli di pose estimation su misura per le tue esigenze specifiche.

Link to this sectionApplicazioni nel mondo reale della pose estimation#

Ora che abbiamo discusso cos'è la pose estimation e come funziona, diamo un'occhiata più da vicino ad alcuni dei suoi casi d'uso nel mondo reale.

Link to this sectionUtilizzo della pose estimation per la fisioterapia#

La pose estimation sta diventando gradualmente uno strumento affidabile nel settore sanitario, specialmente nella fisioterapia. Utilizzando l'AI e la computer vision, questi sistemi possono tracciare postura e movimenti in tempo reale e fornire feedback, simile a quanto offrirebbe un fisioterapista.

Ad esempio, un paziente che si sta riprendendo da un intervento al ginocchio può utilizzare un sistema di pose estimation per assicurarsi di eseguire correttamente gli esercizi di riabilitazione. Il sistema può individuare eventuali movimenti errati e offrire suggerimenti per migliorare, aiutando il paziente a rimanere in linea con i progressi ed evitare infortuni.

Uso di YOLO11 per la fisioterapia

Fig 3. Un esempio di utilizzo di YOLO11 per la fisioterapia.

Oltre alla riabilitazione, la pose estimation si sta facendo strada anche nelle fitness apps. Ad esempio, qualcuno che si allena a casa può utilizzare l'app per controllare la propria forma durante gli esercizi. L'app può fornire feedback in tempo reale, come regolare l'angolo di uno squat o assicurarsi che la schiena sia dritta durante uno stacco da terra. Questo aiuta gli utenti a migliorare la propria forma e prevenire infortuni senza bisogno di un allenatore.

Link to this sectionMotion capture per l'intrattenimento abilitato dalla pose estimation#

La pose estimation ha cambiato il modo in cui funziona il motion capture nell'intrattenimento, rendendolo più semplice e accessibile. In passato, il motion capture richiedeva il posizionamento di marker sul corpo di una persona e il loro tracciamento con telecamere speciali, il che poteva essere complicato e costoso.

Ora, con i progressi nell'AI e nella computer vision, possiamo usare normali telecamere e algoritmi per tracciare i movimenti del corpo senza bisogno di marker, rendendo il processo più efficiente e accurato, anche in tempo reale.

Un ottimo esempio di ciò è Disney's AR (Augmented Reality) Poser. Questo divertente strumento ti permette di scattare una foto con il tuo telefono e far sì che un personaggio digitale imiti la tua posa in realtà aumentata. Funziona analizzando la tua posa nella foto e abbinandola a un personaggio 3D, creando un selfie AR divertente e personalizzato.

Un personaggio in AR imita la posa di una persona usando la stima della posa

Fig 4. Un personaggio AR imita la posa di una persona usando la pose estimation.

Link to this sectionRicerca sul comportamento sociale guidata dalla pose estimation animale#

Studiare il comportamento animale aiuta gli scienziati a capire come gli animali comunicano, trovano compagni, si prendono cura dei piccoli e vivono in gruppo. Questa conoscenza è vitale per proteggere la fauna selvatica e acquisire una comprensione più profonda del mondo naturale.

La pose estimation semplifica questo processo tracciando i movimenti e la postura degli animali utilizzando immagini e video, senza attaccare sensori o tag agli animali stessi. Questi sistemi possono monitorare automaticamente le loro pose, fornendo approfondimenti su comportamenti come pulizia, gioco o combattimento.

Un esempio interessante è l'uso della pose estimation da parte degli scienziati per studiare il comportamento delle scimmie. Infatti, i ricercatori hanno compilato dataset come OpenApePose, che contiene oltre 71.000 immagini etichettate di sei specie di scimmie.

Stima della posa di una scimmia

Fig 5. Pose estimation di scimmie.

Link to this sectionPro e contro della pose estimation#

Ecco alcuni dei principali vantaggi che la pose estimation può apportare a vari settori:

  • Scalabilità: I sistemi di pose estimation possono essere distribuiti su una vasta gamma di dispositivi, dagli smartphone alle configurazioni avanzate di telecamere, rendendoli altamente scalabili e accessibili per diversi casi d'uso e ambienti.
  • Convenienza: Poiché la pose estimation si basa su telecamere normali e non richiede sensori o tag costosi, può essere una soluzione più conveniente per tracciare il movimento sia nella ricerca che nelle applicazioni commerciali.
  • Monitoraggio continuo: I sistemi di pose estimation possono fornire un tracciamento continuo in tempo reale, consentendo di monitorare i cambiamenti nel tempo, che si tratti dei progressi di un paziente nella riabilitazione o del comportamento animale in natura.

Sebbene i vantaggi della pose estimation siano chiari in diversi campi, ci sono anche alcune sfide da considerare. Ecco alcune limitazioni chiave da tenere a mente:

  • Generalizzazione limitata: Molti modelli addestrati su dataset umani non si generalizzano bene ad animali o strutture corporee insolite senza un riaddestramento su dataset specifici.

  • Limitazioni ambientali: Le prestazioni possono degradare in condizioni di scarsa illuminazione, sfocatura da movimento rapido o sfondi caotici.

  • Alta sensibilità all'occlusione: L'accuratezza può diminuire quando le parti del corpo sono bloccate o fuori inquadratura, specialmente in scene affollate o nel tracciamento multi-persona.

Link to this sectionPunti chiave#

La pose estimation ha fatto molta strada dai suoi primi giorni, evolvendosi da sistemi che utilizzavano marker a strumenti d'impatto guidati da modelli di deep learning come YOLO11. Che si tratti di migliorare la fisioterapia, potenziare esperienze AR interattive o aiutare la ricerca sulla fauna selvatica, la pose estimation sta cambiando il modo in cui le macchine comprendono movimento e postura. Man mano che la tecnologia continua ad avanzare, affrontare le sue limitazioni sarà fondamentale per sbloccare usi ancora più pratici e rendere le macchine migliori nel comprendere come noi e altri esseri viventi ci muoviamo.

Curioso riguardo all'AI? Esplora il nostro GitHub repository, connettiti con la nostra community e dai un'occhiata alle nostre opzioni di licenza per dare il via al tuo progetto di computer vision. Scopri di più su innovazioni come l'AI nel retail e la computer vision nella logistica sulle nostre pagine delle soluzioni.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.
Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.
Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.
Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.
Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.
Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.
Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.
Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning