Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Stima della posa

Scopri come la stima della posa utilizza i punti chiave per track . Esplora le applicazioni nel mondo reale e inizia a utilizzare Ultralytics per ottenere risultati rapidi e accurati.

La stima della posa è una tecnica di visione artificiale specializzata che va oltre il semplice rilevamento della presenza di oggetti per comprendere la loro struttura geometrica e il loro orientamento fisico. Mentre il rilevamento standard degli oggetti disegna un semplice riquadro rettangolare intorno a un soggetto, la stima della posa identifica punti semantici specifici, noti come punti chiave, come le articolazioni del corpo umano (gomiti, ginocchia, spalle) o gli angoli strutturali di un veicolo. Mappando questi punti di riferimento, i modelli di apprendimento automatico possono ricostruire una rappresentazione scheletrica del soggetto, consentendo ai sistemi di interpretare il linguaggio del corpo, le dinamiche di movimento e il posizionamento preciso nello spazio 2D o 3D.

Meccanismi fondamentali: approccio top-down contro approccio bottom-up

La stima della posa moderna si basa in larga misura su sofisticate architetture di deep learning, che spesso utilizzano reti neurali convoluzionali (CNN) per elaborare i dati visivi. Gli algoritmi seguono generalmente una delle due strategie principali per identificare i punti chiave:

  • Approcci top-down: questo metodo utilizza innanzitutto un modello di rilevamento degli oggetti per individuare le singole istanze all'interno dei riquadri di delimitazione. Una volta che una persona o un oggetto viene ritagliato dall'immagine più grande, lo stimatore di posa prevede i punti chiave all'interno di quella specifica regione. Questo approccio è spesso molto accurato, ma può soffrire di una maggiore latenza di inferenza all'aumentare del numero di soggetti presenti nell'inquadratura.
  • Approcci bottom-up: al contrario, questa strategia rileva contemporaneamente tutti i potenziali punti chiave nell'intera immagine (ad esempio, individuando ogni "ginocchio sinistro" in una folla) e quindi utilizza algoritmi di associazione per raggrupparli in scheletri individuali. Questo metodo è generalmente preferito per l' inferenza in tempo reale in scene affollate perché il costo computazionale rimane relativamente costante indipendentemente dal numero di persone presenti.

Modelli all'avanguardia come YOLO26 utilizzano architetture end-to-end avanzate che bilanciano queste esigenze, fornendo una stima della posa ad alta velocità adatta all'implementazione su dispositivi AI edge e piattaforme mobili.

Distinzione tra termini correlati alla visione artificiale

È utile differenziare la stima della posa da altre attività di riconoscimento visivo per comprenderne il valore unico nei flussi di lavoro della visione artificiale:

  • Rilevamento oggetti: si concentra sull'identificazione di cosa sia un oggetto e dove si trovi, generando un riquadro rettangolare. Tratta il soggetto come un oggetto rigido senza comprenderne l'articolazione interna.
  • Segmentazione dell'istanza: genera una maschera pixel-perfect che delinea la forma precisa dell'oggetto. Sebbene la segmentazione fornisca i confini, non identifica esplicitamente le articolazioni o i collegamenti scheletrici necessari per l' analisi cinematica.
  • Stima della posa: si concentra in modo specifico sulla struttura interna, mappando le connessioni tra punti di riferimento predeterminati (ad esempio, dall'anca al ginocchio) per analizzare la postura e l'azione.

Applicazioni nel mondo reale

La capacità di digitalizzare il movimento di persone e oggetti ha portato a applicazioni trasformative in vari settori industriali, spesso addestrate utilizzando strumenti come la Ultralytics per gestire grandi set di dati di punti chiave annotati.

Assistenza sanitaria e riabilitazione

Nel campo medico, l'intelligenza artificiale nel settore sanitario utilizza la stima della postura per monitorare a distanza la riabilitazione dei pazienti. Tracciando gli angoli articolari e l'ampiezza di movimento, i sistemi automatizzati possono garantire che i pazienti eseguano correttamente gli esercizi di fisioterapia a casa. Ciò riduce il rischio di recidive e consente ai medici di quantificare i progressi del recupero senza bisogno di costose attrezzature di laboratorio.

Analisi dello sport

Allenatori e atleti sfruttano l' analisi dei dati sportivi per ottimizzare le prestazioni. I modelli di stima della posa possono analizzare il piano di swing di un golfista, la lunghezza della falcata di un corridore o la biomeccanica di un lanciatore senza la necessità di indossare le fastidiose tute con marcatori utilizzate nella tradizionale cattura del movimento. Ciò fornisce un feedback immediato e basato sui dati per migliorare la tecnica e prevenire lesioni da sovraccarico.

Analisi del comportamento e delle vendite al dettaglio

Negli ambienti commerciali, l'intelligenza artificiale nei sistemi di vendita al dettaglio utilizza il rilevamento delle pose per comprendere il comportamento dei clienti, come raggiungere prodotti su scaffali alti o soffermarsi in specifici corridoi. Questi dati aiutano a ottimizzare il layout dei negozi e a migliorare la gestione dell'inventario correlando le azioni fisiche con le decisioni di acquisto.

Esempio di codice: stima della posa con YOLO26

L'implementazione della stima della posa è semplice con i moderni Python framework. L'esempio seguente mostra come utilizzare il ultralytics pacchetto per caricare un modello pre-addestrato YOLO26 modello (il successore di YOLO11) e detect i punti chiave detect in un'immagine.

from ultralytics import YOLO

# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")

# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")

# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)

# Visualize the skeletal results directly
results[0].show()

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora