Scopri come la stima della posa utilizza i punti chiave per track . Esplora le applicazioni nel mondo reale e inizia a utilizzare Ultralytics per ottenere risultati rapidi e accurati.
La stima della posa è una tecnica di visione artificiale specializzata che va oltre il semplice rilevamento della presenza di oggetti per comprendere la loro struttura geometrica e il loro orientamento fisico. Mentre il rilevamento standard degli oggetti disegna un semplice riquadro rettangolare intorno a un soggetto, la stima della posa identifica punti semantici specifici, noti come punti chiave, come le articolazioni del corpo umano (gomiti, ginocchia, spalle) o gli angoli strutturali di un veicolo. Mappando questi punti di riferimento, i modelli di apprendimento automatico possono ricostruire una rappresentazione scheletrica del soggetto, consentendo ai sistemi di interpretare il linguaggio del corpo, le dinamiche di movimento e il posizionamento preciso nello spazio 2D o 3D.
La stima della posa moderna si basa in larga misura su sofisticate architetture di deep learning, che spesso utilizzano reti neurali convoluzionali (CNN) per elaborare i dati visivi. Gli algoritmi seguono generalmente una delle due strategie principali per identificare i punti chiave:
Modelli all'avanguardia come YOLO26 utilizzano architetture end-to-end avanzate che bilanciano queste esigenze, fornendo una stima della posa ad alta velocità adatta all'implementazione su dispositivi AI edge e piattaforme mobili.
È utile differenziare la stima della posa da altre attività di riconoscimento visivo per comprenderne il valore unico nei flussi di lavoro della visione artificiale:
La capacità di digitalizzare il movimento di persone e oggetti ha portato a applicazioni trasformative in vari settori industriali, spesso addestrate utilizzando strumenti come la Ultralytics per gestire grandi set di dati di punti chiave annotati.
Nel campo medico, l'intelligenza artificiale nel settore sanitario utilizza la stima della postura per monitorare a distanza la riabilitazione dei pazienti. Tracciando gli angoli articolari e l'ampiezza di movimento, i sistemi automatizzati possono garantire che i pazienti eseguano correttamente gli esercizi di fisioterapia a casa. Ciò riduce il rischio di recidive e consente ai medici di quantificare i progressi del recupero senza bisogno di costose attrezzature di laboratorio.
Allenatori e atleti sfruttano l' analisi dei dati sportivi per ottimizzare le prestazioni. I modelli di stima della posa possono analizzare il piano di swing di un golfista, la lunghezza della falcata di un corridore o la biomeccanica di un lanciatore senza la necessità di indossare le fastidiose tute con marcatori utilizzate nella tradizionale cattura del movimento. Ciò fornisce un feedback immediato e basato sui dati per migliorare la tecnica e prevenire lesioni da sovraccarico.
Negli ambienti commerciali, l'intelligenza artificiale nei sistemi di vendita al dettaglio utilizza il rilevamento delle pose per comprendere il comportamento dei clienti, come raggiungere prodotti su scaffali alti o soffermarsi in specifici corridoi. Questi dati aiutano a ottimizzare il layout dei negozi e a migliorare la gestione dell'inventario correlando le azioni fisiche con le decisioni di acquisto.
L'implementazione della stima della posa è semplice con i moderni Python framework.
L'esempio seguente mostra come utilizzare il ultralytics pacchetto per caricare un modello pre-addestrato
YOLO26 modello (il successore di
YOLO11) e detect i punti chiave detect in un'immagine.
from ultralytics import YOLO
# Load the YOLO26 pose model (nano version for speed)
model = YOLO("yolo26n-pose.pt")
# Perform inference on an image source
# The model identifies bounding boxes and specific keypoints (joints)
results = model("https://ultralytics.com/images/bus.jpg")
# Print the xy coordinates of detected keypoints
print(results[0].keypoints.xy)
# Visualize the skeletal results directly
results[0].show()