Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Ultralytics YOLO

Ultralytics YOLO26 vs altri modelli Ultralytics YOLO per la stima della posa

Scopri come Ultralytics YOLO26 migliora la stima della posa con un migliore supporto per keypoint non umani, convergenza più rapida, gestione migliorata delle occlusioni ed efficiente distribuzione in tempo reale.

ABAbirami Vina
4 min read
Confronto tra Ultralytics YOLO26 e altri modelli YOLO per la stima della posa

Quando osservi la postura di qualcuno, è facile notare se è ingobbito, se si sporge in avanti o se sta dritto. Gli esseri umani riescono a capire rapidamente come le diverse parti del corpo si relazionano tra loro.

È una parte intrinseca del modo in cui interpretiamo il movimento e il linguaggio del corpo nella vita quotidiana. Per le macchine, tuttavia, questo tipo di comprensione visiva non è automatico. Insegnare a un sistema a riconoscere il movimento e la struttura richiede tecniche avanzate di deep learning e computer vision che gli permettano di interpretare le immagini in modo significativo.

In particolare, la pose estimation è una tecnica di visione artificiale che rende possibile per un modello di computer vision costruire una comprensione simile. Invece di limitarsi a rilevare un oggetto in un'immagine, il modello predice dei keypoints che rappresentano importanti punti di riferimento strutturali.

Questi keypoints possono corrispondere ad articolazioni del corpo, arti di animali, componenti di macchinari o persino punti fissi come gli angoli di un campo. Identificando e tracciando questi punti, il sistema può comprendere la posizione, l'allineamento e il movimento in modo strutturato e misurabile.

Poiché la pose estimation viene applicata a scenari sempre più reali, i modelli devono gestire keypoints non umani, scene complesse e dataset personalizzati in modo più efficace. Ad esempio, modelli all'avanguardia come Ultralytics YOLO26 supportano attività di computer vision come la pose estimation e si basano su precedenti modelli di posa YOLO con miglioramenti architettonici e di addestramento progettati per aumentare la flessibilità e le prestazioni complessive.

Un esempio di pose estimation abilitata da YOLO

Fig 1. Un esempio di pose estimation abilitata da YOLO (Fonte)

In questo articolo, confronteremo YOLO26-pose con i precedenti modelli di posa Ultralytics YOLO ed esploreremo come migliora la flessibilità, la velocità di convergenza e le prestazioni in scene complesse. Iniziamo!

Link to this sectionCos'è la stima della posa?#

Prima di immergerci nel confronto tra i modelli di posa Ultralytics YOLO, diamo un'occhiata più da vicino a cosa significa realmente la pose estimation nel contesto della computer vision.

La pose estimation è una tecnica utilizzata per rilevare e tracciare keypoints specifici in un'immagine o in un fotogramma video. Questi keypoints possono rappresentare importanti punti di riferimento strutturali, come le articolazioni del corpo umano, gli arti di un animale, i componenti di una macchina o punti di riferimento fissi in una scena.

Stima della posa di lavoratori utilizzando la human pose estimation

Fig 2. Stima della posa di lavoratori utilizzando la human pose estimation (Fonte)

Identificando le coordinate di questi punti, un modello può comprendere come un oggetto è posizionato e come si muove nel tempo. A differenza della classificazione delle immagini, che assegna un'unica etichetta a un'intera immagine, o dei modelli di object detection, che si concentrano sul tracciare bounding box attorno agli oggetti, la pose estimation fornisce informazioni spaziali più dettagliate sulla struttura e sul movimento.

Link to this sectionUna panoramica di YOLO26-pose#

YOLO26-pose è disponibile in diverse varianti o dimensioni di modello, incluse opzioni leggere come YOLO26n-pose e modelli più grandi come YOLO26m-pose, YOLO26l-pose e YOLO26x-pose. Questo consente ai team di scegliere il giusto equilibrio tra velocità e precisione a seconda delle loro esigenze hardware e di prestazioni.

Ultralytics fornisce anche modelli di posa preaddestrati su dataset ampi e generali come il dataset COCO, specificamente le annotazioni COCO-Pose (keypoints COCO) per la stima della posa umana, così non devi partire da zero. Nella maggior parte dei casi, i team effettuano il fine-tuning di questi modelli sul proprio dataset per adattarli a keypoints, layout o ambienti specifici.

Questo in genere comporta la preparazione di file di annotazione personalizzati che definiscono le coordinate dei keypoints e le etichette di classe in un formato strutturato. Queste annotazioni mappano i keypoints su coordinate pixel specifiche all'interno di ogni immagine, consentendo al modello di apprendere precise relazioni spaziali durante l'addestramento.

L'utilizzo di modelli preaddestrati rende l'addestramento più veloce, riduce i requisiti di dati e aiuta a portare i progetti in produzione in modo più efficiente.

Link to this sectionApplicazioni reali della human pose estimation#

Ecco un'occhiata ad alcuni casi d'uso reali in cui la pose estimation gioca un ruolo importante:

  • Assistenza sanitaria e riabilitazione: I medici possono utilizzare modelli di posa per valutare la postura, monitorare i progressi della guarigione e analizzare i pattern di movimento durante la fisioterapia.
  • Sistemi autonomi: Droni e telecamere intelligenti possono utilizzare le informazioni sulla posa per comprendere meglio l'orientamento e il movimento degli oggetti in scene dinamiche.
  • Sicurezza sul lavoro: Le organizzazioni possono monitorare il posizionamento del corpo e i movimenti ripetitivi per aiutare a identificare potenziali rischi per la sicurezza.
  • Fitness e personal training: Le fitness app utilizzano la pose estimation per tracciare la forma fisica durante gli esercizi, contare le ripetizioni e fornire feedback in tempo reale sulla postura e sul movimento mantenuti durante i tutorial di fitness.

La pose estimation traccia punti chiave del corpo durante il movimento atletico

Fig 3. La pose estimation può aiutare a tracciare punti chiave del corpo durante il movimento atletico. (Fonte)

Link to this sectionEsplorazione del supporto di Ultralytics YOLO26 per la pose estimation#

Ultralytics YOLO26 si basa sui precedenti modelli Ultralytics YOLO con aggiornamenti progettati per rendere l'addestramento e il deployment più pratici.

Come le versioni precedenti, supporta la pose estimation come parte di un framework unificato. La differenza principale è che YOLO26 è costruito per essere più flessibile e stabile su una gamma più ampia di casi d'uso reali.

Benchmarking delle prestazioni di Ultralytics YOLO26

Fig 4. Benchmarking di YOLO26 (Fonte)

I precedenti modelli di posa Ultralytics YOLO erano influenzati in gran parte dai pose datasets umani, il che significava che parti dei vecchi metodi erano ottimizzate attorno alle strutture articolari umane. YOLO26 rimuove quelle supposizioni specifiche per gli esseri umani.

Di conseguenza, è più adatto per keypoints non umani, come il rilevamento degli angoli di un campo da tennis o altri punti di riferimento strutturali personalizzati. Questo è significativo perché, pronto all'uso, i modelli YOLO26-pose preaddestrati vengono addestrati su dataset come COCO-pose e predicono i keypoints umani definiti nelle annotazioni del dataset.

Tuttavia, quando i team vogliono rilevare diversi tipi di punti di riferimento, come componenti di macchinari, segnaposti di campi sportivi o punti infrastrutturali, il modello solitamente deve essere sottoposto a fine-tuning su un dataset personalizzato dove sono annotati quei keypoints specifici.

Poiché YOLO26 non è legato a supposizioni sulle strutture articolari umane, può adattarsi in modo più efficace durante il fine-tuning. Questa flessibilità consente al modello di apprendere layout di keypoints personalizzati in modo più affidabile, il che porta a migliori metriche di valutazione durante la convalida su dataset con configurazioni di keypoints uniche.

YOLO26-pose è anche progettato per migliorare la localizzazione dei keypoints quando le parti di un oggetto sono parzialmente nascoste o appaiono su scala molto piccola. In scene reali che coinvolgono soggetti distanti, riprese da droni o scenari con oggetti piccoli, questo può portare a predizioni dei keypoints più accurate rispetto ai precedenti modelli di posa.

Un altro importante aggiornamento è la formulazione della loss migliorata utilizzata durante l'addestramento. La funzione di loss determina come il modello corregge i suoi errori durante l'apprendimento.

Quando si parla di YOLO26-pose, questo processo è più efficace, il che aiuta il modello ad apprendere più velocemente e a raggiungere una forte precisione in meno epoche, dove un'epoca si riferisce a un passaggio completo attraverso il dataset di addestramento.

Nel complesso, YOLO26-pose si basa sui precedenti modelli di posa Ultralytics YOLO con chiari miglioramenti nel supporto ai keypoints non umani e nella convergenza dell'addestramento, mantenendo lo stesso familiare flusso di lavoro.

Link to this sectionConfronto tra YOLO26-pose e Ultralytics YOLOv5#

La prima versione dei modelli Ultralytics YOLO, Ultralytics YOLOv5, era costruita principalmente per l'object detection. Sebbene YOLOv5 si sia poi espanso per supportare l'instance segmentation, non include una head di pose estimation nativa e specializzata all'interno del framework ufficiale Ultralytics.

I team che avevano bisogno del rilevamento dei keypoints solitamente si affidavano a implementazioni separate o modifiche personalizzate. Ultralytics YOLO26 include la pose estimation come task integrato, con una head architettonica dedicata progettata specificamente per predire i keypoints.

Ciò significa che i modelli YOLO26-pose possono essere addestrati, validati e implementati all'interno dello stesso flusso di lavoro unificato di detection e segmentation. Per i progetti incentrati sul rilevamento strutturato dei keypoints, YOLO26 fornisce supporto nativo per la posa e un'architettura specifica per il task che YOLOv5 non offre nativamente.

Link to this sectionDifferenze chiave: YOLO26-pose vs Ultralytics YOLOv8-pose#

Ultralytics YOLOv8 ha introdotto la pose estimation nativa all'interno del framework unificato Ultralytics, rendendo facile addestrare e implementare modelli di keypoints utilizzando lo stesso flusso di lavoro di detection e segmentation. Si basa su una pipeline di post-processing tradizionale con non-maximum suppression (NMS) e utilizza precedenti formulazioni di loss per la regressione dei bounding box e l'addestramento.

YOLO26 si basa su questa base con aggiornamenti architettonici e di addestramento che incidono direttamente sulla pose estimation. Una differenza importante è il design end-to-end. YOLO26 elimina la necessità di NMS esterni durante l'inferenza, il che semplifica il deployment e migliora la coerenza della latenza, specialmente su CPU e dispositivi edge.

Un altro miglioramento chiave è nella metodologia di addestramento. YOLO26 introduce l'ottimizzatore MuSGD insieme a strategie di loss aggiornate. Per i task di posa, integra la Residual Log-Likelihood Estimation, che migliora il modo in cui viene modellata l'incertezza dei keypoints. Insieme, questi cambiamenti possono portare a una convergenza più rapida e a predizioni dei keypoints più stabili, particolarmente in scene complesse o parzialmente occluse.

In breve, YOLOv8-pose ha stabilito una base solida e versatile. YOLO26-pose perfeziona quella base con una maggiore efficienza di addestramento, una migliore gestione dell'occlusione e una maggiore flessibilità per applicazioni di posa reali e non umane.

Link to this sectionYOLO26-pose vs Ultralytics YOLO11-pose: Cosa è migliorato?#

Ultralytics YOLO11 si basa su Ultralytics YOLOv8 perfezionando il backbone e i livelli di estrazione delle caratteristiche. Ha ridotto i FLOP, migliorato l'efficienza dei parametri e fornito un mAP più elevato mantenendo prestazioni solide in tempo reale. Per i task di posa, questo ha significato una migliore precisione dei keypoints con un'architettura più leggera.

YOLO26-pose continua questa progressione con un cambiamento architettonico più fondamentale. In poche parole, YOLO11 ha perfezionato l'efficienza e la precisione di YOLOv8, e YOLO26 si basa su quella base con aggiornamenti architettonici e di addestramento mirati a una convergenza più rapida, un'inferenza più stabile e una migliore precisione della posa in scenari complessi.

Link to this sectionPerché dovresti iniziare a utilizzare il modello YOLO26 per la pose estimation?#

Mentre esplori le differenze tra i modelli Ultralytics YOLO, potresti chiederti se passare a YOLO26-pose.

La risposta breve è che è un aggiornamento facile. Se stai già utilizzando Ultralytics YOLOv8-pose o Ultralytics YOLO11-pose, passare a YOLO26-pose solitamente significa solo cambiare la versione del modello, non ricostruire la tua pipeline.

Puoi beneficiare di un migliore supporto per i keypoints non umani, una convergenza più rapida durante l'addestramento e una migliore gestione dei punti occlusi, il tutto rimanendo all'interno dello stesso framework Ultralytics. Per la maggior parte dei progetti di posa, nuovi ed esistenti, passare a YOLO26-pose è un modo semplice per ottenere quei miglioramenti con una frizione minima.

Oltre a questo, YOLO26-pose è pienamente supportato all'interno del pacchetto Python Ultralytics, che è costruito su PyTorch e rende semplici addestramento, validazione e deployment. I modelli possono essere esportati in formati come ONNX, TensorRT, OpenVINO, CoreML e TFLite, rendendo più facile l'implementazione su GPU, CPU e dispositivi edge senza modificare il tuo flusso di lavoro complessivo.

Link to this sectionPunti chiave#

Ultralytics YOLO26-pose rende la pose estimation più flessibile e affidabile, specialmente quando si lavora con keypoints non umani o scene complesse. Si addestra più velocemente, gestisce meglio l'occlusione e offre risultati più coerenti su diversi dataset. Per i team che utilizzano già i modelli di posa Ultralytics YOLO, YOLO26 offre chiari miglioramenti senza cambiare i flussi di lavoro esistenti.

Vuoi saperne di più sull'AI? Dai un'occhiata alla nostra community e al nostro repository GitHub. Esplora le nostre pagine di soluzioni per saperne di più su AI nella robotica e computer vision nell'agricoltura. Scopri le nostre opzioni di licenza e inizia a costruire con la computer vision oggi stesso!

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning