Scoprite i punti chiave della computer vision: stima della posa con Ultralytics YOLO11 per il fitness, il riconoscimento dei gesti e il tracciamento rapido e preciso.
Nella visione computerizzata, i keypoint sono punti di interesse specifici in un'immagine che sono distintivi e ripetibili. Questi punti servono come punti di riferimento compatti e strutturali che rappresentano un oggetto o una scena, consentendo alle macchine di comprendere e analizzare il contenuto visivo con maggiore dettaglio. Invece di elaborare ogni pixel, gli algoritmi si concentrano su questi punti chiave, come gli angoli, i bordi o le articolazioni di un corpo umano, per eseguire compiti complessi come il tracciamento del movimento, il riconoscimento degli oggetti e la ricostruzione di scene 3D. Concentrandosi su questi punti informativi, i modelli di computer vision possono raggiungere un'elevata efficienza e precisione.
L'applicazione principale dei keypoint è la stima della posa, un'attività di computer vision incentrata sull'identificazione della posizione e dell'orientamento di un oggetto o di una persona. Nella stima della posa umana, i punti chiave corrispondono alle principali articolazioni del corpo, come spalle, gomiti, ginocchia e polsi. Rilevando questi punti in un'immagine o in un video, un modello può costruire una rappresentazione scheletrica del corpo umano. Questo "scheletro digitale" consente a un sistema di intelligenza artificiale di analizzare la postura, i gesti e i movimenti senza dover comprendere l'aspetto della persona, l'abbigliamento o l'ambiente circostante.
I modelli avanzati di deep learning, come Ultralytics YOLO11, sono addestrati su grandi set di dati annotati come COCO per prevedere con precisione la posizione di questi punti chiave in tempo reale. I primi sistemi, come OpenPose, hanno aperto la strada dimostrando la capacità di rilevare i punti chiave di tutto il corpo, delle mani e del viso di più persone contemporaneamente. Le architetture moderne si sono basate su queste fondamenta per fornire risultati più rapidi e precisi per un'ampia gamma di applicazioni.
È importante differenziare il rilevamento dei punti chiave da altri compiti correlati nella computer vision:
La capacità di rilevare e tracciare i punti chiave ha permesso di compiere progressi significativi in diversi settori. Ecco due esempi significativi:
Altre applicazioni includono il rilevamento dei punti di riferimento facciali per l'analisi delle emozioni e i filtri AR, la stima della posa degli animali per gli studi comportamentali nella conservazione della fauna selvatica e la robotica per aiutare le macchine a navigare e interagire con il loro ambiente.