Scopri come i punti chiave definiscono la geometria e la postura degli oggetti nell'IA. Esplora la stima della posa con Ultralytics e inizia a utilizzare Python nostro Python facile da usare.
I punti chiave sono posizioni spaziali distinte o punti di riferimento all'interno di un'immagine che definiscono le caratteristiche significative di un oggetto o di un soggetto. Nel contesto della visione artificiale e dell'apprendimento automatico, un punto chiave è tipicamente rappresentato da un insieme di coordinate (X, Y) che individuano una parte specifica di un oggetto, come il gomito di una persona, l'angolo di un edificio o il centro di una ruota di automobile. A differenza di compiti più semplici che identificano solo la presenza di un oggetto, l'identificazione dei punti chiave consente ai modelli di intelligenza artificiale (AI) di comprendere la geometria, la postura e la disposizione strutturale del soggetto. Questa capacità è fondamentale per l' analisi visiva avanzata, consentendo alle macchine di interpretare il linguaggio del corpo, track movimenti track e allineare sovrapposizioni digitali con oggetti del mondo reale.
I punti chiave fungono da dati fondamentali per la stima della posa, una tecnica che mappa la struttura scheletrica di un essere umano o di un animale. Rilevando una serie predefinita di punti, come spalle, ginocchia e caviglie, gli algoritmi possono ricostruire la posa completa di un soggetto in tempo reale. Questo processo va oltre il rilevamento standard degli oggetti, che in genere produce un riquadro di delimitazione attorno a un oggetto senza comprenderne la forma interna.
Le architetture moderne, come l'avanguardistico Ultralytics , si sono evolute per prevedere questi punti chiave con elevata precisione e velocità. Questi modelli utilizzano reti di deep learning (DL) addestrate su enormi set di dati annotati, come COCO , per apprendere i modelli visivi associati alle articolazioni e alle caratteristiche facciali. Durante l'inferenza, il modello regredisce le coordinate per ciascun punto chiave, spesso includendo un punteggio di affidabilità per indicare l'affidabilità della previsione.
È utile distinguere i punti chiave dagli altri risultati comuni della visione artificiale per comprenderne l'utilità unica:
La capacità di track parti track del corpo o caratteristiche di oggetti apre la strada a diverse applicazioni in vari settori:
Utilizzando la Ultralytics o Python , gli sviluppatori possono facilmente implementare il rilevamento dei punti chiave. L'esempio seguente mostra come caricare un modello YOLO26-pose pre-addestrato ed eseguire l'inferenza su un'immagine per detect gli scheletri detect .
from ultralytics import YOLO
# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results showing detected keypoints and skeletons
for result in results:
result.show() # Display the image with keypoints drawn
# Access keypoint coordinates (x, y, confidence)
keypoints = result.keypoints.data
print(f"Detected keypoints shape: {keypoints.shape}")
Questo semplice flusso di lavoro consente la rapida implementazione di sofisticate applicazioni di visione artificiale (CV). Per gli utenti che desiderano addestrare i propri modelli personalizzati di punti chiave, ad esempio per detect punti detect su macchinari industriali o specie animali, la Ultralytics semplifica il processo di annotazione dei dati e di addestramento dei modelli nel cloud.
Per implementare con successo il rilevamento dei punti chiave è necessario affrontare sfide quali l'occlusione (quando una parte del corpo è nascosta) e condizioni di illuminazione diverse. I modelli moderni risolvono questo problema attraverso un robusto aumento dei dati durante l'addestramento, esponendo la rete a scenari diversi. Inoltre, l'integrazione dei punti chiave con algoritmi di tracciamento degli oggetti consente un'identificazione coerente degli individui nel tempo nei flussi video, essenziale per applicazioni quali la sicurezza o l'analisi comportamentale .