Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Punti chiave

Scopri come i punti chiave definiscono la geometria e la postura degli oggetti nell'IA. Esplora la stima della posa con Ultralytics e inizia a utilizzare Python nostro Python facile da usare.

I punti chiave sono posizioni spaziali distinte o punti di riferimento all'interno di un'immagine che definiscono le caratteristiche significative di un oggetto o di un soggetto. Nel contesto della visione artificiale e dell'apprendimento automatico, un punto chiave è tipicamente rappresentato da un insieme di coordinate (X, Y) che individuano una parte specifica di un oggetto, come il gomito di una persona, l'angolo di un edificio o il centro di una ruota di automobile. A differenza di compiti più semplici che identificano solo la presenza di un oggetto, l'identificazione dei punti chiave consente ai modelli di intelligenza artificiale (AI) di comprendere la geometria, la postura e la disposizione strutturale del soggetto. Questa capacità è fondamentale per l' analisi visiva avanzata, consentendo alle macchine di interpretare il linguaggio del corpo, track movimenti track e allineare sovrapposizioni digitali con oggetti del mondo reale.

Il ruolo dei punti chiave nei modelli di IA

I punti chiave fungono da dati fondamentali per la stima della posa, una tecnica che mappa la struttura scheletrica di un essere umano o di un animale. Rilevando una serie predefinita di punti, come spalle, ginocchia e caviglie, gli algoritmi possono ricostruire la posa completa di un soggetto in tempo reale. Questo processo va oltre il rilevamento standard degli oggetti, che in genere produce un riquadro di delimitazione attorno a un oggetto senza comprenderne la forma interna.

Le architetture moderne, come l'avanguardistico Ultralytics , si sono evolute per prevedere questi punti chiave con elevata precisione e velocità. Questi modelli utilizzano reti di deep learning (DL) addestrate su enormi set di dati annotati, come COCO , per apprendere i modelli visivi associati alle articolazioni e alle caratteristiche facciali. Durante l'inferenza, il modello regredisce le coordinate per ciascun punto chiave, spesso includendo un punteggio di affidabilità per indicare l'affidabilità della previsione.

Punti chiave vs. Concetti correlati

È utile distinguere i punti chiave dagli altri risultati comuni della visione artificiale per comprenderne l'utilità unica:

  • Punti chiave vs. Riquadri di delimitazione: un riquadro di delimitazione fornisce una localizzazione approssimativa, racchiudendo l'intero oggetto in un rettangolo. I punti chiave forniscono una localizzazione dettagliata di parti specifiche all'interno di quell'oggetto.
  • Punti chiave vs. Segmentazione dell'immagine: La segmentazione dell'immagine classifica ogni pixel per creare una maschera precisa della forma dell'oggetto. Mentre la segmentazione offre informazioni dettagliate sui confini, i punti chiave offrono una sintesi strutturale (uno "scheletro") che spesso è più efficiente per analizzare il movimento e la cinematica.
  • Punti chiave vs. descrittori di caratteristiche: nell'elaborazione tradizionale delle immagini come SIFT (Scale-Invariant Feature Transform), i punti chiave sono punti di interesse (angoli, macchie) utilizzati per l'abbinamento delle immagini. Nella moderna stima della posa DL, i punti chiave sono etichette semantiche (ad esempio, "polso sinistro") apprese dalla rete.

Applicazioni nel mondo reale

La capacità di track parti track del corpo o caratteristiche di oggetti apre la strada a diverse applicazioni in vari settori:

  • Analisi sportiva: allenatori e atleti utilizzano la stima della postura per analizzare la biomeccanica. Tracciando i punti chiave delle articolazioni, i sistemi possono calcolare angoli e velocità per migliorare la tecnica in sport come il golf, il tennis o lo sprint. Scopri come YOLO Ultralytics track per fornire un feedback utile.
  • Assistenza sanitaria e riabilitazione: le piattaforme di fisioterapia sfruttano i punti chiave per monitorare gli esercizi dei pazienti da remoto. Il sistema garantisce che i pazienti mantengano una postura corretta durante le routine di riabilitazione, riducendo il rischio di lesioni e monitorando i progressi del recupero.
  • Realtà aumentata (AR): i filtri dei social media e le applicazioni di prova virtuale si basano sui punti chiave del viso (occhi, naso, contorni della bocca) per ancorare saldamente maschere o occhiali digitali al viso dell'utente, mantenendo l' allineamento anche quando si muovono.
  • Monitoraggio del conducente: i sistemi di sicurezza automobilistici track i punti di riferimento track per detect di sonnolenza o distrazione, avvisando il conducente se i suoi occhi si chiudono o la posizione della testa indica una mancanza di attenzione.

Implementazione del rilevamento dei punti chiave con YOLO26

Utilizzando la Ultralytics o Python , gli sviluppatori possono facilmente implementare il rilevamento dei punti chiave. L'esempio seguente mostra come caricare un modello YOLO26-pose pre-addestrato ed eseguire l'inferenza su un'immagine per detect gli scheletri detect .

from ultralytics import YOLO

# Load a pre-trained YOLO26 pose estimation model
model = YOLO("yolo26n-pose.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results showing detected keypoints and skeletons
for result in results:
    result.show()  # Display the image with keypoints drawn

    # Access keypoint coordinates (x, y, confidence)
    keypoints = result.keypoints.data
    print(f"Detected keypoints shape: {keypoints.shape}")

Questo semplice flusso di lavoro consente la rapida implementazione di sofisticate applicazioni di visione artificiale (CV). Per gli utenti che desiderano addestrare i propri modelli personalizzati di punti chiave, ad esempio per detect punti detect su macchinari industriali o specie animali, la Ultralytics semplifica il processo di annotazione dei dati e di addestramento dei modelli nel cloud.

Considerazioni avanzate

Per implementare con successo il rilevamento dei punti chiave è necessario affrontare sfide quali l'occlusione (quando una parte del corpo è nascosta) e condizioni di illuminazione diverse. I modelli moderni risolvono questo problema attraverso un robusto aumento dei dati durante l'addestramento, esponendo la rete a scenari diversi. Inoltre, l'integrazione dei punti chiave con algoritmi di tracciamento degli oggetti consente un'identificazione coerente degli individui nel tempo nei flussi video, essenziale per applicazioni quali la sicurezza o l'analisi comportamentale .

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora