Yolo Vision Shenzhen
Shenzhen
Iscriviti ora
Glossario

Punti chiave

Scoprite i punti chiave della computer vision: stima della posa con Ultralytics YOLO11 per il fitness, il riconoscimento dei gesti e il tracciamento rapido e preciso.

I punti chiave sono posizioni spaziali specifiche e informative all'interno di un'immagine che definiscono le caratteristiche distintive di un oggetto o di una scena. Nel campo della visione artificiale (CV), questi punti, solitamente rappresentati come coordinate X e Y, indicano aree di interesse significative, come gli angoli di un edificio, i tratti del viso come gli occhi e il naso o le articolazioni anatomiche del corpo umano. A differenza dell'elaborazione di ogni pixel in una griglia densa, concentrarsi su questi punti sparsi e ricchi di significato consente ai modelli di intelligenza artificiale (AI) di comprendere in modo efficiente la geometria, analizzare le forme e track con elevata precisione. Questo concetto è fondamentale per attività avanzate che richiedono una comprensione strutturale del soggetto piuttosto che solo la sua presenza o posizione.

Il ruolo dei punti chiave nell'IA della visione

I punti chiave fungono da elementi fondamentali per mappare la struttura degli oggetti dinamici. Quando più punti chiave vengono rilevati e collegati, formano un grafico scheletrico o wireframe che rappresenta la posa dell'oggetto. Questo viene applicato più comunemente nella stima della posa, dove gli algoritmi di deep learning (DL) prevedono la posizione delle articolazioni - spalle, gomiti, fianchi e ginocchia - per ricostruire la postura umana o animale.

Sfruttando architetture avanzate come il modello Ultralytics , i sistemi possono regredire queste coordinate direttamente dalle immagini di input con una velocità notevole. Questo processo comporta una complessa estrazione di caratteristiche, in cui la rete neurale impara a identificare modelli locali invarianti rispetto all'illuminazione, alla rotazione e alla scala. Poiché i punti chiave rappresentano un riassunto sintetico dello stato di un oggetto, essi sono efficienti dal punto di vista computazionale, il che li rende ideali per l' inferenza in tempo reale su dispositivi di edge computing.

Distinguere i punti chiave dai concetti correlati

Per comprendere l'utilità specifica dei punti chiave, è utile confrontarli con altre attività primarie di visione artificiale presenti nella Ultralytics :

  • Punti chiave vs. Rilevamento oggetti: Il rilevamento standard identifica cosa è un oggetto e dove si trova racchiudendolo in un riquadro. Tuttavia, il riquadro tratta l'oggetto come un rettangolo rigido. I punti chiave guardano all'interno del riquadro per identificare l'articolazione interna, la postura e la struttura flessibile.
  • Punti chiave vs. istanze Segmentazione delle istanze: La segmentazione crea una maschera perfetta al pixel della silhouette dell'oggetto. Sebbene la segmentazione fornisca il massimo dettaglio dei confini, è spesso più pesante dal punto di vista computazionale. I punti chiave forniscono una sintesi strutturale semplificata, spesso preferita quando si analizza la cinematica o la dinamica del movimento.
  • Punti chiave vs. Annotazione dei dati: L'annotazione è il processo umano di etichettatura dei dati, mentre il rilevamento dei punti chiave è la previsione del modello. La creazione di un set di dati di addestramento comporta il clic manuale su punti specifici (ad esempio, "polso sinistro") per insegnare al modello tramite apprendimento supervisionato.

Applicazioni nel mondo reale

La capacità di track punti specifici di un soggetto apre le porte a diverse applicazioni in vari settori:

  • L'intelligenza artificiale nella sanità enella riabilitazione: Le applicazioni di fisioterapia monitorano gli esercizi dei pazienti da remoto. Tracciando i punti di riferimento del corpo, il sistema garantisce che gli esercizi vengano eseguiti con la forma corretta, contribuendo a una riabilitazione efficace. Ciò spesso comporta il calcolo dei gradi di libertà per comprendere l' ampiezza di movimento del paziente.
  • Analisi sportive: Allenatori e atleti utilizzano il rilevamento dei punti chiave per analizzare la biomeccanica. Tracciando gli angoli tra le articolazioni durante uno swing nel golf o uno sprint, i sistemi possono fornire un feedback automatico per ottimizzare le prestazioni e prevenire gli infortuni.
  • Sistemi di monitoraggio del conducente: nell'industria automobilistica, i sistemi di riconoscimento facciale track i punti di riferimento track (occhi, bocca) per detect di stanchezza o distrazione, avvisando i conducenti per prevenire incidenti.
  • Realtà aumentata (AR): nei filtri dei social media e nelle app di prova virtuale, i punti chiave del viso consentono alle maschere o agli occhiali digitali di allinearsi perfettamente con i movimenti dell'utente, richiedendo una precisa interazione uomo-computer.

Implementazione del rilevamento dei punti chiave

Le librerie moderne consentono di implementare facilmente il rilevamento dei punti chiave utilizzando modelli pre-addestrati. Il ultralytics Il pacchetto fornisce accesso immediato a modelli all'avanguardia come YOLO26 e YOLO11, che può essere addestrato su set di dati come COCO o Posizione della tigre.

L'esempio seguente mostra come caricare un modello di stima della posa e visualizzare i punti chiave rilevati utilizzando Python:

from ultralytics import YOLO

# Load a pretrained YOLO26n-pose model
model = YOLO("yolo26n-pose.pt")

# Run inference on a local image
results = model("path/to/runner.jpg")

# Visualize the results, showing the skeletal keypoints
results[0].show()

In questo flusso di lavoro, il modello genera un oggetto risultato contenente le coordinate e un punteggio di fiducia per ogni punto rilevato. Gli sviluppatori possono estrarre questi dati grezzi x, y valori per costruire una logica personalizzata, come il conteggio delle ripetizioni in un'applicazione di ginnastica o il controllare un personaggio del gioco tramite cattura del movimento.

Unitevi alla comunità di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora