Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024
Glossario

Punti chiave

Scoprite i punti chiave della computer vision: stima della posa con Ultralytics YOLO11 per il fitness, il riconoscimento dei gesti e il tracciamento rapido e preciso.

Nella visione computerizzata, i keypoint sono punti di interesse specifici in un'immagine che sono distintivi e ripetibili. Questi punti servono come punti di riferimento compatti e strutturali che rappresentano un oggetto o una scena, consentendo alle macchine di comprendere e analizzare il contenuto visivo con maggiore dettaglio. Invece di elaborare ogni pixel, gli algoritmi si concentrano su questi punti chiave, come gli angoli, i bordi o le articolazioni di un corpo umano, per eseguire compiti complessi come il tracciamento del movimento, il riconoscimento degli oggetti e la ricostruzione di scene 3D. Concentrandosi su questi punti informativi, i modelli di computer vision possono raggiungere un'elevata efficienza e precisione.

Rilevamento dei punti chiave e stima della posa

L'applicazione principale dei keypoint è la stima della posa, un'attività di computer vision incentrata sull'identificazione della posizione e dell'orientamento di un oggetto o di una persona. Nella stima della posa umana, i punti chiave corrispondono alle principali articolazioni del corpo, come spalle, gomiti, ginocchia e polsi. Rilevando questi punti in un'immagine o in un video, un modello può costruire una rappresentazione scheletrica del corpo umano. Questo "scheletro digitale" consente a un sistema di intelligenza artificiale di analizzare la postura, i gesti e i movimenti senza dover comprendere l'aspetto della persona, l'abbigliamento o l'ambiente circostante.

I modelli avanzati di deep learning, come Ultralytics YOLO11, sono addestrati su grandi set di dati annotati come COCO per prevedere con precisione la posizione di questi punti chiave in tempo reale. I primi sistemi, come OpenPose, hanno aperto la strada dimostrando la capacità di rilevare i punti chiave di tutto il corpo, delle mani e del viso di più persone contemporaneamente. Le architetture moderne si sono basate su queste fondamenta per fornire risultati più rapidi e precisi per un'ampia gamma di applicazioni.

Punti chiave e altri concetti di computer vision

È importante differenziare il rilevamento dei punti chiave da altri compiti correlati nella computer vision:

  • Riquadri di delimitazione: Il rilevamento degli oggetti utilizza in genere un riquadro di delimitazione, unsemplice rettangolo, per indicare la posizione di un oggetto. Il rilevamento dei punti chiave offre una comprensione più dettagliata, identificando punti strutturali specifici all'interno del riquadro, descrivendo la posa e la forma dell'oggetto.
  • Segmentazione delle istanze: Mentre i keypoint creano un contorno scheletrico, la segmentazione delle istanze va oltre, delineando la forma esatta di un oggetto a livello di pixel. La segmentazione fornisce un confine completo, mentre i punti chiave offrono una sintesi strutturale.
  • Descrittori di caratteristiche: Dopo aver individuato un punto chiave, è possibile calcolare un descrittore di caratteristica per descrivere la zona dell'immagine che lo circonda. Algoritmi come SIFT e ORB generano questi descrittori, che fungono da "impronta digitale" numerica utilizzata per abbinare i punti chiave corrispondenti tra immagini diverse.

Applicazioni nel mondo reale

La capacità di rilevare e tracciare i punti chiave ha permesso di compiere progressi significativi in diversi settori. Ecco due esempi significativi:

  1. Analitica intelligente per il fitness e lo sport: Nelle applicazioni di fitness, i modelli di stima della posa tracciano le articolazioni chiave del corpo per monitorare la forma dell'utente durante esercizi come lo squat o lo yoga. Il sistema può contare le ripetizioni, fornire un feedback in tempo reale sulla postura per prevenire gli infortuni e analizzare le prestazioni atletiche con grande precisione. Questa tecnologia aiuta a creare esperienze di allenamento personalizzate e interattive, accessibili attraverso una normale fotocamera.
  2. Riconoscimento dei gesti della mano: Identificando i punti chiave della mano e delle dita, i sistemi di intelligenza artificiale possono interpretare i movimenti complessi della mano. Ciò è fondamentale per sviluppare controlli intuitivi nella realtà aumentata e virtuale, creare strumenti di traduzione del linguaggio dei segni e consentire l'interazione senza contatto con i dispositivi intelligenti. I modelli addestrati su set di dati di punti chiave della mano possono riconoscere gesti che vanno da un semplice pizzico a segni complessi.

Altre applicazioni includono il rilevamento dei punti di riferimento facciali per l'analisi delle emozioni e i filtri AR, la stima della posa degli animali per gli studi comportamentali nella conservazione della fauna selvatica e la robotica per aiutare le macchine a navigare e interagire con il loro ambiente.

Unisciti alla community di Ultralytics

Entra nel futuro dell'AI. Connettiti, collabora e cresci con innovatori globali

Iscriviti ora
Link copiato negli appunti