Sintonizzati su YOLO Vision 2025!
25 settembre 2025
10:00 — 18:00 BST
Evento ibrido
Yolo Vision 2024

Esplorando come la computer vision può essere utilizzata per il rilevamento dello sguardo

Abirami Vina

5 minuti di lettura

19 febbraio 2025

Scopri come le tecniche di Vision AI, come il rilevamento di oggetti e la stima della posa, possono essere utilizzate per il tracciamento oculare e il rilevamento dello sguardo in diverse applicazioni.

La computer vision è una branca dell'intelligenza artificiale (IA) che si concentra sul consentire alle macchine di analizzare e interpretare i dati visivi in un modo simile agli umani. Un'applicazione particolarmente affascinante della Vision AI è il rilevamento dello sguardo, che consente alle macchine di tracciare e comprendere dove sta guardando una persona.

Come esseri umani, siamo in grado di seguire naturalmente lo sguardo di qualcuno e capire su cosa si sta concentrando. Ad esempio, se stai parlando con un amico e all'improvviso guarda verso la porta, potresti istintivamente girarti per vedere cosa ha attirato la sua attenzione. Le macchine, d'altra parte, non hanno questa capacità innata: devono essere addestrate utilizzando tecniche di computer vision per riconoscere i movimenti degli occhi e interpretare la direzione dello sguardo. 

Considerando che il mercato globale del rilevamento dello sguardo dovrebbe raggiungere gli 11,9 miliardi di dollari entro il 2032, molti settori lo stanno adottando per diverse applicazioni. Ad esempio, il rilevamento dello sguardo nelle auto viene utilizzato per migliorare la sicurezza del conducente monitorando i livelli di attenzione e rilevando segni di sonnolenza o distrazione.

In questo articolo, esploreremo come viene utilizzata la computer vision per il tracciamento oculare e il rilevamento dello sguardo. Esamineremo anche alcune delle sue principali applicazioni in vari settori.

Cosa sono l'eye tracking e il rilevamento dello sguardo?

Il tracciamento oculare e il rilevamento dello sguardo sono tecniche utilizzate per determinare il focus dell'attenzione di una persona analizzando i movimenti oculari e la direzione dello sguardo. Grazie ai progressi nell'intelligenza artificiale e nella tecnologia dei sensori, ora è possibile tracciare gli occhi di una persona in tempo reale. 

Tradizionalmente, la maggior parte dei sistemi di eye-tracking si basa su telecamere a infrarossi (IR), che rilevano i movimenti della pupilla illuminando gli occhi con luce nel vicino infrarosso e catturando i riflessi corneali. Questi sistemi offrono un'elevata precisione. Tuttavia, spesso richiedono copricapi specializzati, che possono essere scomodi da indossare e soggetti a problemi di calibrazione.

Con l'ascesa dell'IA, i ricercatori hanno esplorato attivamente metodi di eye tracking basati sulla computer vision. A differenza dei tradizionali sistemi basati su IR, questi approcci si affidano a modelli di computer vision come Ultralytics YOLO11 per rilevare le caratteristiche del viso come occhi e pupille, nonché per eseguire la stima della posa della testa. Oltre a questo, modelli specializzati di deep learning come GazeNet di NVIDIA sono progettati specificamente per la stima dello sguardo. 

__wf_reserved_inherit
Fig. 1. Esempio di utilizzo di YOLO11 per rilevare l'occhio e la pupilla di una persona.

Sebbene sia ancora un campo in evoluzione, il tracciamento dello sguardo basato sulla computer vision ha il potenziale per rendere il tracciamento oculare più accessibile, riducendo i costi e migliorando l'usabilità per le applicazioni nel marketing, nella psicologia e nelle neuroscienze.

L'evoluzione del rilevamento dello sguardo e del tracciamento oculare

Successivamente, esploriamo il passaggio dai tradizionali sistemi basati sull'infrarosso a soluzioni più accessibili e guidate dal software.

Potresti chiederti se l'eye tracking e il gaze detection possono essere eseguiti senza l'AI: perché allora c'è una ricerca continua sull'integrazione dell'AI e della computer vision in queste tecnologie? Sebbene esistano metodi tradizionali di eye-tracking, spesso si basano su telecamere a infrarossi specializzate e dispositivi di eye-tracker montati sulla testa, che possono essere costosi, ingombranti e richiedere condizioni di illuminazione controllate. Le soluzioni basate sull'AI, tuttavia, consentono l'eye tracking utilizzando webcam standard e fotocamere di smartphone, riducendo i costi e migliorando l'accessibilità. 

__wf_reserved_inherit
Fig. 2. Un dispositivo eye tracker montato sulla testa.

Ecco alcuni degli altri fattori alla base dell'evoluzione della tecnologia di eye tracking e rilevamento dello sguardo:

  • Applicazioni: Gli approcci basati su software consentono a questo spazio di espandersi oltre la ricerca in dispositivi consumer e aree come il gaming.
  • Scalabilità: L'AI può intervenire per rendere le soluzioni di rilevamento dello sguardo disponibili a un pubblico più ampio, dai singoli utenti alle industrie su larga scala.
  • Progressi nella tecnologia delle fotocamere: Oggi abbiamo accesso a fotocamere per smartphone e webcam ad alta risoluzione che migliorano l'accuratezza del tracciamento oculare, cosa che non era fattibile 20 anni fa.

Utilizzo di Ultralytics YOLO11 per il rilevamento dello sguardo e il tracciamento oculare

Ora che abbiamo discusso del ruolo della computer vision nel tracciamento oculare e nel rilevamento dello sguardo, esaminiamo come YOLO11 può essere utilizzato qui.

Ultralytics YOLO11 supporta task come l'object detection e la pose estimation. Pre-addestrato sul dataset COCO, raggiunge un'elevata precisione nel rilevamento di vari oggetti. Nello specifico, per una soluzione di gaze detection, YOLO11 può svolgere un ruolo di supporto. 

Sebbene non possa prevedere direttamente la direzione dello sguardo, può essere sottoposto a fine-tuning per rilevare volti, occhi e pupille, che sono fondamentali per ulteriori analisi. Una volta identificate queste caratteristiche, modelli aggiuntivi possono elaborare i dati del movimento oculare per stimare la direzione dello sguardo. 

Ad esempio, per migliorare la precisione, YOLO11 può essere addestrato su misura su dataset come WIDER FACE per il rilevamento dei volti. Inoltre, per quanto riguarda le capacità di stima della posa di YOLO11, può aiutare a tracciare l'orientamento della testa, il che migliora la precisione del rilevamento dello sguardo.

__wf_reserved_inherit
Fig. 3. YOLO11 può essere utilizzato per rilevare volti umani.

Applicazioni nel mondo reale del rilevamento dello sguardo

Il rilevamento dello sguardo, reso possibile dalla computer vision, ha una vasta gamma di applicazioni in diversi settori, dal miglioramento della sicurezza nel settore automobilistico all'analisi dell'attenzione nel gaming. Esploriamo come diversi campi stanno sfruttando questa tecnologia.

Tracciamento dello sguardo nel gaming

Il tracciamento oculare viene utilizzato nel gaming per fornire informazioni in tempo reale sulla concentrazione, il processo decisionale e i tempi di reazione dei giocatori. Tracciando i movimenti oculari, questa tecnologia aiuta i giocatori a perfezionare le proprie strategie, migliora i programmi di allenamento e aumenta il coinvolgimento del pubblico mostrando visivamente dove i giocatori stanno guardando durante i momenti chiave.

Un esempio interessante di questo è il sim racing, uno sport motoristico virtuale competitivo in cui i giocatori corrono utilizzando simulazioni di guida realistiche. Il tracciamento oculare aiuta ad analizzare come i piloti si concentrano sulla pista, reagiscono agli avversari e affrontano le curve strette. Tracciando il loro sguardo in tempo reale, gli allenatori possono identificare schemi, individuare distrazioni e migliorare le strategie di corsa. 

__wf_reserved_inherit
Fig 4. L'eye tracking può essere utilizzato per monitorare e analizzare i piloti di simulazione di corse. 

Oltre alle corse simulate, il tracciamento oculare viene utilizzato anche in giochi competitivi dal ritmo frenetico per analizzare i riflessi, i tempi di reazione dei giocatori e il modo in cui si concentrano sugli elementi chiave del gioco. Comprendendo dove guarda un giocatore prima di fare una mossa, questi dati aiutano a perfezionare il processo decisionale, migliorare la precisione e migliorare l'allenamento per un gameplay di alto livello.

Stima dello sguardo per la ricerca psicologica

Esistono molte applicazioni di Vision AI per la stima dello sguardo correlate alla ricerca. Un buon esempio è il suo utilizzo in psicologia per studiare l'attenzione, il carico cognitivo e il comportamento sociale. Analizzando i movimenti oculari, i ricercatori possono ottenere informazioni sulla percezione, sul processo decisionale e su condizioni di salute mentale come l'autismo e l'ADHD. 

Nello specifico, il tracciamento dello sguardo tramite computer vision aiuta a identificare schemi nei movimenti oculari, nella durata della fissazione e nell'attenzione visiva, rivelando stati cognitivi ed emotivi. Con l'avanzamento del deep learning e della stima dello sguardo basata sull'intelligenza artificiale, questi metodi stanno diventando più accurati e accessibili, consentendo applicazioni più ampie nella ricerca neurologica.

Sicurezza automobilistica

Nel corso degli anni, i ricercatori hanno utilizzato diversi metodi per studiare l'attenzione e la concentrazione dei conducenti durante le diverse condizioni di traffico. Tra questi metodi, l'eye-tracking è stato fondamentale e può fornire informazioni su dove il conducente sta guardando mentre guida. 

Con l'aiuto di modelli di computer vision, il rilevamento dello sguardo può migliorare ulteriormente questa analisi tracciando accuratamente i movimenti oculari in tempo reale. Questa analisi può fornirci una migliore comprensione del comportamento del conducente, aiutando a identificare distrazioni, affaticamento o cali di attenzione, il che può migliorare la sicurezza stradale e assistere nello sviluppo di sistemi avanzati di assistenza alla guida.

__wf_reserved_inherit
Fig 5. Un esempio di monitoraggio di un conducente tramite rilevamento del volto e tracciamento dello sguardo.

Ad esempio, se un conducente distoglie frequentemente lo sguardo dalla strada per controllare il telefono o reagisce lentamente agli incroci, il sistema può rilevare questi comportamenti ed emettere avvisi per riportare la sua attenzione, prevenendo potenzialmente incidenti.

Pro e contro del tracciamento oculare e del rilevamento dello sguardo

Ecco alcuni dei principali vantaggi che le tecnologie di eye-tracking e gaze-detection possono apportare alla nostra vita quotidiana:

  • Maggiore consapevolezza: L'eye tracking fornisce informazioni su come le persone interagiscono visivamente con l'ambiente circostante, aiutando a comprendere meglio l'attenzione e i modelli di concentrazione.
  • Migliore processo decisionale: I dati raccolti dal tracciamento oculare aiutano ricercatori e professionisti a prendere decisioni informate basate su modelli di attenzione oggettivi.
  • Ergonomia visiva migliorata: L'analisi del comportamento dello sguardo può aiutare a progettare schermi, spazi di lavoro e ambienti che riducono l'affaticamento degli occhi e migliorano il comfort.

Sebbene questi vantaggi evidenzino come il rilevamento dello sguardo possa avere un impatto positivo sulle nostre vite, è anche importante considerare le sfide che comporta la sua implementazione. Ecco alcune delle principali limitazioni da tenere a mente:

  • Problemi relativi alla privacy: Il tracciamento continuo degli occhi può sollevare problemi di privacy, mettendo a disagio gli utenti. Garantire trasparenza, consenso dell'utente ed elaborazione locale dei dati può aiutare a mitigare queste preoccupazioni.
  • Elevata richiesta computazionale: Il tracciamento dello sguardo in tempo reale può richiedere hardware potente, limitando l'accessibilità su dispositivi a bassa potenza. Tuttavia, i modelli ottimizzati stanno contribuendo a migliorare l'efficienza.
  • Limitazioni di accuratezza: Il tracciamento dello sguardo può essere meno affidabile in ambienti reali a causa di cambiamenti di illuminazione, movimenti della testa o ostacoli come occhiali e capelli. Anche gli angoli di ripresa possono influire sulle prestazioni.

Tenendo gli occhi puntati sul futuro

Il tracciamento oculare e il rilevamento dello sguardo, supportati da modelli di computer vision come YOLO11, stanno cambiando il modo in cui interagiamo con il mondo. Dal rendere le strade più sicure alla comprensione del comportamento umano, questa tecnologia sta diventando sempre più utile nella vita di tutti i giorni.

Sebbene ci siano sfide come i problemi di privacy e la necessità di computer potenti, i progressi nell'IA e nella computer vision stanno rendendo il tracciamento oculare più accurato e facile da usare. Man mano che continua a migliorare, probabilmente svolgerà un ruolo più importante in una vasta gamma di settori.

Per saperne di più, visita il nostro repository GitHub e interagisci con la nostra community. Esplora le innovazioni in settori come l'AI nelle auto a guida autonoma e la computer vision in agricoltura nelle nostre pagine delle soluzioni. Consulta le nostre opzioni di licenza e dai vita ai tuoi progetti di Vision AI. 🚀

Costruiamo insieme il futuro
dell'AI!

Inizia il tuo viaggio con il futuro del machine learning

Inizia gratis
Link copiato negli appunti