Yolo Vision Shenzhen
Shenzhen
Únete ahora

Explorando cómo se puede utilizar la visión artificial para la detección de la mirada

Abirami Vina

5 minutos de lectura

19 de febrero de 2025

Descubra cómo las técnicas de IA visual, como la detección de objetos y la estimación de la pose, pueden utilizarse para el seguimiento ocular y la detección de la mirada en diversas aplicaciones.

La visión por ordenador es una rama de la inteligencia artificial (IA) que se centra en capacitar a las máquinas para analizar e interpretar datos visuales de forma similar a los humanos. Una aplicación especialmente fascinante de la IA de visión es la detección de la mirada, que permite a las máquinas track y comprender hacia dónde mira una persona.

Como humanos, podemos seguir naturalmente la mirada de alguien y comprender en qué se está enfocando. Por ejemplo, si estás hablando con un amigo y de repente mira hacia la puerta, podrías girarte instintivamente para ver qué llamó su atención. Las máquinas, por otro lado, no tienen esta capacidad incorporada; deben ser entrenadas utilizando técnicas de visión artificial para reconocer los movimientos oculares e interpretar la dirección de la mirada. 

Con el mercado global de detección de la mirada previsto para alcanzar los 11.900 millones de dólares en 2032, muchas industrias lo están adoptando para diferentes aplicaciones. Por ejemplo, la detección de la mirada en los coches se está utilizando para mejorar la seguridad del conductor mediante la supervisión de los niveles de atención y la detección de signos de somnolencia o distracción.

En este artículo, exploraremos cómo se utiliza la visión artificial para el seguimiento ocular y la detección de la mirada. También analizaremos algunas de sus aplicaciones clave en diversas industrias. ¡Empecemos!

¿Qué es el seguimiento ocular y la detección de la mirada?

El seguimiento ocular y la detección de la mirada son técnicas utilizadas para determinar el foco de atención de una persona mediante el análisis de los movimientos oculares y la dirección de la mirada. Gracias a los avances en IA y tecnología de sensores, ahora es posible track los ojos de una persona en tiempo real. 

Tradicionalmente, la mayoría de los sistemas de seguimiento ocular se basan en cámaras de infrarrojos (IR), que detect los movimientos de la pupila iluminando los ojos con luz casi infrarroja y captando los reflejos de la córnea. Estos sistemas ofrecen una gran precisión. Sin embargo, a menudo requieren el uso de cascos especiales, que pueden resultar incómodos y dar lugar a problemas de calibración.

Con el auge de la IA, los investigadores han explorado activamente métodos de seguimiento ocular basados en la visión por ordenador. A diferencia de los sistemas tradicionales basados en infrarrojos, estos métodos se basan en modelos de visión por ordenador como Ultralytics YOLO11 para detect rasgos faciales como ojos y pupilas, así como para realizar la estimación de la pose de la cabeza. Además, hay modelos especializados de aprendizaje profundo, como GazeNet de NVIDIA, diseñados específicamente para la estimación de la mirada. 

__wf_reserved_inherit
Fig. 1. Ejemplo de utilización de YOLO11 para detect el ojo y la pupila de una persona.

Aunque todavía es un campo en evolución, el seguimiento de la mirada basado en visión artificial tiene el potencial de hacer que el seguimiento ocular sea más accesible, reduciendo los costes y mejorando la usabilidad para aplicaciones en marketing, psicología y neurociencia.

La evolución de la detección de la mirada y el seguimiento ocular

A continuación, exploremos el cambio de los sistemas tradicionales basados en infrarrojos a soluciones más accesibles impulsadas por software.

Puede que se pregunte si el seguimiento ocular y la detección de la mirada se pueden realizar sin IA, entonces, ¿por qué hay investigaciones en curso sobre la integración de la IA y la visión artificial en estas tecnologías? Si bien existen métodos tradicionales de seguimiento ocular, a menudo se basan en cámaras infrarrojas especializadas y dispositivos de seguimiento ocular montados en la cabeza, que pueden ser costosos, engorrosos y requerir condiciones de iluminación controladas. Sin embargo, las soluciones impulsadas por la IA permiten el seguimiento ocular utilizando cámaras web estándar y cámaras de teléfonos inteligentes, lo que reduce los costes y mejora la accesibilidad. 

__wf_reserved_inherit
Fig. 2. Un dispositivo de seguimiento ocular montado en la cabeza.

Estos son algunos de los otros factores detrás de la evolución de la tecnología de seguimiento ocular y detección de la mirada:

  • Aplicaciones: Los enfoques basados en software permiten que este espacio se expanda más allá de la investigación a dispositivos de consumo y áreas como los juegos.
  • Escalabilidad: La IA puede intervenir para que las soluciones de detección de la mirada estén disponibles para un público más amplio, desde usuarios individuales hasta industrias a gran escala.
  • Avances en la tecnología de las cámaras: Hoy en día, tenemos acceso a cámaras de teléfonos inteligentes y webcams de mayor resolución que mejoran la precisión del seguimiento ocular, algo que no era factible hace 20 años.

Utilización de Ultralytics YOLO11 para la detección de la mirada y el seguimiento ocular

Ahora que ya hemos hablado del papel de la visión por ordenador en el seguimiento ocular y la detección de la mirada, vamos a ver cómo se puede utilizar YOLO11 en este caso.

Ultralytics YOLO11 admite tareas como la detección de objetos y la estimación de poses. Preentrenado en el conjunto de datosCOCO , consigue una gran precisión en la detección de diversos objetos. En concreto, para una solución de detección de la mirada, YOLO11 puede desempeñar un papel de apoyo. 

Aunque no puede predecir directamente la dirección de la mirada, puede ajustarse para detect rostros, ojos y pupilas, que son fundamentales para el análisis posterior. Una vez identificadas estas características, otros modelos pueden procesar los datos de los movimientos oculares para estimar la dirección de la mirada. 

Por ejemplo, para mejorar la precisión, YOLO11 puede entrenarse con conjuntos de datos como WIDER FACE para la detección de rostros. Además, con respecto a las capacidades de estimación de la pose de YOLO11, puede ayudar a track la orientación de la cabeza, lo que mejora la precisión de la detección de la mirada.

__wf_reserved_inherit
Fig. 3. YOLO11 puede utilizarse para detect rostros humanos.

Aplicaciones en el mundo real de la detección de la mirada

La detección de la mirada, habilitada por la visión artificial, tiene una amplia gama de aplicaciones en todas las industrias, desde la mejora de la seguridad en el sector de la automoción hasta el análisis de la concentración en los juegos. Exploremos cómo los diferentes campos están aprovechando esta tecnología.

Seguimiento de la mirada en los juegos

El seguimiento ocular se está utilizando en los videojuegos para proporcionar información en tiempo real sobre la concentración, la toma de decisiones y los tiempos de reacción de los jugadores. Mediante el seguimiento de los movimientos oculares, esta tecnología ayuda a los jugadores a perfeccionar sus estrategias, mejora los programas de entrenamiento y aumenta la participación de la audiencia al mostrar visualmente dónde miran los jugadores durante los momentos clave.

Un ejemplo interesante es la simulación de carreras, un deporte de motor virtual y competitivo en el que los jugadores corren mediante simulaciones de conducción realistas. El seguimiento ocular ayuda a analizar cómo se concentran los conductores en la track, cómo reaccionan ante sus rivales y cómo toman las curvas cerradas. Al seguir su mirada en tiempo real, los entrenadores pueden identificar patrones, detectar distracciones y mejorar las estrategias de carrera. 

__wf_reserved_inherit
Fig. 4. El seguimiento ocular se puede utilizar para monitorizar y analizar a los corredores de simulador. 

Más allá de las carreras de simulación, el seguimiento ocular también se está utilizando en juegos competitivos de ritmo rápido para analizar los reflejos de los jugadores, los tiempos de reacción y cómo se enfocan en los elementos clave del juego. Al comprender dónde mira un jugador antes de hacer un movimiento, estos datos ayudan a refinar la toma de decisiones, mejorar la precisión y mejorar el entrenamiento para un juego de alto nivel.

Estimación de la mirada para la investigación psicológica

Existen muchas aplicaciones de IA de visión de la estimación de la mirada relacionadas con la investigación. Un buen ejemplo de esto es su uso en psicología para estudiar la atención, la carga cognitiva y el comportamiento social. Al analizar los movimientos oculares, los investigadores pueden obtener información sobre la percepción, la toma de decisiones y las condiciones de salud mental como el autismo y el TDAH. 

Específicamente, el seguimiento de la mirada mediante visión artificial ayuda a identificar patrones en el movimiento ocular, la duración de la fijación y la atención visual, lo que puede revelar estados cognitivos y emocionales. Con el avance del aprendizaje profundo y la estimación de la mirada impulsada por la IA, estos métodos son cada vez más precisos y accesibles, lo que permite aplicaciones más amplias en la investigación neurológica.

Seguridad automotriz

A lo largo de los años, los investigadores han utilizado diferentes métodos para estudiar la atención y la concentración de los conductores durante diferentes condiciones de tráfico. Entre estos métodos, el seguimiento ocular ha sido crucial y puede proporcionar información sobre hacia dónde mira el conductor mientras conduce. 

Con la ayuda de modelos de visión artificial, la detección de la mirada puede mejorar aún más este análisis mediante el seguimiento preciso de los movimientos oculares en tiempo real. Este análisis puede darnos una mejor comprensión del comportamiento del conductor, ayudando a identificar distracciones, fatiga o lapsos de atención, lo que puede mejorar la seguridad vial y ayudar en el desarrollo de sistemas avanzados de asistencia al conductor.

__wf_reserved_inherit
Fig 5. Un ejemplo de monitorización de un conductor mediante la detección facial y el seguimiento de la mirada.

Por ejemplo, si un conductor aparta con frecuencia la vista de la carretera para consultar su teléfono o reacciona con lentitud en los cruces, el sistema puede detect estos comportamientos y emitir alertas para que vuelva a centrar su atención, evitando potencialmente accidentes.

Pros y contras del seguimiento ocular y la detección de la mirada

Estos son algunos de los principales beneficios que las tecnologías de seguimiento ocular y detección de la mirada pueden aportar a nuestra vida cotidiana:

  • Mayor conciencia: El seguimiento ocular proporciona información sobre cómo las personas interactúan visualmente con su entorno, lo que ayuda a comprender mejor los patrones de atención y concentración.
  • Mejor toma de decisiones: Los datos recopilados del seguimiento ocular ayudan a los investigadores y profesionales a tomar decisiones informadas basadas en patrones de atención objetivos.
  • Ergonomía visual mejorada: El análisis del comportamiento de la mirada puede ayudar a diseñar pantallas, espacios de trabajo y entornos que reduzcan la fatiga visual y mejoren la comodidad.

Si bien estos beneficios resaltan cómo la detección de la mirada puede impactar positivamente en nuestras vidas, también es importante considerar los desafíos involucrados en su implementación. Estas son algunas de las limitaciones clave que hay que tener en cuenta:

  • Preocupaciones sobre la privacidad: El seguimiento ocular continuo puede generar problemas de privacidad, lo que incomoda a los usuarios. Garantizar la transparencia, el consentimiento del usuario y el procesamiento local de datos puede ayudar a mitigar estas preocupaciones.
  • Alta demanda computacional: El seguimiento de la mirada en tiempo real puede requerir hardware potente, lo que limita la accesibilidad en dispositivos de baja potencia. Sin embargo, los modelos optimizados están ayudando a mejorar la eficiencia.
  • Limitaciones de precisión: El seguimiento de la mirada puede ser menos fiable en entornos del mundo real debido a los cambios de iluminación, los movimientos de la cabeza o los obstáculos como las gafas y el pelo. Los ángulos de la cámara también pueden afectar al rendimiento.

Manteniendo la vista en el futuro

El seguimiento ocular y la detección de la mirada, apoyados por modelos de visión por ordenador como YOLO11, están cambiando nuestra forma de interactuar con el mundo. Desde hacer más seguras las carreteras hasta comprender el comportamiento humano, esta tecnología es cada vez más útil en la vida cotidiana.

Si bien existen desafíos como los problemas de privacidad y la necesidad de ordenadores potentes, los avances en la IA y la visión artificial están haciendo que el seguimiento ocular sea más preciso y fácil de usar. A medida que siga mejorando, es probable que desempeñe un papel más importante en una serie de industrias.

Para obtener más información, visita nuestro repositorio de GitHub e interactúa con nuestra comunidad. Explora las innovaciones en sectores como la IA en coches autónomos y la visión artificial en la agricultura en nuestras páginas de soluciones. Consulta nuestras opciones de licencia y da vida a tus proyectos de Vision AI. 🚀

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis