Exploración del uso de la visión por ordenador para detectar la mirada

Abirami Vina

5 minutos de lectura

19 de febrero de 2025

Descubra cómo las técnicas de Vision AI, como la detección de objetos y la estimación de poses, pueden utilizarse para el seguimiento ocular y la detección de la mirada en diversas aplicaciones.

La visión por ordenador es una rama de la inteligencia artificial (IA) que se centra en capacitar a las máquinas para analizar e interpretar datos visuales de forma similar a los humanos. Una aplicación especialmente fascinante de la IA de visión es la detección de la mirada, que permite a las máquinas seguir y comprender hacia dónde mira una persona.

Como humanos, podemos seguir de forma natural la mirada de alguien y entender en qué se está centrando. Por ejemplo, si estamos hablando con un amigo y de repente mira hacia la puerta, nos giramos instintivamente para ver qué le ha llamado la atención. Las máquinas, en cambio, no tienen esta capacidad incorporada: hay que entrenarlas con técnicas de visión por ordenador para que reconozcan los movimientos oculares e interpreten la dirección de la mirada. 

Se espera que el mercado mundial de la detección de la mirada alcance los 11 900 millones de dólares en 2032, por lo que muchas industrias la están adoptando para diferentes aplicaciones. Por ejemplo, la detección de la mirada en automóviles se está utilizando para mejorar la seguridad del conductor mediante el control de los niveles de atención y la detección de signos de somnolencia o distracción.

En este artículo analizaremos cómo se utiliza la visión por ordenador para el seguimiento ocular y la detección de la mirada. También veremos algunas de sus aplicaciones clave en diversos sectores. Comencemos.

¿Qué es el seguimiento ocular y la detección de la mirada?

El seguimiento ocular y la detección de la mirada son técnicas utilizadas para determinar el foco de atención de una persona mediante el análisis de los movimientos oculares y la dirección de la mirada. Gracias a los avances en IA y tecnología de sensores, ahora es posible seguir los ojos de una persona en tiempo real. 

Tradicionalmente, la mayoría de los sistemas de seguimiento ocular se basan en cámaras de infrarrojos (IR), que detectan los movimientos de la pupila iluminando los ojos con luz casi infrarroja y captando los reflejos de la córnea. Estos sistemas ofrecen una gran precisión. Sin embargo, suelen requerir el uso de cascos especiales, que pueden resultar incómodos y dar lugar a problemas de calibración.

Con el auge de la IA, los investigadores han explorado activamente métodos de seguimiento ocular basados en la visión por ordenador. A diferencia de los sistemas tradicionales basados en infrarrojos, estos enfoques se basan en modelos de visión por ordenador como Ultralytics YOLO11 para detectar rasgos faciales como los ojos y las pupilas, así como para estimar la posición de la cabeza. Además, hay modelos especializados de aprendizaje profundo, como GazeNet de NVIDIA, diseñados específicamente para la estimación de la mirada. 

__wf_reserved_inherit
Fig. 1. Ejemplo de utilización de YOLO11 para detectar el ojo y la pupila de una persona.

Aunque todavía es un campo en evolución, el seguimiento de la mirada basado en la visión por ordenador tiene el potencial de hacer más accesible el seguimiento ocular, reduciendo costes y mejorando la usabilidad para aplicaciones en marketing, psicología y neurociencia.

Evolución de la detección de la mirada y el seguimiento ocular

A continuación, analicemos el paso de los sistemas tradicionales basados en infrarrojos a soluciones más accesibles basadas en software.

Tal vez se pregunte si el seguimiento ocular y la detección de la mirada pueden realizarse sin IA. Entonces, ¿por qué se está investigando la integración de la IA y la visión por ordenador en estas tecnologías? Aunque existen métodos tradicionales de seguimiento ocular, a menudo se basan en cámaras infrarrojas especializadas y dispositivos de seguimiento ocular montados en la cabeza, que pueden ser caros, incómodos y requieren condiciones de iluminación controladas. Sin embargo, las soluciones basadas en la IA permiten realizar el seguimiento ocular con cámaras web estándar y cámaras de teléfonos inteligentes, lo que reduce los costes y mejora la accesibilidad. 

__wf_reserved_inherit
Fig. 2. Dispositivo de seguimiento ocular montado en la cabeza.

He aquí otros factores que explican la evolución de la tecnología de seguimiento ocular y detección de la mirada:

  • Aplicaciones: Los enfoques basados en software permiten que este espacio se amplíe más allá de la investigación a dispositivos de consumo y áreas como los juegos.
  • Escalabilidad: La IA puede intervenir para poner las soluciones de detección de la mirada a disposición de un público más amplio, desde usuarios individuales hasta industrias a gran escala.
  • Avances en la tecnología de las cámaras: Hoy en día, tenemos acceso a cámaras de mayor resolución para smartphones y cámaras web que mejoran la precisión del seguimiento ocular, algo que no era factible hace 20 años.

Utilización de Ultralytics YOLO11 para la detección de la mirada y el seguimiento ocular

Ahora que ya hemos hablado del papel de la visión por ordenador en el seguimiento ocular y la detección de la mirada, vamos a ver cómo se puede utilizar YOLO11 en este caso.

Ultralytics YOLO11 admite tareas como la detección de objetos y la estimación de poses. Preentrenado en el conjunto de datos COCO, consigue una gran precisión en la detección de diversos objetos. En concreto, para una solución de detección de la mirada, YOLO11 puede desempeñar un papel de apoyo. 

Aunque no puede predecir directamente la dirección de la mirada, puede ajustarse para detectar rostros, ojos y pupilas, que son fundamentales para el análisis posterior. Una vez identificadas estas características, otros modelos pueden procesar los datos de los movimientos oculares para estimar la dirección de la mirada. 

Por ejemplo, para mejorar la precisión, YOLO11 puede entrenarse con conjuntos de datos como WIDER FACE para la detección de rostros. Además, con respecto a las capacidades de estimación de la pose de YOLO11, puede ayudar a rastrear la orientación de la cabeza, lo que mejora la precisión de la detección de la mirada.

__wf_reserved_inherit
Fig. 3. YOLO11 puede utilizarse para detectar rostros humanos.

Aplicaciones reales de la detección de la mirada

La detección de la mirada, que permite la visión por ordenador, tiene una amplia gama de aplicaciones en todos los sectores, desde la mejora de la seguridad en el sector de la automoción hasta el análisis de la atención en los juegos. Veamos cómo se aprovecha esta tecnología en distintos campos.

Seguimiento de la mirada en los juegos

El seguimiento ocular se está utilizando en los juegos para proporcionar información en tiempo real sobre la concentración, la toma de decisiones y los tiempos de reacción de los jugadores. Mediante el seguimiento de los movimientos oculares, esta tecnología ayuda a los jugadores a perfeccionar sus estrategias, mejora los programas de entrenamiento y aumenta la participación del público al mostrar visualmente hacia dónde miran los jugadores en los momentos clave.

Un ejemplo interesante es la simulación de carreras, un deporte de motor virtual y competitivo en el que los jugadores corren mediante simulaciones de conducción realistas. El seguimiento ocular ayuda a analizar cómo se concentran los conductores en la pista, cómo reaccionan ante sus rivales y cómo toman las curvas cerradas. Al seguir su mirada en tiempo real, los entrenadores pueden identificar patrones, detectar distracciones y mejorar las estrategias de carrera. 

__wf_reserved_inherit
Fig. 4. El seguimiento ocular puede utilizarse para controlar y analizar a los corredores de simulación. 

Más allá de las carreras de simulación, el seguimiento ocular también se utiliza en juegos de competición de ritmo rápido para analizar los reflejos de los jugadores, sus tiempos de reacción y cómo se centran en los elementos clave del juego. Al saber dónde mira un jugador antes de realizar un movimiento, estos datos ayudan a perfeccionar la toma de decisiones, mejorar la precisión y mejorar el entrenamiento para el juego de alto nivel.

Estimación de la mirada para la investigación psicológica

Existen muchas aplicaciones de la estimación de la mirada en la Inteligencia Artificial relacionada con la investigación. Un buen ejemplo es su uso en psicología para estudiar la atención, la carga cognitiva y el comportamiento social. Mediante el análisis de los movimientos oculares, los investigadores pueden obtener información sobre la percepción, la toma de decisiones y enfermedades mentales como el autismo y el TDAH. 

En concreto, el seguimiento de la mirada mediante visión por ordenador ayuda a identificar patrones en el movimiento ocular, la duración de la fijación y la atención visual, que pueden revelar estados cognitivos y emocionales. Con el avance del aprendizaje profundo y la estimación de la mirada impulsada por IA, estos métodos son cada vez más precisos y accesibles, lo que permite aplicaciones más amplias en la investigación neurológica.

Seguridad del automóvil

A lo largo de los años, los investigadores han utilizado distintos métodos para estudiar la atención y el enfoque de los conductores en distintas condiciones de tráfico. Entre estos métodos, el seguimiento ocular ha sido crucial y puede proporcionar información sobre hacia dónde mira el conductor mientras conduce. 

Con la ayuda de modelos de visión por ordenador, la detección de la mirada puede mejorar aún más este análisis mediante el seguimiento preciso de los movimientos oculares en tiempo real. Este análisis puede ayudarnos a comprender mejor el comportamiento del conductor e identificar distracciones, fatiga o fallos de atención, lo que puede mejorar la seguridad vial y contribuir al desarrollo de sistemas avanzados de asistencia al conductor.

__wf_reserved_inherit
Fig. 5. Ejemplo de seguimiento de un conductor mediante detección facial y seguimiento de la mirada.

Por ejemplo, si un conductor aparta con frecuencia la vista de la carretera para consultar su teléfono o reacciona con lentitud en los cruces, el sistema puede detectar estos comportamientos y emitir alertas para que vuelva a centrar su atención, evitando potencialmente accidentes.

Ventajas e inconvenientes del seguimiento ocular y la detección de la mirada

He aquí algunas de las principales ventajas que las tecnologías de seguimiento ocular y detección de la mirada pueden aportar a nuestra vida cotidiana:

  • Mayor conciencia: El seguimiento ocular permite comprender mejor la forma en que las personas interactúan visualmente con su entorno, lo que ayuda a entender mejor los patrones de atención y concentración.
  • Mejor toma de decisiones: Los datos recogidos a partir del seguimiento ocular ayudan a investigadores y profesionales a tomar decisiones fundamentadas basadas en patrones de atención objetivos.
  • Mejora de la ergonomía visual: Analizar el comportamiento de la mirada puede ayudar a diseñar pantallas, espacios de trabajo y entornos que reduzcan la fatiga visual y mejoren la comodidad.

Aunque estas ventajas ponen de relieve cómo la detección de la mirada puede influir positivamente en nuestras vidas, también es importante tener en cuenta los retos que implica su aplicación. Estas son algunas de las principales limitaciones que hay que tener en cuenta:

  • Privacidad: El seguimiento ocular continuo puede plantear problemas de privacidad e incomodar a los usuarios. Garantizar la transparencia, el consentimiento del usuario y el tratamiento local de los datos puede ayudar a mitigar estos problemas.
  • Alta demanda computacional: El seguimiento de la mirada en tiempo real puede requerir un hardware potente, lo que limita la accesibilidad en dispositivos de bajo consumo. Sin embargo, los modelos optimizados están ayudando a mejorar la eficiencia.
  • Limitaciones de precisión: El seguimiento de la mirada puede ser menos fiable en entornos reales debido a cambios de iluminación, movimientos de la cabeza u obstáculos como gafas y pelo. Los ángulos de la cámara también pueden afectar al rendimiento.

No perder de vista el futuro

El seguimiento ocular y la detección de la mirada, apoyados por modelos de visión por ordenador como YOLO11, están cambiando nuestra forma de interactuar con el mundo. Desde hacer más seguras las carreteras hasta comprender el comportamiento humano, esta tecnología es cada vez más útil en la vida cotidiana.

Aunque existen problemas como la privacidad y la necesidad de ordenadores potentes, los avances en inteligencia artificial y visión por ordenador están haciendo que el seguimiento ocular sea más preciso y fácil de usar. A medida que siga mejorando, es probable que desempeñe un papel más importante en diversos sectores.

Para obtener más información, visite nuestro repositorio de GitHub y participe en nuestra comunidad. Explore las innovaciones en sectores como la IA en los coches autónomos y la visión por ordenador en la agricultura en nuestras páginas de soluciones. Consulta nuestras opciones de licencia y da vida a tus proyectos de Vision AI. 🚀

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles