¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Explorando cómo se puede utilizar la visión artificial para la detección de la mirada

Abirami Vina

5 minutos de lectura

19 de febrero de 2025

Descubra cómo las técnicas de IA visual, como la detección de objetos y la estimación de la pose, pueden utilizarse para el seguimiento ocular y la detección de la mirada en diversas aplicaciones.

La visión artificial es una rama de la inteligencia artificial (IA) que se centra en permitir que las máquinas analicen e interpreten datos visuales de una manera similar a los humanos. Una aplicación particularmente fascinante de la Visión Artificial es la detección de la mirada, que permite a las máquinas rastrear y comprender hacia dónde está mirando una persona.

Como humanos, podemos seguir naturalmente la mirada de alguien y comprender en qué se está enfocando. Por ejemplo, si estás hablando con un amigo y de repente mira hacia la puerta, podrías girarte instintivamente para ver qué llamó su atención. Las máquinas, por otro lado, no tienen esta capacidad incorporada; deben ser entrenadas utilizando técnicas de visión artificial para reconocer los movimientos oculares e interpretar la dirección de la mirada. 

Con el mercado global de detección de la mirada previsto para alcanzar los 11.900 millones de dólares en 2032, muchas industrias lo están adoptando para diferentes aplicaciones. Por ejemplo, la detección de la mirada en los coches se está utilizando para mejorar la seguridad del conductor mediante la supervisión de los niveles de atención y la detección de signos de somnolencia o distracción.

En este artículo, exploraremos cómo se utiliza la visión artificial para el seguimiento ocular y la detección de la mirada. También analizaremos algunas de sus aplicaciones clave en diversas industrias. ¡Empecemos!

¿Qué es el seguimiento ocular y la detección de la mirada?

El seguimiento ocular y la detección de la mirada son técnicas utilizadas para determinar el foco de atención de una persona mediante el análisis de los movimientos oculares y la dirección de la mirada. Gracias a los avances en la IA y la tecnología de sensores, ahora es posible rastrear los ojos de una persona en tiempo real. 

Tradicionalmente, la mayoría de los sistemas de seguimiento ocular se basan en cámaras de infrarrojos (IR), que detectan los movimientos de la pupila iluminando los ojos con luz infrarroja cercana y capturando los reflejos corneales. Estos sistemas proporcionan una alta precisión. Sin embargo, a menudo requieren cascos especializados, que pueden ser incómodos de llevar y propensos a problemas de calibración.

Con el auge de la IA, los investigadores han estado explorando activamente métodos de seguimiento ocular basados en la visión artificial. A diferencia de los sistemas tradicionales basados en IR, estos enfoques se basan en modelos de visión artificial como Ultralytics YOLO11 para detectar características faciales como los ojos y las pupilas, así como para realizar la estimación de la pose de la cabeza. Más allá de esto, los modelos especializados de aprendizaje profundo como GazeNet de NVIDIA están diseñados específicamente para la estimación de la mirada. 

__wf_reserved_inherit
Fig. 1. Un ejemplo del uso de YOLO11 para detectar el ojo y la pupila de una persona.

Aunque todavía es un campo en evolución, el seguimiento de la mirada basado en visión artificial tiene el potencial de hacer que el seguimiento ocular sea más accesible, reduciendo los costes y mejorando la usabilidad para aplicaciones en marketing, psicología y neurociencia.

La evolución de la detección de la mirada y el seguimiento ocular

A continuación, exploremos el cambio de los sistemas tradicionales basados en infrarrojos a soluciones más accesibles impulsadas por software.

Puede que se pregunte si el seguimiento ocular y la detección de la mirada se pueden realizar sin IA, entonces, ¿por qué hay investigaciones en curso sobre la integración de la IA y la visión artificial en estas tecnologías? Si bien existen métodos tradicionales de seguimiento ocular, a menudo se basan en cámaras infrarrojas especializadas y dispositivos de seguimiento ocular montados en la cabeza, que pueden ser costosos, engorrosos y requerir condiciones de iluminación controladas. Sin embargo, las soluciones impulsadas por la IA permiten el seguimiento ocular utilizando cámaras web estándar y cámaras de teléfonos inteligentes, lo que reduce los costes y mejora la accesibilidad. 

__wf_reserved_inherit
Fig. 2. Un dispositivo de seguimiento ocular montado en la cabeza.

Estos son algunos de los otros factores detrás de la evolución de la tecnología de seguimiento ocular y detección de la mirada:

  • Aplicaciones: Los enfoques basados en software permiten que este espacio se expanda más allá de la investigación a dispositivos de consumo y áreas como los juegos.
  • Escalabilidad: La IA puede intervenir para que las soluciones de detección de la mirada estén disponibles para un público más amplio, desde usuarios individuales hasta industrias a gran escala.
  • Avances en la tecnología de las cámaras: Hoy en día, tenemos acceso a cámaras de teléfonos inteligentes y webcams de mayor resolución que mejoran la precisión del seguimiento ocular, algo que no era factible hace 20 años.

Uso de Ultralytics YOLO11 para la detección de la mirada y el seguimiento ocular

Ahora que hemos discutido el papel de la visión artificial en el seguimiento ocular y la detección de la mirada, vamos a repasar cómo se puede utilizar YOLO11 aquí.

Ultralytics YOLO11 admite tareas como la detección de objetos y la estimación de la pose. Pre-entrenado en el conjunto de datos COCO, alcanza una alta precisión en la detección de varios objetos. Específicamente, para una solución de detección de la mirada, YOLO11 puede desempeñar un papel de apoyo. 

Si bien no puede predecir directamente la dirección de la mirada, se puede ajustar para detectar rostros, ojos y pupilas, que son clave para un análisis posterior. Una vez que se identifican estas características, los modelos adicionales pueden procesar los datos de movimiento ocular para estimar la dirección de la mirada. 

Por ejemplo, para mejorar la precisión, YOLO11 puede entrenarse a medida en conjuntos de datos como WIDER FACE para la detección de rostros. Además, con respecto a las capacidades de estimación de la pose de YOLO11, puede ayudar a rastrear la orientación de la cabeza, lo que mejora la precisión de la detección de la mirada.

__wf_reserved_inherit
Fig. 3. YOLO11 se puede utilizar para detectar rostros humanos.

Aplicaciones en el mundo real de la detección de la mirada

La detección de la mirada, habilitada por la visión artificial, tiene una amplia gama de aplicaciones en todas las industrias, desde la mejora de la seguridad en el sector de la automoción hasta el análisis de la concentración en los juegos. Exploremos cómo los diferentes campos están aprovechando esta tecnología.

Seguimiento de la mirada en los juegos

El seguimiento ocular se está utilizando en los videojuegos para proporcionar información en tiempo real sobre la concentración, la toma de decisiones y los tiempos de reacción de los jugadores. Mediante el seguimiento de los movimientos oculares, esta tecnología ayuda a los jugadores a perfeccionar sus estrategias, mejora los programas de entrenamiento y aumenta la participación de la audiencia al mostrar visualmente dónde miran los jugadores durante los momentos clave.

Un ejemplo interesante de esto son las carreras de simulación, un deporte de motor virtual competitivo donde los jugadores compiten utilizando simulaciones de conducción realistas. El seguimiento ocular ayuda a analizar cómo los conductores se concentran en la pista, reaccionan a los oponentes y navegan por curvas cerradas. Al rastrear su mirada en tiempo real, los entrenadores pueden identificar patrones, detectar distracciones y mejorar las estrategias de carrera. 

__wf_reserved_inherit
Fig. 4. El seguimiento ocular se puede utilizar para monitorizar y analizar a los corredores de simulador. 

Más allá de las carreras de simulación, el seguimiento ocular también se está utilizando en juegos competitivos de ritmo rápido para analizar los reflejos de los jugadores, los tiempos de reacción y cómo se enfocan en los elementos clave del juego. Al comprender dónde mira un jugador antes de hacer un movimiento, estos datos ayudan a refinar la toma de decisiones, mejorar la precisión y mejorar el entrenamiento para un juego de alto nivel.

Estimación de la mirada para la investigación psicológica

Existen muchas aplicaciones de IA de visión de la estimación de la mirada relacionadas con la investigación. Un buen ejemplo de esto es su uso en psicología para estudiar la atención, la carga cognitiva y el comportamiento social. Al analizar los movimientos oculares, los investigadores pueden obtener información sobre la percepción, la toma de decisiones y las condiciones de salud mental como el autismo y el TDAH. 

Específicamente, el seguimiento de la mirada mediante visión artificial ayuda a identificar patrones en el movimiento ocular, la duración de la fijación y la atención visual, lo que puede revelar estados cognitivos y emocionales. Con el avance del aprendizaje profundo y la estimación de la mirada impulsada por la IA, estos métodos son cada vez más precisos y accesibles, lo que permite aplicaciones más amplias en la investigación neurológica.

Seguridad automotriz

A lo largo de los años, los investigadores han utilizado diferentes métodos para estudiar la atención y la concentración de los conductores durante diferentes condiciones de tráfico. Entre estos métodos, el seguimiento ocular ha sido crucial y puede proporcionar información sobre hacia dónde mira el conductor mientras conduce. 

Con la ayuda de modelos de visión artificial, la detección de la mirada puede mejorar aún más este análisis mediante el seguimiento preciso de los movimientos oculares en tiempo real. Este análisis puede darnos una mejor comprensión del comportamiento del conductor, ayudando a identificar distracciones, fatiga o lapsos de atención, lo que puede mejorar la seguridad vial y ayudar en el desarrollo de sistemas avanzados de asistencia al conductor.

__wf_reserved_inherit
Fig 5. Un ejemplo de monitorización de un conductor mediante la detección facial y el seguimiento de la mirada.

Por ejemplo, si un conductor aparta la vista de la carretera con frecuencia para revisar su teléfono o tarda en reaccionar en las intersecciones, el sistema puede detectar estos comportamientos y emitir alertas para reenfocar su atención, lo que podría prevenir accidentes.

Pros y contras del seguimiento ocular y la detección de la mirada

Estos son algunos de los principales beneficios que las tecnologías de seguimiento ocular y detección de la mirada pueden aportar a nuestra vida cotidiana:

  • Mayor conciencia: El seguimiento ocular proporciona información sobre cómo las personas interactúan visualmente con su entorno, lo que ayuda a comprender mejor los patrones de atención y concentración.
  • Mejor toma de decisiones: Los datos recopilados del seguimiento ocular ayudan a los investigadores y profesionales a tomar decisiones informadas basadas en patrones de atención objetivos.
  • Ergonomía visual mejorada: El análisis del comportamiento de la mirada puede ayudar a diseñar pantallas, espacios de trabajo y entornos que reduzcan la fatiga visual y mejoren la comodidad.

Si bien estos beneficios resaltan cómo la detección de la mirada puede impactar positivamente en nuestras vidas, también es importante considerar los desafíos involucrados en su implementación. Estas son algunas de las limitaciones clave que hay que tener en cuenta:

  • Preocupaciones sobre la privacidad: El seguimiento ocular continuo puede generar problemas de privacidad, lo que incomoda a los usuarios. Garantizar la transparencia, el consentimiento del usuario y el procesamiento local de datos puede ayudar a mitigar estas preocupaciones.
  • Alta demanda computacional: El seguimiento de la mirada en tiempo real puede requerir hardware potente, lo que limita la accesibilidad en dispositivos de baja potencia. Sin embargo, los modelos optimizados están ayudando a mejorar la eficiencia.
  • Limitaciones de precisión: El seguimiento de la mirada puede ser menos fiable en entornos del mundo real debido a los cambios de iluminación, los movimientos de la cabeza o los obstáculos como las gafas y el pelo. Los ángulos de la cámara también pueden afectar al rendimiento.

Manteniendo la vista en el futuro

El seguimiento ocular y la detección de la mirada, respaldados por modelos de visión artificial como YOLO11, están cambiando la forma en que interactuamos con el mundo. Desde hacer las carreteras más seguras hasta comprender el comportamiento humano, esta tecnología es cada vez más útil en la vida cotidiana.

Si bien existen desafíos como los problemas de privacidad y la necesidad de ordenadores potentes, los avances en la IA y la visión artificial están haciendo que el seguimiento ocular sea más preciso y fácil de usar. A medida que siga mejorando, es probable que desempeñe un papel más importante en una serie de industrias.

Para obtener más información, visita nuestro repositorio de GitHub e interactúa con nuestra comunidad. Explora las innovaciones en sectores como la IA en coches autónomos y la visión artificial en la agricultura en nuestras páginas de soluciones. Consulta nuestras opciones de licencia y da vida a tus proyectos de Vision AI. 🚀

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis
Enlace copiado al portapapeles