Explorar a forma como a visão por computador pode ser utilizada para a deteção do olhar

Abirami Vina

5 min. de leitura

19 de fevereiro de 2025

Descubra como as técnicas de IA de visão, como a deteção de objectos e a estimativa de pose, podem ser utilizadas para o seguimento ocular e a deteção do olhar em várias aplicações.

A visão computacional é um ramo da inteligência artificial (IA) que se concentra em permitir que as máquinas analisem e interpretem dados visuais de uma forma semelhante à dos humanos. Uma aplicação particularmente fascinante da IA de visão é a deteção do olhar, que permite às máquinas seguir e compreender para onde uma pessoa está a olhar.

Como seres humanos, podemos seguir naturalmente o olhar de uma pessoa e perceber em que é que ela se está a concentrar. Por exemplo, se estivermos a falar com um amigo e ele olhar subitamente para a porta, podemos instintivamente virar-nos para ver o que chamou a sua atenção. As máquinas, por outro lado, não têm esta capacidade incorporada - precisam de ser treinadas utilizando técnicas de visão por computador para reconhecer os movimentos dos olhos e interpretar a direção do olhar. 

Prevê-se que o mercado global de deteção do olhar atinja 11,9 mil milhões de dólares até 2032, pelo que muitas indústrias estão a adoptá-lo para diferentes aplicações. Por exemplo, a deteção do olhar nos automóveis está a ser utilizada para melhorar a segurança dos condutores, monitorizando os níveis de atenção e detectando sinais de sonolência ou distração.

Neste artigo, vamos explorar a forma como a visão por computador é utilizada para o seguimento ocular e a deteção do olhar. Também analisaremos algumas das suas principais aplicações em vários sectores. Vamos lá começar!

O que é o seguimento ocular e a deteção do olhar?

O seguimento dos olhos e a deteção do olhar são técnicas utilizadas para determinar o foco de atenção de uma pessoa através da análise dos movimentos oculares e da direção do olhar. Graças aos avanços na IA e na tecnologia de sensores, é agora possível seguir os olhos de uma pessoa em tempo real. 

Tradicionalmente, a maioria dos sistemas de rastreio ocular baseia-se em câmaras de infravermelhos (IR), que detectam os movimentos da pupila iluminando os olhos com luz infravermelha próxima e captando os reflexos da córnea. Estes sistemas proporcionam uma elevada precisão. No entanto, requerem muitas vezes um arnês especializado, que pode ser desconfortável de usar e propenso a problemas de calibração.

Com o aumento da IA, os investigadores têm explorado ativamente métodos de seguimento ocular baseados na visão por computador. Ao contrário dos sistemas tradicionais baseados em IR, estas abordagens baseiam-se em modelos de visão computacional como o Ultralytics YOLO11 para detetar caraterísticas faciais, como olhos e pupilas, bem como realizar a estimativa da pose da cabeça. Para além disso, modelos especializados de aprendizagem profunda, como o GazeNet da NVIDIA, foram concebidos especificamente para a estimativa do olhar. 

__wf_reserved_inherit
Fig. 1. Um exemplo de utilização do YOLO11 para detetar o olho e a pupila de uma pessoa.

Embora seja ainda um domínio em evolução, o rastreio do olhar baseado na visão por computador tem potencial para tornar o rastreio do olhar mais acessível, reduzindo os custos e melhorando a usabilidade para aplicações em marketing, psicologia e neurociência.

A evolução da deteção do olhar e do seguimento do olhar

Em seguida, vamos explorar a mudança dos sistemas tradicionais baseados em infravermelhos para soluções mais acessíveis e orientadas para o software.

Poderá estar a perguntar-se se o seguimento ocular e a deteção do olhar podem ser feitos sem IA - então, por que razão existe investigação em curso sobre a integração da IA e da visão por computador nestas tecnologias? Embora existam métodos tradicionais de rastreio ocular, estes dependem frequentemente de câmaras de infravermelhos especializadas e de dispositivos de rastreio ocular montados na cabeça, que podem ser dispendiosos, incómodos e requerem condições de iluminação controladas. No entanto, as soluções baseadas na IA permitem o rastreio ocular utilizando webcams normais e câmaras de smartphones, reduzindo os custos e melhorando a acessibilidade. 

__wf_reserved_inherit
Fig. 2. Um dispositivo de seguimento ocular montado na cabeça.

Eis alguns dos outros factores subjacentes à evolução da tecnologia de seguimento ocular e de deteção do olhar:

  • Aplicações: As abordagens orientadas para o software permitem que este espaço se expanda para além da investigação em dispositivos de consumo e áreas como os jogos.
  • Escalabilidade: A IA pode intervir para tornar as soluções de deteção do olhar disponíveis para um público mais vasto, desde utilizadores individuais a indústrias de grande escala.
  • Avanços na tecnologia das câmaras: Atualmente, temos acesso a câmaras de smartphone e de webcam de alta resolução que melhoram a precisão do rastreio ocular - algo que não era possível há 20 anos.

Utilização do Ultralytics YOLO11 para deteção e seguimento do olhar

Agora que já discutimos o papel da visão por computador no seguimento dos olhos e na deteção do olhar, vamos ver como o YOLO11 pode ser utilizado neste caso.

O Ultralytics YOLO11 suporta tarefas como a deteção de objectos e a estimativa de pose. Pré-treinado no conjunto de dados COCO, atinge uma elevada precisão na deteção de vários objectos. Especificamente, para uma solução de deteção do olhar, o YOLO11 pode desempenhar um papel de apoio. 

Embora não possa prever diretamente a direção do olhar, pode ser aperfeiçoado para detetar rostos, olhos e pupilas, que são fundamentais para uma análise mais aprofundada. Uma vez identificadas estas caraterísticas, modelos adicionais podem processar dados de movimentos oculares para estimar a direção do olhar. 

Por exemplo, para melhorar a precisão, o YOLO11 pode ser treinado à medida em conjuntos de dados como o WIDER FACE para deteção de rostos. Além disso, no que diz respeito às capacidades de estimativa de pose do YOLO11, este pode ajudar a seguir a orientação da cabeça, o que melhora a precisão da deteção do olhar.

__wf_reserved_inherit
Fig. 3. O YOLO11 pode ser utilizado para detetar rostos humanos.

Aplicações do mundo real da deteção do olhar

A deteção do olhar, possibilitada pela visão por computador, tem uma vasta gama de aplicações em todas as indústrias, desde a melhoria da segurança no sector automóvel até à análise da concentração nos jogos. Vamos explorar a forma como diferentes áreas estão a tirar partido desta tecnologia.

Rastreio do olhar nos jogos

O rastreio ocular está a ser utilizado nos jogos para fornecer informações em tempo real sobre a concentração, a tomada de decisões e os tempos de reação dos jogadores. Ao seguir os movimentos dos olhos, esta tecnologia ajuda os jogadores a aperfeiçoar as suas estratégias, melhora os programas de treino e melhora o envolvimento do público ao mostrar visualmente para onde os jogadores estão a olhar durante os momentos-chave.

Um exemplo interessante é a corrida simulada, um desporto automóvel virtual competitivo em que os jogadores correm utilizando simulações de condução realistas. O seguimento do olhar ajuda a analisar a forma como os condutores se concentram na pista, reagem aos adversários e navegam em curvas apertadas. Ao seguir o seu olhar em tempo real, os treinadores podem identificar padrões, detetar distracções e melhorar as estratégias de corrida. 

__wf_reserved_inherit
Fig. 4. O rastreio ocular pode ser utilizado para monitorizar e analisar os pilotos de simuladores. 

Para além das corridas simuladas, o seguimento ocular também está a ser utilizado em jogos competitivos de ritmo acelerado para analisar os reflexos dos jogadores, os tempos de reação e a forma como se concentram nos principais elementos do jogo. Ao compreender para onde um jogador olha antes de fazer uma jogada, estes dados ajudam a aperfeiçoar a tomada de decisões, a melhorar a precisão e a melhorar o treino para jogos de alto nível.

Estimativa do olhar para investigação psicológica

Existem muitas aplicações de IA visual da estimativa do olhar relacionadas com a investigação. Um bom exemplo é a sua utilização em psicologia para estudar a atenção, a carga cognitiva e o comportamento social. Ao analisar os movimentos oculares, os investigadores podem obter informações sobre a perceção, a tomada de decisões e as condições de saúde mental, como o autismo e a PHDA. 

Especificamente, o rastreio do olhar utilizando a visão por computador ajuda a identificar padrões no movimento dos olhos, na duração da fixação e na atenção visual, que podem revelar estados cognitivos e emocionais. Com o avanço da aprendizagem profunda e da estimativa do olhar baseada em IA, estes métodos estão a tornar-se mais precisos e acessíveis, permitindo aplicações mais amplas na investigação neurológica.

Segurança automóvel

Ao longo dos anos, os investigadores têm utilizado diferentes métodos para estudar a atenção e a concentração dos condutores em diferentes condições de trânsito. Entre estes métodos, o rastreio ocular tem sido crucial e pode fornecer informações sobre para onde o condutor está a olhar enquanto conduz. 

Com a ajuda de modelos de visão por computador, a deteção do olhar pode melhorar ainda mais esta análise, acompanhando com precisão os movimentos oculares em tempo real. Esta análise pode dar-nos uma melhor compreensão do comportamento do condutor, ajudando a identificar distracções, fadiga ou lapsos de atenção, o que pode melhorar a segurança rodoviária e ajudar no desenvolvimento de sistemas avançados de assistência ao condutor.

__wf_reserved_inherit
Fig. 5. Exemplo de monitorização de um condutor utilizando a deteção de rostos e o seguimento do olhar.

Por exemplo, se um condutor desviar frequentemente o olhar da estrada para verificar o telemóvel ou se for lento a reagir nos cruzamentos, o sistema pode detetar estes comportamentos e emitir alertas para reorientar a sua atenção, potencialmente evitando acidentes.

Prós e contras do seguimento ocular e da deteção do olhar

Eis alguns dos principais benefícios que as tecnologias de rastreio ocular e de deteção do olhar podem trazer ao nosso quotidiano:

  • Maior consciencialização: O rastreio ocular fornece informações sobre a forma como as pessoas interagem visualmente com o seu ambiente, ajudando a compreender melhor os padrões de atenção e concentração.
  • Melhor tomada de decisões: Os dados recolhidos a partir do rastreio ocular ajudam os investigadores e profissionais a tomar decisões informadas com base em padrões de atenção objectivos.
  • Melhoria da ergonomia visual: A análise do comportamento do olhar pode ajudar a conceber ecrãs, espaços de trabalho e ambientes que reduzam a fadiga ocular e melhorem o conforto.

Embora estes benefícios realcem a forma como a deteção do olhar pode ter um impacto positivo nas nossas vidas, também é importante considerar os desafios envolvidos na sua implementação. Eis algumas das principais limitações a ter em conta:

  • Questões de privacidade: O seguimento contínuo dos olhos pode levantar problemas de privacidade, deixando os utilizadores pouco à vontade. Garantir a transparência, o consentimento do utilizador e o tratamento local dos dados pode ajudar a atenuar estas preocupações.
  • Elevada exigência computacional: O seguimento do olhar em tempo real pode exigir hardware potente, limitando a acessibilidade em dispositivos de baixo consumo. No entanto, os modelos optimizados estão a ajudar a melhorar a eficiência.
  • Limitações de precisão: O seguimento do olhar pode ser menos fiável em ambientes do mundo real devido a alterações de iluminação, movimentos da cabeça ou obstáculos como óculos e cabelo. Os ângulos da câmara também podem afetar o desempenho.

Olhar para o futuro

O seguimento dos olhos e a deteção do olhar, apoiados por modelos de visão por computador como o YOLO11, estão a mudar a forma como interagimos com o mundo. Desde tornar as estradas mais seguras até à compreensão do comportamento humano, esta tecnologia está a tornar-se cada vez mais útil na vida quotidiana.

Embora existam desafios como as preocupações com a privacidade e a necessidade de computadores potentes, os avanços na IA e na visão por computador estão a tornar o seguimento ocular mais preciso e mais fácil de utilizar. À medida que continua a melhorar, é provável que venha a desempenhar um papel mais importante numa série de sectores.

Para saber mais, visite o nosso repositório GitHub e participe na nossa comunidade. Explore inovações em sectores como a IA em carros autónomos e a visão computacional na agricultura nas nossas páginas de soluções. Confira nossas opções de licenciamento e dê vida aos seus projetos de IA de visão. 🚀

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência