Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Descubra como as técnicas de Visão de IA, como detecção de objetos e estimativa de pose, podem ser usadas para rastreamento ocular e detecção de olhar em diversas aplicações.
A visão computacional é um ramo da inteligência artificial (IA) que se concentra em permitir que as máquinas analisem e interpretem dados visuais de uma forma semelhante aos humanos. Uma aplicação particularmente fascinante da Visão de IA é a detecção do olhar, que possibilita que as máquinas rastreiem e entendam para onde uma pessoa está olhando.
Como seres humanos, podemos naturalmente seguir o olhar de alguém e compreender em que é que se está a concentrar. Por exemplo, se estiver a falar com um amigo e ele olhar subitamente para a porta, pode instintivamente virar-se para ver o que lhe chamou a atenção. As máquinas, por outro lado, não têm esta capacidade inerente - precisam de ser treinadas utilizando técnicas de visão computacional para reconhecer os movimentos dos olhos e interpretar a direção do olhar.
Com o mercado global de detecção de olhar com previsão de atingir US$ 11,9 bilhões até 2032, muitas indústrias estão adotando-o para diferentes aplicações. Por exemplo, a detecção de olhar em carros está sendo usada para melhorar a segurança do motorista, monitorando os níveis de atenção e detectando sinais de sonolência ou distração.
Neste artigo, exploraremos como a visão computacional é usada para rastreamento ocular e detecção de olhar. Também veremos algumas de suas principais aplicações em vários setores. Vamos começar!
O que é rastreamento ocular e detecção de olhar?
O rastreamento ocular e a detecção do olhar são técnicas usadas para determinar o foco de atenção de uma pessoa, analisando os movimentos dos olhos e a direção do olhar. Graças aos avanços na IA e na tecnologia de sensores, agora é possível rastrear os olhos de uma pessoa em tempo real.
Tradicionalmente, a maioria dos sistemas de rastreamento ocular depende de câmeras infravermelhas (IR), que detectam os movimentos da pupila iluminando os olhos com luz infravermelha próxima e capturando reflexos da córnea. Esses sistemas fornecem alta precisão. No entanto, muitas vezes exigem equipamentos de cabeça especializados, que podem ser desconfortáveis de usar e propensos a problemas de calibração.
Com a ascensão da IA, os pesquisadores têm explorado ativamente métodos de rastreamento ocular baseados em visão computacional. Ao contrário dos sistemas tradicionais baseados em IR, essas abordagens dependem de modelos de visão computacional como o Ultralytics YOLO11 para detectar características faciais, como olhos e pupilas, bem como realizar a estimativa da pose da cabeça. Além disso, modelos especializados de aprendizado profundo, como o GazeNet da NVIDIA, são projetados especificamente para a estimativa do olhar.
Fig 1. Um exemplo de uso do YOLO11 para detectar o olho e a pupila de uma pessoa.
Embora ainda seja um campo em evolução, o rastreamento do olhar baseado em visão computacional tem o potencial de tornar o rastreamento ocular mais acessível, reduzindo custos e melhorando a usabilidade para aplicações em marketing, psicologia e neurociência.
A evolução da detecção de olhar e rastreamento ocular
Em seguida, vamos explorar a mudança de sistemas tradicionais baseados em infravermelho para soluções mais acessíveis e orientadas por software.
Você pode estar se perguntando se o rastreamento ocular e a detecção de olhar podem ser feitos sem IA - então, por que há pesquisas em andamento sobre a integração de IA e visão computacional nessas tecnologias? Embora existam métodos tradicionais de rastreamento ocular, eles geralmente dependem de câmeras infravermelhas especializadas e dispositivos de rastreamento ocular montados na cabeça, que podem ser caros, incômodos e exigir condições de iluminação controladas. As soluções orientadas por IA, no entanto, permitem o rastreamento ocular usando webcams padrão e câmeras de smartphones, reduzindo custos e melhorando a acessibilidade.
Fig. 2. Um dispositivo de rastreamento ocular montado na cabeça.
Aqui estão alguns dos outros fatores por trás da evolução da tecnologia de rastreamento ocular e detecção de olhar:
Aplicações: As abordagens orientadas por software permitem que este espaço se expanda além da pesquisa para dispositivos de consumo e áreas como jogos. 
Escalabilidade: A IA pode intervir para tornar as soluções de detecção de olhar disponíveis para um público mais amplo, desde usuários individuais até indústrias de grande escala. 
Avanços na tecnologia de câmeras: Hoje, temos acesso a câmeras de smartphone e webcam de maior resolução que melhoram a precisão do rastreamento ocular - algo que não era viável há 20 anos.
Utilização do YOLO11 da Ultralytics para deteção do olhar e rastreamento ocular
Agora que discutimos o papel da visão computacional no rastreamento ocular e na detecção do olhar, vamos explicar como o YOLO11 pode ser usado aqui.
Ultralytics YOLO11 suporta tarefas como detecção de objetos e estimativa de pose. Pré-treinado no conjunto de dados COCO, ele alcança alta precisão na detecção de vários objetos. Especificamente, para uma solução de detecção de olhar, o YOLO11 pode desempenhar um papel de apoio.
Embora não possa prever diretamente a direção do olhar, ele pode ser ajustado para detectar rostos, olhos e pupilas, que são essenciais para análises posteriores. Uma vez que esses recursos são identificados, modelos adicionais podem processar dados de movimento ocular para estimar a direção do olhar.
Por exemplo, para melhorar a precisão, o YOLO11 pode ser treinado sob medida em conjuntos de dados como o WIDER FACE para detecção de rostos. Além disso, com respeito aos recursos de estimativa de pose do YOLO11, ele pode ajudar a rastrear a orientação da cabeça, o que aumenta a precisão da detecção do olhar.
Fig. 3. YOLO11 pode ser usado para detectar rostos humanos.
Aplicações reais da deteção do olhar
A deteção do olhar, possibilitada pela visão computacional, tem uma vasta gama de aplicações em vários setores, desde a melhoria da segurança no setor automóvel até à análise do foco nos jogos. Vamos explorar como diferentes áreas estão a tirar partido desta tecnologia.
Rastreamento do olhar em jogos
O rastreamento ocular está sendo usado em jogos para fornecer insights em tempo real sobre o foco, a tomada de decisões e os tempos de reação dos jogadores. Ao rastrear os movimentos dos olhos, essa tecnologia ajuda os jogadores a refinar suas estratégias, aprimora os programas de treinamento e melhora o envolvimento do público, exibindo visualmente para onde os jogadores estão olhando durante os momentos cruciais.
Um exemplo interessante disso é o sim racing, um esporte motorizado virtual competitivo onde os jogadores correm usando simulações de direção realistas. O rastreamento ocular ajuda a analisar como os pilotos se concentram na pista, reagem aos oponentes e navegam em curvas fechadas. Ao rastrear seu olhar em tempo real, os treinadores podem identificar padrões, detectar distrações e melhorar as estratégias de corrida.
Fig 4. O rastreamento ocular pode ser usado para monitorar e analisar pilotos de simulador de corrida.
Além das corridas de simulação, o rastreamento ocular também está sendo usado em jogos competitivos de ritmo acelerado para analisar os reflexos, os tempos de reação dos jogadores e como eles se concentram nos principais elementos do jogo. Ao entender para onde um jogador olha antes de fazer um movimento, esses dados ajudam a refinar a tomada de decisões, melhorar a precisão e aprimorar o treinamento para jogos de alto nível.
Estimativa do olhar para investigação psicológica
Existem muitas aplicações de IA de Visão da estimativa do olhar relacionadas à pesquisa. Um bom exemplo disso é seu uso em psicologia para estudar a atenção, a carga cognitiva e o comportamento social. Ao analisar os movimentos oculares, os pesquisadores podem obter insights sobre a percepção, a tomada de decisões e condições de saúde mental, como autismo e TDAH.
Especificamente, o rastreamento do olhar usando visão computacional ajuda a identificar padrões no movimento dos olhos, duração da fixação e atenção visual, o que pode revelar estados cognitivos e emocionais. Com o avanço do aprendizado profundo e da estimativa do olhar orientada por IA, esses métodos estão se tornando mais precisos e acessíveis, permitindo aplicações mais amplas na pesquisa neurológica.
Segurança automotiva
Ao longo dos anos, os pesquisadores têm usado diferentes métodos para estudar a atenção e o foco dos motoristas durante diferentes condições de tráfego. Entre esses métodos, o rastreamento ocular tem sido crucial e pode fornecer insights sobre para onde o motorista está olhando enquanto dirige.
Com a ajuda de modelos de visão computacional, a detecção de olhar pode melhorar ainda mais essa análise, rastreando com precisão os movimentos oculares em tempo real. Essa análise pode nos dar uma melhor compreensão do comportamento do motorista, ajudando a identificar distrações, fadiga ou lapsos de atenção, o que pode melhorar a segurança rodoviária e auxiliar no desenvolvimento de sistemas avançados de assistência ao motorista.
Fig 5. Um exemplo de monitoramento de um motorista usando detecção facial e rastreamento do olhar.
Por exemplo, se um motorista desviar frequentemente o olhar da estrada para verificar o celular ou demorar a reagir em cruzamentos, o sistema pode detectar esses comportamentos e emitir alertas para que ele se concentre novamente, evitando potencialmente acidentes.
Prós e contras do rastreamento ocular e detecção de olhar
Aqui estão alguns dos principais benefícios que as tecnologias de rastreamento ocular e detecção de olhar podem trazer para o nosso dia a dia:
Maior conscientização: O rastreamento ocular fornece insights sobre como as pessoas interagem visualmente com o ambiente, ajudando a entender melhor os padrões de atenção e foco. 
Melhor tomada de decisão: Os dados coletados do rastreamento ocular ajudam pesquisadores e profissionais a tomar decisões informadas com base em padrões de atenção objetivos. 
Ergonomia visual aprimorada: A análise do comportamento do olhar pode ajudar a projetar telas, espaços de trabalho e ambientes que reduzem o cansaço visual e melhoram o conforto.
Embora esses benefícios destaquem como a detecção do olhar pode impactar positivamente nossas vidas, também é importante considerar os desafios envolvidos em sua implementação. Aqui estão algumas das principais limitações a serem lembradas:
Preocupações com a privacidade: O rastreamento contínuo dos olhos pode levantar questões de privacidade, deixando os usuários desconfortáveis. Garantir a transparência, o consentimento do usuário e o processamento de dados local pode ajudar a mitigar essas preocupações.
Alta demanda computacional: O rastreamento do olhar em tempo real pode exigir hardware poderoso, limitando a acessibilidade em dispositivos de baixa potência. No entanto, modelos otimizados estão ajudando a melhorar a eficiência.
Limitações de precisão: O rastreamento do olhar pode ser menos confiável em ambientes reais devido a mudanças de iluminação, movimentos da cabeça ou obstáculos como óculos e cabelo. Os ângulos da câmera também podem afetar o desempenho.
De olho no futuro
O rastreamento ocular e a detecção do olhar, suportados por modelos de visão computacional como o YOLO11, estão mudando a forma como interagimos com o mundo. Desde tornar as estradas mais seguras até entender o comportamento humano, essa tecnologia está se tornando cada vez mais útil no dia a dia.
Embora existam desafios como preocupações com a privacidade e a necessidade de computadores poderosos, os avanços em IA e visão computacional estão tornando o rastreamento ocular mais preciso e fácil de usar. À medida que continua a melhorar, provavelmente desempenhará um papel maior em uma variedade de setores.