ヨロビジョン深圳
深セン
今すぐ参加

視線検出にコンピュータビジョンをどのように利用できるかについて

Abirami Vina

5分で読めます

2025年2月19日

物体検出や姿勢推定のようなVision AI技術が、様々なアプリケーションにおけるアイトラッキングや視線検出にどのように使用できるかを発見してください。

コンピュータビジョンは、人工知能(AI)の一分野であり、マシンが人間と同じように視覚データを分析および解釈できるようにすることに焦点を当てています。Vision AIの特に魅力的なアプリケーションの1つは、人の視線を追跡して理解することを可能にする視線検出です。

人間として、私たちは自然に誰かの視線を追い、彼らが何に焦点を当てているかを理解することができます。たとえば、友人と話していて、彼らが突然ドアの方を見た場合、あなたは何が彼らの注意を引いたのかを見るために本能的に振り返るかもしれません。一方、機械にはこの組み込み機能がありません。目の動きを認識し、視線の方向を解釈するために、コンピュータビジョンの技術を使用してトレーニングする必要があります。 

世界の視線検出市場は2032年までに119億ドルに達すると予測されており、多くの業界がさまざまなアプリケーションに採用しています。たとえば、自動車の視線検出は、注意レベルを監視し、眠気や注意散漫の兆候を検出することで、ドライバーの安全性を向上させるために使用されています。

この記事では、コンピュータビジョンがアイトラッキングと視線検出にどのように使用されているかを探ります。また、さまざまな産業における主要なアプリケーションについてもいくつか見ていきます。それでは、始めましょう。

アイトラッキングと視線検出とは?

アイトラッキングと視線検出は、目の動きと視線の方向を分析して、人の注意の焦点を特定するために使用される技術です。AIとセンサー技術の進歩のおかげで、人の目をリアルタイムで追跡することが可能になりました。 

従来、ほとんどの視線追跡システムは、近赤外光で目を照らし、角膜反射を捉える赤外線(IR)カメラに依存しています。これらのシステムは高精度を提供しますが、装着が不快で、調整の問題が発生しやすい特殊なヘッドギアが必要になることがよくあります。

AI の台頭に伴い、研究者たちはコンピュータビジョンベースの視線追跡方法を積極的に研究してきました。従来の IR ベースのシステムとは異なり、これらのアプローチは、コンピュータビジョンモデルUltralytics YOLO11など)を利用して、目や瞳孔などの顔の特徴を検出し、頭部の姿勢を推定します。さらに、NVIDIA の GazeNet のような特殊な深層学習モデルは、視線推定専用に設計されています。 

__wf_reserved_inherit
図1. YOLO11を使用して人の目と瞳を検出する例。

まだ進化している分野ですが、コンピュータビジョンベースの視線追跡は、アイトラッキングをよりアクセスしやすくし、マーケティング、心理学、神経科学のアプリケーションのコストを削減し、ユーザビリティを向上させる可能性を秘めています。

視線検出とアイトラッキングの進化

次に、従来の赤外線ベースのシステムから、よりアクセスしやすいソフトウェア駆動型ソリューションへの移行について見ていきましょう。

AIなしでアイトラッキングと視線検出ができるのか疑問に思われるかもしれません。では、なぜAIとコンピュータビジョンをこれらのテクノロジーに統合する研究が現在も行われているのでしょうか?従来のアイトラッキング手法は存在しますが、多くの場合、特殊な赤外線カメラとヘッドマウント型のアイトラッカーデバイスに依存しており、高価で扱いにくく、制御された照明条件が必要です。しかし、AI駆動のソリューションでは、標準的なWebカメラとスマートフォンカメラを使用してアイトラッキングが可能になり、コストが削減され、アクセスが向上します。 

__wf_reserved_inherit
Fig 2. ヘッドマウント型アイトラッカーデバイス。

アイトラッキングと視線検出技術の進化の背景にあるその他の要因をいくつかご紹介します。

  • アプリケーション: ソフトウェア主導のアプローチにより、この分野は研究から消費者向けデバイスやゲームなどの分野に拡大できます。
  • 拡張性: AIは、個人ユーザーから大規模産業まで、より幅広いユーザーが視線検出ソリューションを利用できるようにするために介入できます。
  • カメラ技術の進歩: 今日、より高解像度のスマートフォンやウェブカメラにアクセスできるようになり、20年前には実現できなかったアイトラッキングの精度が向上しています。

視線検出とアイトラッキングへのUltralytics YOLOv8の活用

コンピュータビジョンがアイトラッキングと視線検出において果たす役割について説明したところで、YOLO11がここでどのように使用できるかを見ていきましょう。

Ultralytics YOLO11は、物体検出や姿勢推定などのタスクをサポートします。COCOデータセットで事前トレーニングされており、さまざまなオブジェクトの検出で高い精度を実現します。特に、視線検出ソリューションの場合、YOLO11はサポート的な役割を果たすことができます。 

視線の方向を直接予測することはできませんが、顔、目、瞳孔を検出するように微調整でき、これらはさらなる分析の鍵となります。これらの特徴が識別されると、追加のモデルが目の動きのデータを処理して、視線の方向を推定できます。 

例えば、精度を向上させるために、YOLO11は顔検出のためにWIDER FACEなどのデータセットでカスタムトレーニングできます。また、YOLO11の姿勢推定機能に関して言えば、頭の向きを追跡するのに役立ち、視線検出の精度が向上します。

__wf_reserved_inherit
図3 YOLO11は、人間の顔を検出するために使用できます。

視線検出の現実世界のアプリケーション

コンピュータビジョンによって実現される視線検出は、自動車分野での安全性の向上から、ゲームにおける集中の分析まで、業界全体で幅広いアプリケーションがあります。さまざまな分野がこのテクノロジーをどのように活用しているかを探りましょう。

ゲームにおける視線追跡

アイトラッキングは、プレイヤーの焦点、意思決定、および反応時間に関するリアルタイムの洞察を提供するためにゲームで使用されています。目の動きを追跡することにより、この技術は、プレイヤーが戦略を洗練し、トレーニングプログラムを強化し、主要な瞬間にプレイヤーが見ている場所を視覚的に表示することにより、視聴者のエンゲージメントを向上させるのに役立ちます。

この興味深い例としては、シムレースがあります。これは、プレイヤーがリアルなドライビングシミュレーションを使用してレースを行う、競争力のあるバーチャルモータースポーツです。アイトラッキングは、ドライバーがどのようにコースに集中し、対戦相手に反応し、急カーブをナビゲートするかを分析するのに役立ちます。リアルタイムで視線を追跡することで、トレーナーはパターンを特定し、気を散らすものを見つけ、レース戦略を改善できます。 

__wf_reserved_inherit
図4. アイトラッキングは、シムレーサーの監視と分析に使用できます。 

シムレースの枠を超えて、アイトラッキングは、プレイヤーの反射神経、反応時間、およびゲーム内の重要な要素にどのように焦点を当てているかを分析するために、ペースの速い対戦ゲームでも使用されています。プレイヤーが動き出す前にどこを見ているかを理解することで、このデータは意思決定を洗練し、精度を向上させ、ハイレベルなゲームプレイのためのトレーニングを強化するのに役立ちます。

心理学研究のための視線推定

視線推定の研究に関連するVision AIアプリケーションは数多くあります。その良い例は、注意、認知負荷、および社会的行動を研究するために心理学で使用されることです。研究者は、目の動きを分析することにより、知覚、意思決定、および自閉症やADHDなどの精神的健康状態についての洞察を得ることができます。 

具体的には、コンピュータビジョンを使用した視線追跡は、目の動き、注視時間、および視覚的注意のパターンを識別するのに役立ち、認知および感情の状態を明らかにすることができます。深層学習とAI駆動の視線推定の進歩により、これらの方法はより正確でアクセスしやすくなり、神経学的研究におけるより広範な応用が可能になっています。

自動車の安全性

長年にわたり、研究者たちはさまざまな方法を用いて、さまざまな交通状況におけるドライバーの注意と集中力を研究してきました。これらの方法の中でも、アイトラッキングは非常に重要であり、運転中にドライバーがどこを見ているかについての洞察を提供できます。 

コンピュータビジョンモデルの助けを借りて、視線検出はリアルタイムで目の動きを正確に追跡することにより、この分析をさらに改善できます。この分析により、ドライバーの行動をより深く理解し、注意散漫、疲労、または注意力の低下を特定するのに役立ち、道路の安全性を向上させ、高度な運転支援システムの開発を支援できます。

__wf_reserved_inherit
Fig 5. 顔検出と視線追跡を使用してドライバーを監視する例。

例えば、運転者が頻繁に道路から目を離して携帯電話を確認したり、交差点での反応が遅い場合、システムはこれらの行動を検出し、注意を集中させるための警告を発行し、事故を未然に防ぐ可能性があります。

アイトラッキングと視線検出の利点と欠点

アイトラッキングおよび視線検出技術が私たちの日常生活にもたらす主な利点をいくつかご紹介します。

  • 認識の向上: アイトラッキングは、人が周囲の環境とどのように視覚的に相互作用するかについての洞察を提供し、注意と集中パターンをより良く理解するのに役立ちます。
  • より良い意思決定: アイトラッキングから収集されたデータは、研究者や専門家が客観的な注意パターンに基づいて情報に基づいた意思決定を行うのに役立ちます。
  • 視覚エルゴノミクスの向上:視線の動きを分析することで、目の疲れを軽減し、快適性を向上させる画面、ワークスペース、および環境を設計できます。

これらの利点は、視線検出が私たちの生活にどのようにプラスの影響を与えるかを示していますが、その実装に伴う課題を考慮することも重要です。留意すべき主な制限事項を以下に示します。

  • プライバシーに関する懸念: 継続的なアイトラッキングはプライバシー上の問題を引き起こし、ユーザーに不快感を与える可能性があります。透明性の確保、ユーザーの同意、およびローカルでのデータ処理は、これらの懸念を軽減するのに役立ちます。
  • 高い計算需要: リアルタイムの視線追跡は、強力なハードウェアを必要とする可能性があり、低電力デバイスでのアクセスを制限します。ただし、最適化されたモデルは効率の向上に役立っています。
  • 精度の限界: 視線追跡は、照明の変化、頭の動き、または眼鏡や髪などの障害物により、実際の設定では信頼性が低くなる可能性があります。カメラの角度もパフォーマンスに影響を与える可能性があります。

未来に目を向け続ける

YOLO11のようなコンピュータビジョンモデルによってサポートされているアイトラッキングと視線検出は、私たちが世界と相互作用する方法を変えています。道路をより安全にすることから人間の行動を理解することまで、この技術は日常生活でますます役立つようになっています。

プライバシーへの懸念や高性能なコンピュータの必要性といった課題はありますが、AIとコンピュータビジョンの進歩により、アイトラッキングはより正確で使いやすいものになっています。その改善が続くにつれて、さまざまな産業でより大きな役割を果たすようになるでしょう。

詳細については、GitHub リポジトリにアクセスして、コミュニティにご参加ください。ソリューションページで、自動運転車における AI農業におけるコンピュータビジョンなどの分野におけるイノベーションをご覧ください。ライセンスオプションをご確認いただき、Vision AI プロジェクトを実現しましょう。🚀

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる
クリップボードにコピーしました