Yolo 深圳
深セン
今すぐ参加

視線検出にコンピュータビジョンをどのように利用できるかについて

Abirami Vina

5分で読めます

2025年2月19日

物体検出や姿勢推定のようなVision AI技術が、様々なアプリケーションにおけるアイトラッキングや視線検出にどのように使用できるかを発見してください。

コンピュータ・ビジョンは人工知能(AI)の一分野であり、機械が人間と同様の方法で視覚データを分析・解釈できるようにすることに焦点を当てている。ビジョンAIの特に魅力的なアプリケーションのひとつに視線検出があり、これにより機械は人がどこを見ているかをtrack し理解することが可能になる。

人間として、私たちは自然に誰かの視線を追い、彼らが何に焦点を当てているかを理解することができます。たとえば、友人と話していて、彼らが突然ドアの方を見た場合、あなたは何が彼らの注意を引いたのかを見るために本能的に振り返るかもしれません。一方、機械にはこの組み込み機能がありません。目の動きを認識し、視線の方向を解釈するために、コンピュータビジョンの技術を使用してトレーニングする必要があります。 

世界の視線検出市場は2032年までに119億ドルに達すると予測されており、多くの業界がさまざまなアプリケーションに採用しています。たとえば、自動車の視線検出は、注意レベルを監視し、眠気や注意散漫の兆候を検出することで、ドライバーの安全性を向上させるために使用されています。

この記事では、コンピュータビジョンがアイトラッキングと視線検出にどのように使用されているかを探ります。また、さまざまな産業における主要なアプリケーションについてもいくつか見ていきます。それでは、始めましょう。

アイトラッキングと視線検出とは?

アイトラッキングと視線検出は、目の動きと視線の方向を分析することによって、人の注意の焦点を決定するために使用される技術です。AIとセンサー技術の進歩により、人の目をリアルタイムでtrack することが可能になった。 

従来、ほとんどのアイトラッキングシステムは、近赤外光で眼球を照らし、角膜の反射を捉えることで瞳孔の動きをdetect する赤外線(IR)カメラに依存していた。これらのシステムは高い精度を提供する。しかし、特殊なヘッドギアを必要とすることが多く、装着感が悪かったり、キャリブレーションの問題が起こりやすかったりする。

AIの台頭により、研究者たちはコンピュータ・ビジョンに基づく視線追跡方法を積極的に模索している。従来のIRベースのシステムとは異なり、これらのアプローチは、以下のようなコンピュータビジョンモデルに依存している。 Ultralytics YOLO11のようなコンピュータビジョンモデルに依存している。これ以外にも、NVIDIAGazeNetのような特殊なディープラーニングモデルは、視線推定専用に設計されている。 

__wf_reserved_inherit
図1.YOLO11 使った人物の目と瞳孔のdetect 例。

まだ進化している分野ですが、コンピュータビジョンベースの視線追跡は、アイトラッキングをよりアクセスしやすくし、マーケティング、心理学、神経科学のアプリケーションのコストを削減し、ユーザビリティを向上させる可能性を秘めています。

視線検出とアイトラッキングの進化

次に、従来の赤外線ベースのシステムから、よりアクセスしやすいソフトウェア駆動型ソリューションへの移行について見ていきましょう。

AIなしでアイトラッキングと視線検出ができるのか疑問に思われるかもしれません。では、なぜAIとコンピュータビジョンをこれらのテクノロジーに統合する研究が現在も行われているのでしょうか?従来のアイトラッキング手法は存在しますが、多くの場合、特殊な赤外線カメラとヘッドマウント型のアイトラッカーデバイスに依存しており、高価で扱いにくく、制御された照明条件が必要です。しかし、AI駆動のソリューションでは、標準的なWebカメラとスマートフォンカメラを使用してアイトラッキングが可能になり、コストが削減され、アクセスが向上します。 

__wf_reserved_inherit
Fig 2. ヘッドマウント型アイトラッカーデバイス。

アイトラッキングと視線検出技術の進化の背景にあるその他の要因をいくつかご紹介します。

  • アプリケーション: ソフトウェア主導のアプローチにより、この分野は研究から消費者向けデバイスやゲームなどの分野に拡大できます。
  • 拡張性: AIは、個人ユーザーから大規模産業まで、より幅広いユーザーが視線検出ソリューションを利用できるようにするために介入できます。
  • カメラ技術の進歩: 今日、より高解像度のスマートフォンやウェブカメラにアクセスできるようになり、20年前には実現できなかったアイトラッキングの精度が向上しています。

視線検出とアイトラッキングにUltralytics YOLO11 使用

さて、視線追跡と視線検出におけるコンピュータービジョンの役割について説明してきたが、ここでYOLO11 どのように使うことができるかを説明しよう。

Ultralytics YOLO11 、物体検出や姿勢推定などのタスクをサポートします。COCO データセットで事前にトレーニングされたYOLO11は、様々な物体の検出において高い精度を達成しています。特に、視線検出ソリューションの場合、YOLO11 11はサポート的な役割を果たすことができます。 

視線方向を直接予測することはできないが、さらなる分析の鍵となる顔、目、瞳孔をdetect するように微調整することができる。一旦これらの特徴が特定されれば、追加のモデルが眼球運動データを処理して視線方向を推定することができる。 

例えば、精度を向上させるために、YOLO11 顔検出用のWIDER FACEのようなデータセットでカスタムトレーニングすることができる。また、YOLO11ポーズ推定機能に関しては、頭の向きをtrack のに役立ち、視線検出の精度を高めることができる。

__wf_reserved_inherit
図3.YOLO11 11は人の顔をdetect ことができる。

視線検出の現実世界のアプリケーション

コンピュータビジョンによって実現される視線検出は、自動車分野での安全性の向上から、ゲームにおける集中の分析まで、業界全体で幅広いアプリケーションがあります。さまざまな分野がこのテクノロジーをどのように活用しているかを探りましょう。

ゲームにおける視線追跡

アイトラッキングは、プレイヤーの焦点、意思決定、および反応時間に関するリアルタイムの洞察を提供するためにゲームで使用されています。目の動きを追跡することにより、この技術は、プレイヤーが戦略を洗練し、トレーニングプログラムを強化し、主要な瞬間にプレイヤーが見ている場所を視覚的に表示することにより、視聴者のエンゲージメントを向上させるのに役立ちます。

この興味深い例として、シムレーシングが挙げられる。シムレーシングとは、プレイヤーがリアルな運転シミュレーションを使ってレースを行う、競技性の高いバーチャル・モータースポーツである。アイトラッキングは、ドライバーがどのようにtrack集中し、対戦相手に反応し、急カーブを曲がるかを分析するのに役立つ。視線をリアルタイムで追跡することで、トレーナーはパターンを特定し、注意散漫を発見し、レース戦略を改善することができる。 

__wf_reserved_inherit
図4. アイトラッキングは、シムレーサーの監視と分析に使用できます。 

シムレースの枠を超えて、アイトラッキングは、プレイヤーの反射神経、反応時間、およびゲーム内の重要な要素にどのように焦点を当てているかを分析するために、ペースの速い対戦ゲームでも使用されています。プレイヤーが動き出す前にどこを見ているかを理解することで、このデータは意思決定を洗練し、精度を向上させ、ハイレベルなゲームプレイのためのトレーニングを強化するのに役立ちます。

心理学研究のための視線推定

視線推定の研究に関連するVision AIアプリケーションは数多くあります。その良い例は、注意、認知負荷、および社会的行動を研究するために心理学で使用されることです。研究者は、目の動きを分析することにより、知覚、意思決定、および自閉症やADHDなどの精神的健康状態についての洞察を得ることができます。 

具体的には、コンピュータビジョンを使用した視線追跡は、目の動き、注視時間、および視覚的注意のパターンを識別するのに役立ち、認知および感情の状態を明らかにすることができます。深層学習とAI駆動の視線推定の進歩により、これらの方法はより正確でアクセスしやすくなり、神経学的研究におけるより広範な応用が可能になっています。

自動車の安全性

長年にわたり、研究者たちはさまざまな方法を用いて、さまざまな交通状況におけるドライバーの注意と集中力を研究してきました。これらの方法の中でも、アイトラッキングは非常に重要であり、運転中にドライバーがどこを見ているかについての洞察を提供できます。 

コンピュータビジョンモデルの助けを借りて、視線検出はリアルタイムで目の動きを正確に追跡することにより、この分析をさらに改善できます。この分析により、ドライバーの行動をより深く理解し、注意散漫、疲労、または注意力の低下を特定するのに役立ち、道路の安全性を向上させ、高度な運転支援システムの開発を支援できます。

__wf_reserved_inherit
Fig 5. 顔検出と視線追跡を使用してドライバーを監視する例。

例えば、ドライバーが携帯電話をチェックするために頻繁に道路から目を離したり、交差点での反応が遅かったりする場合、システムはこれらの行動をdetect し、注意を集中させるよう警告を発し、事故を防ぐ可能性がある。

アイトラッキングと視線検出の利点と欠点

アイトラッキングおよび視線検出技術が私たちの日常生活にもたらす主な利点をいくつかご紹介します。

  • 認識の向上: アイトラッキングは、人が周囲の環境とどのように視覚的に相互作用するかについての洞察を提供し、注意と集中パターンをより良く理解するのに役立ちます。
  • より良い意思決定: アイトラッキングから収集されたデータは、研究者や専門家が客観的な注意パターンに基づいて情報に基づいた意思決定を行うのに役立ちます。
  • 視覚エルゴノミクスの向上:視線の動きを分析することで、目の疲れを軽減し、快適性を向上させる画面、ワークスペース、および環境を設計できます。

これらの利点は、視線検出が私たちの生活にどのようにプラスの影響を与えるかを示していますが、その実装に伴う課題を考慮することも重要です。留意すべき主な制限事項を以下に示します。

  • プライバシーに関する懸念: 継続的なアイトラッキングはプライバシー上の問題を引き起こし、ユーザーに不快感を与える可能性があります。透明性の確保、ユーザーの同意、およびローカルでのデータ処理は、これらの懸念を軽減するのに役立ちます。
  • 高い計算需要: リアルタイムの視線追跡は、強力なハードウェアを必要とする可能性があり、低電力デバイスでのアクセスを制限します。ただし、最適化されたモデルは効率の向上に役立っています。
  • 精度の限界: 視線追跡は、照明の変化、頭の動き、または眼鏡や髪などの障害物により、実際の設定では信頼性が低くなる可能性があります。カメラの角度もパフォーマンスに影響を与える可能性があります。

未来に目を向け続ける

YOLO11ようなコンピューター・ビジョン・モデルに支えられたアイトラッキングと視線検出は、私たちと世界との関わり方を変えつつある。道路をより安全にすることから人間の行動を理解することまで、この技術は日常生活でますます役立つようになっている。

プライバシーへの懸念や高性能なコンピュータの必要性といった課題はありますが、AIとコンピュータビジョンの進歩により、アイトラッキングはより正確で使いやすいものになっています。その改善が続くにつれて、さまざまな産業でより大きな役割を果たすようになるでしょう。

詳細については、GitHub リポジトリにアクセスして、コミュニティにご参加ください。ソリューションページで、自動運転車における AI農業におけるコンピュータビジョンなどの分野におけるイノベーションをご覧ください。ライセンスオプションをご確認いただき、Vision AI プロジェクトを実現しましょう。🚀

AIの未来を
共に築きましょう!

未来の機械学習で、新たな一歩を踏み出しましょう。

無料ではじめる