Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Tìm hiểu cách thị giác máy tính có thể được sử dụng để phát hiện ánh mắt

Abirami Vina

5 phút đọc

19 tháng 2, 2025

Khám phá cách các kỹ thuật Vision AI như phát hiện đối tượng và ước tính tư thế có thể được sử dụng để theo dõi mắt và phát hiện ánh nhìn trong các ứng dụng khác nhau.

Thị giác máy tính (Computer vision) là một nhánh của trí tuệ nhân tạo (AI) tập trung vào việc cho phép máy móc phân tích và diễn giải dữ liệu trực quan tương tự như con người. Một ứng dụng đặc biệt hấp dẫn của Vision AI là nhận diện ánh mắt (gaze detection), cho phép máy móc theo dõi và hiểu được hướng nhìn của một người.

Là con người, chúng ta có thể tự nhiên theo dõi ánh mắt của ai đó và hiểu họ đang tập trung vào điều gì. Ví dụ: nếu bạn đang nói chuyện với một người bạn và họ đột nhiên nhìn về phía cửa, bạn có thể theo bản năng quay lại để xem điều gì thu hút sự chú ý của họ. Mặt khác, máy móc không có khả năng tích hợp sẵn này - chúng cần được đào tạo bằng các kỹ thuật thị giác máy tính để nhận biết các chuyển động của mắt và giải thích hướng nhìn. 

Với việc thị trường phát hiện ánh nhìn toàn cầu dự kiến đạt 11,9 tỷ đô la vào năm 2032, nhiều ngành công nghiệp đang áp dụng nó cho các ứng dụng khác nhau. Ví dụ, phát hiện ánh nhìn trong ô tô đang được sử dụng để cải thiện sự an toàn cho người lái bằng cách theo dõi mức độ tập trung và phát hiện các dấu hiệu buồn ngủ hoặc mất tập trung.

Trong bài viết này, chúng ta sẽ khám phá cách thị giác máy tính được sử dụng để theo dõi mắt và phát hiện ánh nhìn. Chúng ta cũng sẽ xem xét một số ứng dụng chính của nó trong nhiều ngành công nghiệp khác nhau. Hãy bắt đầu!

Theo dõi mắt và nhận diện ánh nhìn là gì?

Theo dõi mắt và phát hiện ánh nhìn là các kỹ thuật được sử dụng để xác định sự tập trung chú ý của một người bằng cách phân tích chuyển động mắt và hướng nhìn. Nhờ những tiến bộ trong AI và công nghệ cảm biến, giờ đây có thể theo dõi mắt của một người trong thời gian thực. 

Theo truyền thống, hầu hết các hệ thống theo dõi mắt đều dựa vào camera hồng ngoại (IR), phát hiện chuyển động của đồng tử bằng cách chiếu sáng mắt bằng ánh sáng cận hồng ngoại và chụp lại các phản xạ giác mạc. Các hệ thống này cung cấp độ chính xác cao. Tuy nhiên, chúng thường yêu cầu thiết bị đội đầu chuyên dụng, có thể gây khó chịu khi đeo và dễ gặp sự cố về hiệu chuẩn.

Với sự trỗi dậy của AI, các nhà nghiên cứu đã tích cực khám phá các phương pháp theo dõi mắt dựa trên thị giác máy tính. Không giống như các hệ thống dựa trên IR truyền thống, các phương pháp này dựa vào các mô hình thị giác máy tính như Ultralytics YOLO11 để phát hiện các đặc điểm trên khuôn mặt như mắt và đồng tử, cũng như thực hiện ước tính tư thế đầu. Hơn nữa, các mô hình học sâu chuyên dụng như GazeNet của NVIDIA được thiết kế đặc biệt để ước tính ánh nhìn. 

__wf_reserved_inherit
Hình 1. Một ví dụ về việc sử dụng YOLO11 để phát hiện mắt và đồng tử của một người.

Mặc dù vẫn là một lĩnh vực đang phát triển, theo dõi ánh mắt dựa trên thị giác máy tính có tiềm năng giúp việc theo dõi ánh mắt trở nên dễ tiếp cận hơn, giảm chi phí và cải thiện khả năng sử dụng cho các ứng dụng trong tiếp thị, tâm lý học và khoa học thần kinh.

Sự phát triển của phát hiện ánh nhìn và theo dõi mắt

Tiếp theo, hãy khám phá sự chuyển đổi từ các hệ thống dựa trên hồng ngoại truyền thống sang các giải pháp dựa trên phần mềm dễ tiếp cận hơn.

Bạn có thể thắc mắc liệu theo dõi mắt và phát hiện ánh nhìn có thể thực hiện được mà không cần AI hay không - vậy tại sao vẫn có những nghiên cứu đang diễn ra về việc tích hợp AI và thị giác máy tính vào các công nghệ này? Mặc dù các phương pháp theo dõi mắt truyền thống vẫn tồn tại, nhưng chúng thường dựa vào các camera hồng ngoại chuyên dụng và các thiết bị theo dõi mắt gắn trên đầu, điều này có thể tốn kém, cồng kềnh và đòi hỏi điều kiện ánh sáng được kiểm soát. Tuy nhiên, các giải pháp dựa trên AI cho phép theo dõi mắt bằng cách sử dụng webcam tiêu chuẩn và camera điện thoại thông minh, giảm chi phí và cải thiện khả năng tiếp cận. 

__wf_reserved_inherit
Hình 2. Thiết bị theo dõi mắt gắn trên đầu.

Dưới đây là một số yếu tố khác đằng sau sự phát triển của công nghệ theo dõi mắt và phát hiện ánh nhìn:

  • Ứng dụng: Các phương pháp tiếp cận dựa trên phần mềm cho phép không gian này mở rộng ra ngoài nghiên cứu vào các thiết bị tiêu dùng và các lĩnh vực như trò chơi.
  • Khả năng mở rộng: AI có thể can thiệp để cung cấp các giải pháp phát hiện ánh mắt cho đối tượng người dùng rộng hơn, từ người dùng cá nhân đến các ngành công nghiệp quy mô lớn.
  • Những tiến bộ trong công nghệ máy ảnh: Ngày nay, chúng ta có quyền truy cập vào điện thoại thông minh và máy ảnh webcam có độ phân giải cao hơn, giúp tăng cường độ chính xác của theo dõi mắt - điều mà 20 năm trước không khả thi.

Sử dụng Ultralytics YOLO11 để phát hiện ánh nhìn và theo dõi mắt

Sau khi thảo luận về vai trò của thị giác máy tính trong theo dõi mắt và phát hiện ánh nhìn, hãy cùng tìm hiểu cách YOLO11 có thể được sử dụng trong lĩnh vực này.

Ultralytics YOLO11 hỗ trợ các tác vụ như phát hiện đối tượng (object detection) và ước tính tư thế (pose estimation). Được huấn luyện trước trên tập dữ liệu COCO, nó đạt được độ chính xác cao trong việc phát hiện các đối tượng khác nhau. Đặc biệt, đối với một giải pháp phát hiện ánh nhìn, YOLO11 có thể đóng vai trò hỗ trợ. 

Mặc dù nó không thể dự đoán trực tiếp hướng nhìn, nhưng nó có thể được tinh chỉnh để phát hiện khuôn mặt, mắt và đồng tử, đây là những yếu tố quan trọng để phân tích thêm. Sau khi các tính năng này được xác định, các mô hình bổ sung có thể xử lý dữ liệu chuyển động mắt để ước tính hướng nhìn. 

Ví dụ, để cải thiện độ chính xác, YOLO11 có thể được tùy chỉnh huấn luyện trên các bộ dữ liệu như WIDER FACE để phát hiện khuôn mặt. Ngoài ra, đối với khả năng ước tính tư thế của YOLO11, nó có thể giúp theo dõi hướng đầu, giúp tăng cường độ chính xác của việc phát hiện ánh nhìn.

__wf_reserved_inherit
Hình 3. YOLO11 có thể được sử dụng để phát hiện khuôn mặt người.

Các ứng dụng thực tế của nhận dạng ánh mắt

Phát hiện ánh mắt, được hỗ trợ bởi thị giác máy tính, có nhiều ứng dụng trong các ngành công nghiệp, từ cải thiện an toàn trong lĩnh vực ô tô đến phân tích sự tập trung trong trò chơi điện tử. Hãy cùng khám phá cách các lĩnh vực khác nhau đang tận dụng công nghệ này.

Theo dõi ánh mắt trong trò chơi điện tử

Theo dõi mắt đang được sử dụng trong game để cung cấp thông tin chi tiết theo thời gian thực về sự tập trung, ra quyết định và thời gian phản ứng của người chơi. Bằng cách theo dõi chuyển động của mắt, công nghệ này giúp người chơi tinh chỉnh chiến lược của họ, tăng cường các chương trình đào tạo và cải thiện sự tương tác của khán giả bằng cách hiển thị trực quan nơi người chơi đang nhìn trong những khoảnh khắc quan trọng.

Một ví dụ thú vị về điều này là đua xe mô phỏng (sim racing), một môn thể thao ảo cạnh tranh, nơi người chơi đua xe bằng cách sử dụng các mô phỏng lái xe thực tế. Theo dõi ánh mắt (eye tracking) giúp phân tích cách người lái tập trung vào đường đua, phản ứng với đối thủ và điều hướng các khúc cua gấp. Bằng cách theo dõi ánh nhìn của họ trong thời gian thực, các huấn luyện viên có thể xác định các kiểu mẫu, phát hiện sự xao nhãng và cải thiện chiến lược đua xe. 

__wf_reserved_inherit
Hình 4. Theo dõi mắt có thể được sử dụng để giám sát và phân tích những người chơi đua xe mô phỏng. 

Ngoài đua xe mô phỏng, theo dõi ánh mắt còn được sử dụng trong các trò chơi cạnh tranh nhịp độ nhanh để phân tích phản xạ, thời gian phản ứng và cách người chơi tập trung vào các yếu tố quan trọng trong trò chơi. Bằng cách hiểu vị trí người chơi nhìn trước khi thực hiện một động thái, dữ liệu này giúp tinh chỉnh việc ra quyết định, cải thiện độ chính xác và tăng cường đào tạo cho lối chơi cấp cao.

Ước tính ánh mắt cho nghiên cứu tâm lý

Có nhiều ứng dụng Vision AI về ước tính ánh nhìn liên quan đến nghiên cứu. Một ví dụ điển hình về điều này là việc sử dụng nó trong tâm lý học để nghiên cứu sự chú ý, tải nhận thức và hành vi xã hội. Bằng cách phân tích chuyển động của mắt, các nhà nghiên cứu có thể hiểu sâu hơn về nhận thức, ra quyết định và các tình trạng sức khỏe tâm thần như tự kỷ và ADHD. 

Cụ thể, theo dõi ánh mắt bằng thị giác máy tính giúp xác định các kiểu trong chuyển động mắt, thời gian cố định và sự chú ý thị giác, có thể tiết lộ trạng thái nhận thức và cảm xúc. Với sự tiến bộ của học sâu và ước tính ánh mắt dựa trên AI, các phương pháp này đang trở nên chính xác và dễ tiếp cận hơn, cho phép các ứng dụng rộng rãi hơn trong nghiên cứu thần kinh học.

An toàn ô tô

Trong những năm qua, các nhà nghiên cứu đã sử dụng các phương pháp khác nhau để nghiên cứu sự chú ý và tập trung của người lái xe trong các điều kiện giao thông khác nhau. Trong số các phương pháp này, theo dõi mắt (eye-tracking) là rất quan trọng và có thể cung cấp thông tin chi tiết về vị trí mà người lái xe đang nhìn khi lái xe. 

Với sự trợ giúp của các mô hình thị giác máy tính, việc phát hiện ánh nhìn có thể cải thiện hơn nữa phân tích này bằng cách theo dõi chính xác các chuyển động của mắt trong thời gian thực. Phân tích này có thể cung cấp cho chúng ta sự hiểu biết tốt hơn về hành vi của người lái xe, giúp xác định sự mất tập trung, mệt mỏi hoặc sự xao nhãng, từ đó có thể cải thiện an toàn đường bộ và hỗ trợ phát triển các hệ thống hỗ trợ người lái tiên tiến.

__wf_reserved_inherit
Hình 5. Một ví dụ về việc giám sát người lái xe bằng cách sử dụng nhận diện khuôn mặt và theo dõi ánh mắt.

Ví dụ: nếu một người lái xe thường xuyên nhìn khỏi đường để kiểm tra điện thoại hoặc phản ứng chậm tại các giao lộ, hệ thống có thể phát hiện những hành vi này và đưa ra cảnh báo để tập trung lại sự chú ý của họ, có khả năng ngăn ngừa tai nạn.

Ưu và nhược điểm của theo dõi mắt và phát hiện ánh nhìn

Dưới đây là một số lợi ích chính mà công nghệ theo dõi mắt và phát hiện ánh nhìn có thể mang lại cho cuộc sống hàng ngày của chúng ta:

  • Nâng cao nhận thức: Theo dõi ánh mắt cung cấp thông tin chi tiết về cách mọi người tương tác bằng thị giác với môi trường xung quanh, giúp hiểu rõ hơn về sự chú ý và các kiểu tập trung.
  • Ra quyết định tốt hơn: Dữ liệu thu thập được từ theo dõi mắt giúp các nhà nghiên cứu và chuyên gia đưa ra quyết định sáng suốt dựa trên các kiểu chú ý khách quan.
  • Cải thiện công thái học thị giác: Phân tích hành vi nhìn có thể giúp thiết kế màn hình, không gian làm việc và môi trường giúp giảm mỏi mắt và cải thiện sự thoải mái.

Mặc dù những lợi ích này làm nổi bật cách phát hiện ánh mắt có thể tác động tích cực đến cuộc sống của chúng ta, điều quan trọng nữa là phải xem xét những thách thức liên quan đến việc triển khai nó. Dưới đây là một số hạn chế chính cần ghi nhớ:

  • Các lo ngại về quyền riêng tư (Privacy concerns): Việc theo dõi mắt liên tục có thể làm dấy lên các vấn đề về quyền riêng tư, khiến người dùng cảm thấy khó chịu. Đảm bảo tính minh bạch, sự đồng ý của người dùng và xử lý dữ liệu cục bộ có thể giúp giảm thiểu những lo ngại này.
  • Nhu cầu tính toán cao: Theo dõi ánh mắt theo thời gian thực có thể yêu cầu phần cứng mạnh mẽ, hạn chế khả năng truy cập trên các thiết bị có công suất thấp. Tuy nhiên, các mô hình được tối ưu hóa đang giúp cải thiện hiệu quả.
  • Hạn chế về độ chính xác: Theo dõi ánh mắt có thể kém tin cậy hơn trong môi trường thực tế do thay đổi ánh sáng, chuyển động đầu hoặc các vật cản như kính và tóc. Góc camera cũng có thể ảnh hưởng đến hiệu suất.

Hướng tầm nhìn vào tương lai

Theo dõi mắt và phát hiện ánh nhìn, được hỗ trợ bởi các mô hình thị giác máy tính như YOLO11, đang thay đổi cách chúng ta tương tác với thế giới. Từ việc làm cho đường xá an toàn hơn đến hiểu hành vi của con người, công nghệ này ngày càng trở nên hữu ích trong cuộc sống hàng ngày.

Mặc dù có những thách thức như lo ngại về quyền riêng tư và nhu cầu về máy tính mạnh mẽ, những tiến bộ trong AI và thị giác máy tính đang làm cho việc theo dõi ánh mắt trở nên chính xác hơn và dễ sử dụng hơn. Khi nó tiếp tục được cải thiện, nó có thể sẽ đóng một vai trò lớn hơn trong một loạt các ngành công nghiệp.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tương tác với cộng đồng của chúng tôi. Khám phá những đổi mới trong các lĩnh vực như AI trong xe tự láicomputer vision trong nông nghiệp trên các trang giải pháp của chúng tôi. Xem các tùy chọn cấp phép của chúng tôi và biến các dự án Vision AI của bạn thành hiện thực. 🚀

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard