Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Hướng dẫn

Khám phá cách thị giác máy tính có thể được sử dụng để phát hiện hướng nhìn

Khám phá cách các kỹ thuật Vision AI như nhận diện đối tượng và pose estimation có thể được sử dụng để theo dõi mắt và phát hiện hướng nhìn trong các ứng dụng khác nhau.

ABAbirami Vina
5 min read
Thị giác máy tính theo dõi chuyển động mắt để phát hiện hướng nhìn

Thị giác máy tính là một nhánh của trí tuệ nhân tạo (AI) tập trung vào việc cho phép máy móc phân tích và diễn giải dữ liệu hình ảnh theo cách tương tự con người. Một ứng dụng đặc biệt hấp dẫn của AI thị giác là phát hiện ánh nhìn, cho phép máy móc theo dõi và hiểu người đó đang nhìn vào đâu.

Là con người, chúng ta có thể tự nhiên theo dõi ánh nhìn của người khác và hiểu họ đang tập trung vào cái gì. Ví dụ, nếu bạn đang nói chuyện với một người bạn và họ đột ngột nhìn về phía cánh cửa, bạn có thể theo bản năng quay lại để xem điều gì đã thu hút sự chú ý của họ. Mặt khác, máy móc không có khả năng tích hợp sẵn này - chúng cần được huấn luyện bằng các kỹ thuật thị giác máy tính để nhận diện cử động mắt và diễn giải hướng nhìn.

Với thị trường phát hiện ánh nhìn toàn cầu dự kiến đạt 11,9 tỷ USD vào năm 2032, nhiều ngành công nghiệp đang áp dụng công nghệ này cho các mục đích khác nhau. Ví dụ, phát hiện ánh nhìn trong ô tô đang được sử dụng để cải thiện an toàn cho người lái bằng cách theo dõi mức độ chú ý và phát hiện các dấu hiệu buồn ngủ hoặc xao nhãng.

Trong bài viết này, chúng ta sẽ khám phá cách thị giác máy tính được sử dụng để theo dõi mắt và phát hiện ánh nhìn. Chúng ta cũng sẽ xem xét một số ứng dụng chính của nó trong nhiều ngành công nghiệp khác nhau. Hãy bắt đầu thôi!

Link to this sectionTheo dõi mắt và phát hiện ánh nhìn là gì?#

Theo dõi mắt và phát hiện ánh nhìn là các kỹ thuật được sử dụng để xác định trọng tâm chú ý của một người bằng cách phân tích cử động mắt và hướng nhìn. Nhờ những tiến bộ trong AI và công nghệ cảm biến, việc theo dõi mắt của một người trong thời gian thực hiện nay đã trở nên khả thi.

Theo truyền thống, hầu hết các hệ thống theo dõi mắt dựa vào camera hồng ngoại (IR), vốn phát hiện các cử động của đồng tử bằng cách chiếu sáng mắt bằng ánh sáng cận hồng ngoại và ghi lại các phản xạ của giác mạc. Các hệ thống này cung cấp độ chính xác cao. Tuy nhiên, chúng thường yêu cầu thiết bị đeo đầu chuyên dụng, điều này có thể gây khó chịu khi đeo và dễ gặp các vấn đề về hiệu chuẩn.

Với sự trỗi dậy của AI, các nhà nghiên cứu đã tích cực khám phá các phương pháp theo dõi mắt dựa trên thị giác máy tính. Không giống như các hệ thống dựa trên IR truyền thống, các phương pháp này dựa vào các mô hình thị giác máy tính như Ultralytics YOLO11 để phát hiện các đặc điểm khuôn mặt như mắt và đồng tử, cũng như thực hiện ước tính tư thế đầu. Ngoài ra, các mô hình học sâu chuyên biệt như GazeNet của NVIDIA được thiết kế dành riêng cho việc ước tính ánh nhìn.

YOLO11 phát hiện mắt và đồng tử của một người

Hình 1. Một ví dụ về việc sử dụng YOLO11 để phát hiện mắt và đồng tử của một người.

Mặc dù vẫn là một lĩnh vực đang phát triển, theo dõi ánh nhìn dựa trên thị giác máy tính có tiềm năng làm cho việc theo dõi mắt trở nên dễ tiếp cận hơn, giúp giảm chi phí và cải thiện khả năng sử dụng cho các ứng dụng trong tiếp thị, tâm lý học và khoa học thần kinh.

Link to this sectionSự tiến hóa của phát hiện ánh nhìn và theo dõi mắt#

Tiếp theo, hãy cùng khám phá sự chuyển dịch từ các hệ thống dựa trên hồng ngoại truyền thống sang các giải pháp dựa trên phần mềm dễ tiếp cận hơn.

Bạn có thể đang tự hỏi liệu theo dõi mắt và phát hiện ánh nhìn có thể thực hiện được mà không cần AI hay không - vậy tại sao vẫn có nghiên cứu đang diễn ra về việc tích hợp AI và thị giác máy tính vào các công nghệ này? Mặc dù các phương pháp theo dõi mắt truyền thống vẫn tồn tại, chúng thường dựa vào các camera hồng ngoại chuyên dụng và thiết bị theo dõi mắt đeo đầu, vốn có thể đắt đỏ, cồng kềnh và đòi hỏi điều kiện ánh sáng được kiểm soát. Ngược lại, các giải pháp điều khiển bằng AI cho phép theo dõi mắt bằng cách sử dụng webcam và camera điện thoại thông minh tiêu chuẩn, giúp giảm chi phí và cải thiện khả năng tiếp cận.

Một thiết bị theo dõi mắt gắn trên đầu

Hình 2. Một thiết bị theo dõi mắt đeo đầu.

Dưới đây là một số yếu tố khác đằng sau sự tiến hóa của công nghệ theo dõi mắt và phát hiện ánh nhìn:

  • Ứng dụng: Các phương pháp tiếp cận dựa trên phần mềm cho phép không gian này mở rộng ra ngoài phạm vi nghiên cứu sang các thiết bị tiêu dùng và các lĩnh vực như chơi game.
  • Khả năng mở rộng: AI có thể can thiệp để làm cho các giải pháp phát hiện ánh nhìn trở nên khả dụng với nhiều đối tượng hơn, từ người dùng cá nhân đến các ngành công nghiệp quy mô lớn.
  • Những tiến bộ trong công nghệ camera: Ngày nay, chúng ta có quyền truy cập vào các camera điện thoại thông minh và webcam có độ phân giải cao giúp tăng cường độ chính xác khi theo dõi mắt - điều mà 20 năm trước không khả thi.

Link to this sectionSử dụng Ultralytics YOLO11 để phát hiện ánh nhìn và theo dõi mắt#

Bây giờ chúng ta đã thảo luận về vai trò của thị giác máy tính trong việc theo dõi mắt và phát hiện ánh nhìn, hãy cùng tìm hiểu cách YOLO11 có thể được sử dụng ở đây.

Ultralytics YOLO11 hỗ trợ các tác vụ như phát hiện đối tượng và ước tính tư thế. Được huấn luyện trước trên tập dữ liệu COCO, nó đạt được độ chính xác cao trong việc phát hiện nhiều đối tượng khác nhau. Cụ thể, đối với một giải pháp phát hiện ánh nhìn, YOLO11 có thể đóng vai trò hỗ trợ.

Mặc dù nó không thể dự đoán trực tiếp hướng nhìn, nhưng nó có thể được tinh chỉnh để phát hiện khuôn mặt, mắt và đồng tử, đây là những yếu tố chính để phân tích sâu hơn. Khi các đặc điểm này được xác định, các mô hình bổ sung có thể xử lý dữ liệu cử động mắt để ước tính hướng nhìn.

Ví dụ, để cải thiện độ chính xác, YOLO11 có thể được huấn luyện tùy chỉnh trên các tập dữ liệu như WIDER FACE để phát hiện khuôn mặt. Ngoài ra, liên quan đến khả năng ước tính tư thế của YOLO11, nó có thể giúp theo dõi hướng đầu, điều này giúp tăng cường độ chính xác cho việc phát hiện ánh nhìn.

YOLO11 phát hiện khuôn mặt người

Hình 3. YOLO11 có thể được sử dụng để phát hiện khuôn mặt người.

Link to this sectionCác ứng dụng thực tế của phát hiện ánh nhìn#

Phát hiện ánh nhìn, được hỗ trợ bởi thị giác máy tính, có nhiều ứng dụng rộng rãi trong các ngành công nghiệp, từ cải thiện an toàn trong lĩnh vực ô tô đến phân tích sự tập trung trong trò chơi. Hãy cùng khám phá cách các lĩnh vực khác nhau đang tận dụng công nghệ này.

Link to this sectionTheo dõi ánh nhìn trong trò chơi#

Theo dõi mắt đang được sử dụng trong trò chơi để cung cấp thông tin chi tiết theo thời gian thực về sự tập trung, ra quyết định và thời gian phản ứng của người chơi. Bằng cách theo dõi cử động mắt, công nghệ này giúp người chơi tinh chỉnh chiến lược, cải thiện các chương trình huấn luyện và nâng cao sự tham gia của khán giả bằng cách hiển thị trực quan nơi người chơi đang nhìn trong những khoảnh khắc quan trọng.

Một ví dụ thú vị về điều này là đua xe mô phỏng, một môn thể thao điện tử cạnh tranh ảo nơi người chơi đua xe bằng cách sử dụng các mô phỏng lái xe thực tế. Theo dõi mắt giúp phân tích cách người lái tập trung vào đường đua, phản ứng với đối thủ và điều hướng các khúc cua gắt. Bằng cách theo dõi ánh nhìn của họ trong thời gian thực, các huấn luyện viên có thể xác định các mô hình, phát hiện các yếu tố xao nhãng và cải thiện chiến lược đua xe.

Theo dõi mắt được sử dụng để giám sát và phân tích các tay đua mô phỏng

Hình 4. Theo dõi mắt có thể được sử dụng để giám sát và phân tích người đua xe mô phỏng.

Ngoài đua xe mô phỏng, theo dõi mắt cũng đang được sử dụng trong các trò chơi cạnh tranh nhịp độ nhanh để phân tích phản xạ, thời gian phản ứng của người chơi và cách họ tập trung vào các yếu tố quan trọng trong trò chơi. Bằng cách hiểu nơi người chơi nhìn trước khi thực hiện hành động, dữ liệu này giúp tinh chỉnh việc ra quyết định, cải thiện độ chính xác và nâng cao quá trình huấn luyện cho lối chơi cấp độ cao.

Link to this sectionƯớc tính ánh nhìn cho nghiên cứu tâm lý học#

Có nhiều ứng dụng AI thị giác của việc ước tính ánh nhìn liên quan đến nghiên cứu. Một ví dụ điển hình là việc sử dụng nó trong tâm lý học để nghiên cứu sự chú ý, tải nhận thức và hành vi xã hội. Bằng cách phân tích cử động mắt, các nhà nghiên cứu có thể hiểu sâu hơn về nhận thức, việc ra quyết định và các tình trạng sức khỏe tâm thần như tự kỷ và ADHD.

Cụ thể, theo dõi ánh nhìn bằng thị giác máy tính giúp xác định các mô hình trong cử động mắt, thời gian cố định ánh nhìn và sự chú ý trực quan, điều này có thể tiết lộ các trạng thái nhận thức và cảm xúc. Với sự phát triển của học sâu và ước tính ánh nhìn điều khiển bằng AI, các phương pháp này đang trở nên chính xác và dễ tiếp cận hơn, cho phép áp dụng rộng rãi hơn trong nghiên cứu thần kinh.

Link to this sectionAn toàn ô tô#

Qua nhiều năm, các nhà nghiên cứu đã sử dụng các phương pháp khác nhau để nghiên cứu sự chú ý và tập trung của người lái trong các điều kiện giao thông khác nhau. Trong số các phương pháp này, theo dõi mắt đã đóng vai trò quan trọng và có thể cung cấp thông tin chi tiết về nơi người lái đang nhìn khi lái xe.

Với sự trợ giúp của các mô hình thị giác máy tính, phát hiện ánh nhìn có thể cải thiện phân tích này hơn nữa bằng cách theo dõi chính xác cử động mắt trong thời gian thực. Phân tích này có thể cung cấp cho chúng ta sự hiểu biết tốt hơn về hành vi của người lái, giúp xác định các yếu tố xao nhãng, mệt mỏi hoặc mất tập trung, từ đó cải thiện an toàn giao thông và hỗ trợ phát triển các hệ thống hỗ trợ người lái tiên tiến.

Giám sát người lái xe bằng cách sử dụng phát hiện khuôn mặt và theo dõi ánh nhìn

Hình 5. Một ví dụ về việc giám sát người lái bằng cách sử dụng phát hiện khuôn mặt và theo dõi ánh nhìn.

Ví dụ, nếu người lái thường xuyên nhìn ra khỏi đường để kiểm tra điện thoại hoặc phản ứng chậm tại các giao lộ, hệ thống có thể phát hiện các hành vi này và đưa ra cảnh báo để tập trung sự chú ý của họ trở lại, từ đó có khả năng ngăn ngừa tai nạn.

Link to this sectionƯu và nhược điểm của theo dõi mắt và phát hiện ánh nhìn#

Dưới đây là một số lợi ích chính mà công nghệ theo dõi mắt và phát hiện ánh nhìn có thể mang lại cho cuộc sống hàng ngày của chúng ta:

  • Tăng cường nhận thức: Theo dõi mắt cung cấp thông tin chi tiết về cách con người tương tác trực quan với môi trường xung quanh, giúp hiểu rõ hơn về các mô hình tập trung và chú ý.
  • Ra quyết định tốt hơn: Dữ liệu thu thập được từ theo dõi mắt giúp các nhà nghiên cứu và chuyên gia đưa ra quyết định dựa trên các mô hình chú ý khách quan.
  • Cải thiện công thái học thị giác: Phân tích hành vi ánh nhìn có thể giúp thiết kế màn hình, không gian làm việc và môi trường nhằm giảm mỏi mắt và cải thiện sự thoải mái.

Trong khi những lợi ích này làm nổi bật cách phát hiện ánh nhìn có thể tác động tích cực đến cuộc sống của chúng ta, cũng cần cân nhắc các thách thức liên quan đến việc triển khai công nghệ này. Dưới đây là một số hạn chế chính cần lưu ý:

  • Vấn đề quyền riêng tư: Theo dõi mắt liên tục có thể gây ra các vấn đề về quyền riêng tư, làm người dùng cảm thấy không thoải mái. Việc đảm bảo tính minh bạch, sự đồng ý của người dùng và xử lý dữ liệu cục bộ có thể giúp giảm thiểu những lo ngại này.

  • Nhu cầu tính toán cao: Theo dõi ánh nhìn theo thời gian thực có thể yêu cầu phần cứng mạnh mẽ, hạn chế khả năng tiếp cận trên các thiết bị công suất thấp. Tuy nhiên, các mô hình tối ưu hóa đang giúp cải thiện hiệu quả.

  • Hạn chế về độ chính xác: Theo dõi ánh nhìn có thể kém tin cậy hơn trong các bối cảnh thực tế do thay đổi ánh sáng, cử động đầu hoặc các vật cản như kính và tóc. Góc đặt camera cũng có thể ảnh hưởng đến hiệu suất.

Link to this sectionHướng tới tương lai#

Theo dõi mắt và phát hiện ánh nhìn, được hỗ trợ bởi các mô hình thị giác máy tính như YOLO11, đang thay đổi cách chúng ta tương tác với thế giới. Từ việc làm cho đường phố an toàn hơn đến việc thấu hiểu hành vi con người, công nghệ này đang trở nên ngày càng hữu ích trong cuộc sống hàng ngày.

Mặc dù có những thách thức như lo ngại về quyền riêng tư và nhu cầu về máy tính mạnh mẽ, những tiến bộ trong AI và thị giác máy tính đang làm cho việc theo dõi mắt trở nên chính xác và dễ sử dụng hơn. Khi nó tiếp tục cải thiện, nó có khả năng sẽ đóng vai trò lớn hơn trong hàng loạt ngành công nghiệp.

Để tìm hiểu thêm, hãy truy cập kho lưu trữ GitHub của chúng tôi và tham gia cùng cộng đồng của chúng tôi. Khám phá các đổi mới trong các lĩnh vực như AI trong xe tự láithị giác máy tính trong nông nghiệp trên các trang giải pháp của chúng tôi. Xem các tùy chọn cấp phép của chúng tôi và hiện thực hóa các dự án AI thị giác của bạn. 🚀

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning