Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

AI hành vi đang làm cho thị giác máy tính có tác động hơn

Abirami Vina

4 phút đọc

6 tháng 1, 2025

Hãy cùng chúng tôi xem lại bài phát biểu quan trọng về YOLO Vision 2024 của David Scott về phân tích hành vi dựa trên AI và các ứng dụng thực tế của nó trong các lĩnh vực như chăn nuôi.

Trong nhiều năm, những đổi mới về thị giác máy tính đã tập trung vào các tác vụ như phát hiện đối tượng - xác định các đối tượng như chó hoặc ô tô trong hình ảnh và video. Các phương pháp này đã cho phép các ứng dụng trong các lĩnh vực như xe tự hành, sản xuất và chăm sóc sức khỏe. 

Tuy nhiên, các tác vụ này thường chỉ tập trung vào việc xác định một đối tượng là gì. Điều gì sẽ xảy ra nếu các hệ thống Vision AI có thể tiến thêm một bước nữa? Ví dụ: thay vì chỉ đơn giản là phát hiện một con chó, giả sử nó có thể hiểu rằng con chó đang đuổi theo một quả bóng hoặc một chiếc xe đang phanh gấp vì có người đi bộ đang băng qua đường. Sự thay đổi từ nhận dạng cơ bản sang hiểu biết theo ngữ cảnh này thể hiện một sự thay đổi lớn hướng tới AI hành vi thông minh hơn, nhận biết ngữ cảnh.

Tại YOLO Vision 2024 (YV24), sự kiện kết hợp thường niên của Ultralytics kỷ niệm những tiến bộ trong Vision AI, khái niệm phân tích hành vi dựa trên AI đã trở thành tâm điểm trong một buổi nói chuyện thú vị của David Scott, CEO của The Main Branch.

Trong bài nói chuyện của mình, David đã khám phá quá trình chuyển đổi từ các tác vụ thị giác máy tính cơ bản sang theo dõi hành vi. Với hơn 25 năm kinh nghiệm xây dựng các ứng dụng công nghệ tiên tiến, ông đã giới thiệu tác động của bước nhảy vọt này. Ông nhấn mạnh cách giải mã các mẫu và hành vi đang định hình lại các ngành công nghiệp như nông nghiệp và phúc lợi động vật.

Trong bài viết này, chúng ta sẽ điểm qua những điểm nổi bật trong bài nói chuyện của David và khám phá cách theo dõi hành vi làm cho AI trở nên thiết thực hơn. 

Tìm hiểu những thách thức trong việc áp dụng AI

David Scott bắt đầu bài phát biểu quan trọng của mình bằng một lời nhắc nhở thực tế táo bạo và nói, "Một đồng nghiệp của tôi thường nói, 'Khoa học không bán được', điều này có phần xúc phạm nhiều người trong chúng ta ở đây vì chúng ta thực sự thích khoa học. AI thực sự rất tuyệt - tại sao mọi người không mua nó? Nhưng thực tế là, mọi người không muốn mua nó chỉ vì chúng ta nghĩ nó tuyệt vời; họ cần một lý do để mua nó."

Ông tiếp tục giải thích rằng tại công ty của mình, The Main Branch, trọng tâm luôn là giải quyết các vấn đề thực tế bằng AI, chứ không chỉ thể hiện khả năng của nó. Rất nhiều khách hàng đến và muốn nói về cách họ có thể sử dụng AI nói chung, nhưng ông thấy đó là một cách tiếp cận lạc hậu - giống như có một giải pháp mà không có vấn đề. Thay vào đó, họ làm việc với những khách hàng mang đến những thách thức cụ thể để họ có thể tạo ra các giải pháp AI thực sự tạo ra sự khác biệt.

__wf_reserved_inherit
Hình 1. David Scott trên sân khấu tại YV24.

David cũng chia sẻ rằng công việc của họ thường vượt ra ngoài việc chỉ nhận dạng các đối tượng trong một cảnh. Xác định những gì có ở đó chỉ là bước đầu tiên. Giá trị thực sự đến từ việc tìm ra phải làm gì với thông tin đó và làm cho nó hữu ích trong chuỗi giá trị lớn hơn. 

Công nghệ theo dõi hành vi: chìa khóa cho AI có thể hành động

Một bước quan trọng để làm cho AI thực sự hữu ích là vượt ra ngoài các tác vụ thị giác máy tính cơ bản như phát hiện đối tượng và sử dụng những hiểu biết đó để theo dõi hành vi. David nhấn mạnh rằng AI hành vi tập trung vào việc hiểu các hành động và mô hình, không chỉ xác định các đối tượng. Điều này làm cho AI có khả năng nhận ra các sự kiện có ý nghĩa và cung cấp những hiểu biết sâu sắc có thể hành động.

Ông đưa ra một ví dụ về một con vật lăn trên sàn, điều này có thể cho thấy nó bị bệnh. Trong khi mọi người không thể theo dõi một con vật suốt ngày đêm, thì các hệ thống giám sát dựa trên AI với khả năng theo dõi hành vi có thể. Các giải pháp như vậy có thể liên tục theo dõi các đối tượng, phát hiện các hành vi cụ thể, gửi cảnh báo và cho phép hành động kịp thời. Điều này biến dữ liệu thô thành một thứ thiết thực và có giá trị.

David cũng cho thấy rằng cách tiếp cận này làm cho AI không chỉ thú vị mà còn thực sự có tác động. Bằng cách giải quyết các vấn đề thực tế, như giám sát hành vi và hành động dựa trên chúng, theo dõi hành vi có thể trở thành một phần quan trọng của các giải pháp AI hiệu quả trong nhiều ngành công nghiệp khác nhau.

Đưa AI hành vi vào cuộc sống

David Scott sau đó minh họa cách Ultralytics YOLOv8, một mô hình thị giác máy tính, là một bước đột phá cho các dự án theo dõi hành vi của nhóm ông. Nó cung cấp cho họ một nền tảng vững chắc để phát hiện, phân loại và theo dõi các đối tượng. Nhóm của ông cũng tiến thêm một bước nữa và huấn luyện tùy chỉnh YOLOv8 để tập trung vào việc giám sát hành vi theo thời gian, làm cho nó thiết thực và hữu ích hơn cho các tình huống thực tế.

Điều thú vị là, với việc phát hành Ultralytics YOLO11, các giải pháp như giải pháp do The Main Branch tạo ra có thể trở nên đáng tin cậy và chính xác hơn. Mô hình mới nhất này cung cấp các tính năng như độ chính xác được cải thiện và khả năng xử lý nhanh hơn, giúp tăng cường khả năng theo dõi hành vi. Chúng ta sẽ thảo luận về điều này chi tiết hơn sau khi hiểu rõ hơn về các ứng dụng mà AI hành vi có thể được sử dụng.

Tiếp theo, hãy khám phá các giải pháp mà David đã nói đến và cách công nghệ theo dõi hành vi đang được sử dụng trong các ứng dụng thực tế để giải quyết các thách thức hàng ngày và tạo ra tác động có ý nghĩa.

HerdSense với phân tích hành vi dựa trên AI

Đầu tiên, David đã chia sẻ một thách thức thú vị mà họ đã giải quyết với một dự án có tên là HerdSense, liên quan đến việc theo dõi sức khỏe của hàng ngàn con bò trên một khu đất chăn nuôi rộng lớn. Mục tiêu là theo dõi hành vi của từng con bò để xác định các vấn đề sức khỏe tiềm ẩn. Điều này có nghĩa là phải theo dõi hàng chục ngàn con vật cùng một lúc và đó không phải là một nhiệm vụ đơn giản.

__wf_reserved_inherit
Hình 2. HerdSense tập trung vào việc theo dõi và xác định bò bằng AI hành vi.

Để bắt đầu giải quyết vấn đề xác định từng con bò và theo dõi hành vi của nó, nhóm của David đã tiến hành một hội thảo kéo dài hai ngày để phác thảo mọi hành vi có thể mà họ cần theo dõi. Họ đã xác định được tổng cộng hơn 200 hành vi.

Mỗi một trong số 200 hành vi đều phụ thuộc vào khả năng nhận dạng chính xác từng con bò riêng lẻ, vì tất cả dữ liệu phải được liên kết với các con vật cụ thể. Một mối quan tâm lớn là theo dõi bò khi chúng tụ tập thành đàn, điều này gây khó khăn cho việc nhìn thấy từng con vật riêng lẻ. 

Nhóm của David đã phát triển một hệ thống thị giác máy tính để đảm bảo mỗi con bò được xác định nhất quán, ngay cả trong những tình huống khó khăn. Họ đã có thể xác nhận rằng cùng một con bò sẽ luôn được gán cùng một ID, ngay cả khi nó biến mất khỏi tầm nhìn, lẫn vào những con khác hoặc xuất hiện lại sau đó.

Giám sát sức khỏe ngựa bằng thị giác máy tính

Tiếp theo, David giới thiệu một dự án hấp dẫn khác, nơi họ áp dụng các kỹ thuật theo dõi hành vi tương tự để theo dõi ngựa. Trong dự án này, nhóm của David không cần theo dõi ID từng con ngựa chặt chẽ như họ đã làm với bò. Thay vào đó, họ tập trung vào các hành vi cụ thể và theo dõi các chi tiết như thói quen ăn uống và mức độ hoạt động chung để phát hiện sớm bất kỳ vấn đề sức khỏe nào. Xác định những thay đổi nhỏ trong hành vi có thể dẫn đến các can thiệp nhanh hơn để cung cấp dịch vụ chăm sóc tốt hơn và ngăn ngừa các vấn đề trước khi chúng trở nên nghiêm trọng.

__wf_reserved_inherit
Hình 3. Giám sát ngựa với sự hỗ trợ của AI hành vi.

Tại sao AI hành vi không đơn giản như vẻ ngoài của nó

David cũng thảo luận về sự phức tạp của việc theo dõi hành vi thông qua một ví dụ hấp dẫn. Trong khi nghiên cứu các cách để cải thiện phân tích hành vi, nhóm của ông đã bắt gặp một công ty tuyên bố phát hiện hành vi trộm cắp bằng cách phân tích các tư thế cụ thể, như ai đó đang thò tay vào túi. Lúc đầu, điều này có vẻ là một ý tưởng thông minh - những chuyển động nhất định có thể gợi ý hành vi đáng ngờ, phải không?

__wf_reserved_inherit
Hình 4. Tìm hiểu những thách thức của công nghệ theo dõi hành vi.

Tuy nhiên, khi David tìm hiểu sâu hơn, anh nhận ra những hạn chế của phương pháp này. Một tư thế duy nhất, chẳng hạn như tay trong túi, không nhất thiết có nghĩa là ai đó đang ăn cắp ở cửa hàng. Nó có thể chỉ ra rằng họ đang thư giãn, suy nghĩ hoặc thậm chí bị lạnh. Vấn đề với việc tập trung vào các tư thế riêng lẻ là nó bỏ qua bối cảnh lớn hơn. Hành vi không chỉ là một hành động duy nhất - nó là một chuỗi các hành động theo thời gian, được định hình bởi bối cảnh và ý định.

David nhấn mạnh rằng việc theo dõi hành vi thực sự phức tạp hơn nhiều và đòi hỏi một cách tiếp cận toàn diện. Đó là về việc phân tích các chuỗi hành động và hiểu ý nghĩa của chúng trong bức tranh rộng lớn hơn. Mặc dù ngành công nghiệp AI đang có những bước tiến, nhưng ông lưu ý rằng vẫn còn nhiều việc phải làm trong việc thúc đẩy theo dõi hành vi để cung cấp những hiểu biết sâu sắc có ý nghĩa và chính xác.

Tạo ra các mô hình AI thị giác thông minh hơn, có khả năng hiểu các hành động

Sau đó, David đã đưa khán giả đi sâu vào hậu trường để cho họ thấy cách nhóm của anh ấy xây dựng một giải pháp thị giác máy tính để theo dõi sức khỏe của bò với sự trợ giúp của YOLOv8 và khả năng ước tính tư thế của nó.

Họ bắt đầu bằng cách tạo một tập dữ liệu tùy chỉnh để ước tính tư thế của một con bò, tăng số lượng điểm chính tiêu chuẩn từ 17 lên 145 để làm cho mô hình tốt hơn trong việc phân tích chuyển động. Sau đó, mô hình đã được đào tạo trên một tập dữ liệu khổng lồ gồm hơn 2 triệu hình ảnh và 110 triệu ví dụ về hành vi. 

Sử dụng cơ sở hạ tầng phần cứng tiên tiến, nhóm của David đã có thể huấn luyện mô hình chỉ trong hai ngày thay vì vài tuần nếu sử dụng phần cứng thông thường. Mô hình đã huấn luyện sau đó được tích hợp với một trình theo dõi hành vi tùy chỉnh, phân tích đồng thời nhiều khung hình video để phát hiện các kiểu hành động của bò.

Kết quả là một giải pháp dựa trên AI thị giác có thể phát hiện và theo dõi tám hành vi khác nhau của bò như ăn, uống và nằm xuống để phát hiện những thay đổi nhỏ trong hành vi có thể báo hiệu các vấn đề về sức khỏe. Điều này cho phép nông dân hành động nhanh chóng và cải thiện việc quản lý đàn.

Hướng đi tương lai cho AI hành vi

David kết thúc bài nói chuyện của mình bằng cách chia sẻ một bài học quan trọng với khán giả: "Nếu bạn không cho AI cơ hội thất bại, bạn đang tự mình thất bại vì, cuối cùng, nó là thống kê." Ông chỉ ra rằng AI, bất chấp những điểm mạnh của nó, không phải là hoàn hảo. Đó là một công cụ học hỏi từ các mẫu và sẽ luôn có những lúc nó không làm đúng. Thay vì sợ những sai lầm đó, chìa khóa là xây dựng các hệ thống có thể xử lý chúng và tiếp tục cải thiện theo thời gian.

Điều này cũng đúng khi nói đến chính các mô hình thị giác máy tính. Ví dụ: Ultralytics YOLO11, phiên bản mới nhất của các mô hình Ultralytics YOLO, đã được xây dựng có tính đến nhu cầu đưa mọi thứ lên một tầm cao mới so với YOLOv8.

 

__wf_reserved_inherit
Hình 5. Các tác vụ thị giác máy tính được hỗ trợ bởi YOLO11.

Đặc biệt, YOLO11 mang lại hiệu suất tốt hơn, đặc biệt là đối với các ứng dụng thời gian thực, nơi độ chính xác là chìa khóa, như nông nghiệp và chăm sóc sức khỏe. Với các tính năng tiên tiến của mình, YOLO11 đang định nghĩa lại cách các ngành công nghiệp sử dụng AI bằng cách cung cấp những hiểu biết sâu sắc theo thời gian thực và giúp họ giải quyết các thách thức hiệu quả hơn.

Những điều cần nhớ

Bài phát biểu quan trọng của David tại YV24 là một lời nhắc nhở rằng AI không chỉ là một sự đổi mới thú vị - nó là một công cụ mạnh mẽ để giải quyết các vấn đề thực tế và cải thiện cách chúng ta sống và làm việc. Bằng cách tập trung vào hành vi, AI đã tạo ra tác động trong các lĩnh vực như theo dõi sức khỏe động vật và nhận ra các mẫu có ý nghĩa trong các hành động hàng ngày. 

Tiềm năng của AI hành vi rất thú vị và chúng ta chỉ mới bắt đầu. Bằng cách chuyển đổi dữ liệu thô thành thông tin chi tiết hữu ích, AI hành vi chuyển từ giám sát thụ động sang giải quyết vấn đề chủ động. Khi nó phát triển hơn nữa, AI hành vi được thiết lập để thúc đẩy các quyết định thông minh hơn, hợp lý hóa các quy trình và mang lại những cải tiến có ý nghĩa cho cuộc sống của chúng ta.

Luôn kết nối với cộng đồng của chúng tôi để tìm hiểu thêm về AI và các ứng dụng thực tế của nó. Truy cập kho lưu trữ GitHub của chúng tôi để khám phá những đổi mới trong các lĩnh vực như AI trong nông nghiệpthị giác máy tính trong sản xuất.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard