Hãy cùng chúng tôi xem lại David Scott YOLO Bài phát biểu quan trọng tại Vision 2024 về phân tích hành vi dựa trên AI và các ứng dụng thực tế của nó trong các lĩnh vực như chăn nuôi.
Hãy cùng chúng tôi xem lại David Scott YOLO Bài phát biểu quan trọng tại Vision 2024 về phân tích hành vi dựa trên AI và các ứng dụng thực tế của nó trong các lĩnh vực như chăn nuôi.
Trong nhiều năm, những đổi mới về thị giác máy tính đã tập trung vào các tác vụ như phát hiện đối tượng - xác định các đối tượng như chó hoặc ô tô trong hình ảnh và video. Các phương pháp này đã cho phép các ứng dụng trong các lĩnh vực như xe tự hành, sản xuất và chăm sóc sức khỏe.
Tuy nhiên, các tác vụ này thường chỉ tập trung vào việc xác định một đối tượng là gì. Điều gì sẽ xảy ra nếu các hệ thống Vision AI có thể tiến thêm một bước nữa? Ví dụ: thay vì chỉ đơn giản là phát hiện một con chó, giả sử nó có thể hiểu rằng con chó đang đuổi theo một quả bóng hoặc một chiếc xe đang phanh gấp vì có người đi bộ đang băng qua đường. Sự thay đổi từ nhận dạng cơ bản sang hiểu biết theo ngữ cảnh này thể hiện một sự thay đổi lớn hướng tới AI hành vi thông minh hơn, nhận biết ngữ cảnh.
Tại YOLO Vision 2024 (YV24) , Ultralytics 'sự kiện kết hợp thường niên tôn vinh những tiến bộ trong Vision AI , khái niệm phân tích hành vi do AI thúc đẩy đã trở thành tâm điểm trong bài phát biểu thú vị của David Scott , Giám đốc điều hành của The Main Branch.
Trong bài nói chuyện của mình, David đã khám phá quá trình chuyển đổi từ các tác vụ thị giác máy tính cơ bản sang theo dõi hành vi. Với hơn 25 năm kinh nghiệm xây dựng các ứng dụng công nghệ tiên tiến, ông đã giới thiệu tác động của bước nhảy vọt này. Ông nhấn mạnh cách giải mã các mẫu và hành vi đang định hình lại các ngành công nghiệp như nông nghiệp và phúc lợi động vật.
Trong bài viết này, chúng ta sẽ điểm qua những điểm nổi bật trong bài nói chuyện của David và khám phá cách theo dõi hành vi làm cho AI trở nên thiết thực hơn.
David Scott bắt đầu bài phát biểu quan trọng của mình bằng một lời nhắc nhở thực tế táo bạo và nói, "Một đồng nghiệp của tôi thường nói, 'Khoa học không bán được', điều này có phần xúc phạm nhiều người trong chúng ta ở đây vì chúng ta thực sự thích khoa học. AI thực sự rất tuyệt - tại sao mọi người không mua nó? Nhưng thực tế là, mọi người không muốn mua nó chỉ vì chúng ta nghĩ nó tuyệt vời; họ cần một lý do để mua nó."
Ông tiếp tục giải thích rằng tại công ty của mình, The Main Branch, trọng tâm luôn là giải quyết các vấn đề thực tế bằng AI, chứ không chỉ thể hiện khả năng của nó. Rất nhiều khách hàng đến và muốn nói về cách họ có thể sử dụng AI nói chung, nhưng ông thấy đó là một cách tiếp cận lạc hậu - giống như có một giải pháp mà không có vấn đề. Thay vào đó, họ làm việc với những khách hàng mang đến những thách thức cụ thể để họ có thể tạo ra các giải pháp AI thực sự tạo ra sự khác biệt.

David cũng chia sẻ rằng công việc của họ thường vượt ra ngoài việc chỉ nhận dạng các đối tượng trong một cảnh. Xác định những gì có ở đó chỉ là bước đầu tiên. Giá trị thực sự đến từ việc tìm ra phải làm gì với thông tin đó và làm cho nó hữu ích trong chuỗi giá trị lớn hơn.
Một bước quan trọng để làm cho AI thực sự hữu ích là vượt ra ngoài các tác vụ thị giác máy tính cơ bản như phát hiện đối tượng và sử dụng những hiểu biết đó để theo dõi hành vi. David nhấn mạnh rằng AI hành vi tập trung vào việc hiểu các hành động và mô hình, không chỉ xác định các đối tượng. Điều này làm cho AI có khả năng nhận ra các sự kiện có ý nghĩa và cung cấp những hiểu biết sâu sắc có thể hành động.
Ông đưa ra ví dụ về việc một con vật lăn lộn trên sàn nhà, điều này có thể báo hiệu bệnh tật. Mặc dù con người không thể theo dõi một con vật suốt ngày đêm, nhưng các hệ thống giám sát do AI điều khiển với khả năng theo dõi hành vi thì có thể. Các giải pháp như vậy có thể theo dõi các vật thể liên tục, detect hành vi cụ thể, gửi cảnh báo và cho phép hành động kịp thời. Điều này biến dữ liệu thô thành thứ gì đó thiết thực và có giá trị.
David cũng cho thấy rằng cách tiếp cận này làm cho AI không chỉ thú vị mà còn thực sự có tác động. Bằng cách giải quyết các vấn đề thực tế, như giám sát hành vi và hành động dựa trên chúng, theo dõi hành vi có thể trở thành một phần quan trọng của các giải pháp AI hiệu quả trong nhiều ngành công nghiệp khác nhau.
Sau đó, David Scott đã minh họa cách Ultralytics YOLOv8 , một mô hình thị giác máy tính, là một bước đột phá cho các dự án theo dõi hành vi của nhóm ông. Nó cung cấp cho họ một nền tảng vững chắc để phát hiện, phân loại và theo dõi các đối tượng. Nhóm của ông cũng đã tiến thêm một bước nữa và đào tạo riêng YOLOv8 để tập trung vào việc theo dõi hành vi theo thời gian, giúp nó trở nên thiết thực và hữu ích hơn cho các tình huống thực tế.
Điều thú vị là với sự ra mắt của Ultralytics YOLO11 , các giải pháp như giải pháp do The Main Branch tạo ra có thể trở nên đáng tin cậy và chính xác hơn nữa. Mẫu máy mới nhất này sở hữu các tính năng như độ chính xác được cải thiện và xử lý nhanh hơn, giúp nâng cao khả năng track hành vi. Chúng ta sẽ thảo luận chi tiết hơn về vấn đề này sau khi hiểu rõ hơn về các ứng dụng mà AI hành vi có thể được sử dụng.
Tiếp theo, hãy khám phá các giải pháp mà David đã nói đến và cách công nghệ theo dõi hành vi đang được sử dụng trong các ứng dụng thực tế để giải quyết các thách thức hàng ngày và tạo ra tác động có ý nghĩa.
Đầu tiên, David chia sẻ một thử thách thú vị mà họ đã giải quyết với dự án mang tên HerdSense, bao gồm việc theo dõi sức khỏe của hàng ngàn con bò trong một bãi chăn nuôi lớn. Mục tiêu là track Hành vi của từng con bò để xác định các vấn đề sức khỏe tiềm ẩn. Điều này đồng nghĩa với việc phải theo dõi hàng chục nghìn con cùng một lúc, và đó không phải là một nhiệm vụ đơn giản.

Để bắt đầu giải quyết vấn đề xác định từng con bò và theo dõi hành vi của nó, nhóm của David đã tiến hành một hội thảo kéo dài hai ngày để phác thảo mọi hành vi có thể mà họ cần theo dõi. Họ đã xác định được tổng cộng hơn 200 hành vi.
Mỗi một trong số 200 hành vi đều phụ thuộc vào khả năng nhận dạng chính xác từng con bò riêng lẻ, vì tất cả dữ liệu phải được liên kết với các con vật cụ thể. Một mối quan tâm lớn là theo dõi bò khi chúng tụ tập thành đàn, điều này gây khó khăn cho việc nhìn thấy từng con vật riêng lẻ.
Nhóm của David đã phát triển một hệ thống thị giác máy tính để đảm bảo mỗi con bò được xác định nhất quán, ngay cả trong những tình huống khó khăn. Họ đã có thể xác nhận rằng cùng một con bò sẽ luôn được gán cùng một ID, ngay cả khi nó biến mất khỏi tầm nhìn, lẫn vào những con khác hoặc xuất hiện lại sau đó.
Tiếp tục, David giới thiệu một dự án thú vị khác, trong đó họ áp dụng các kỹ thuật theo dõi hành vi tương tự để giám sát ngựa. Trong dự án này, nhóm của David không cần track mã định danh của từng con ngựa một cách chặt chẽ như với bò. Thay vào đó, họ tập trung vào các hành vi cụ thể và theo dõi các chi tiết như thói quen ăn uống và mức độ hoạt động chung để phát hiện sớm bất kỳ vấn đề sức khỏe nào. Việc xác định những thay đổi nhỏ trong hành vi có thể dẫn đến các biện pháp can thiệp nhanh hơn, giúp chăm sóc tốt hơn và ngăn ngừa các vấn đề trước khi chúng trở nên nghiêm trọng.

David cũng thảo luận về sự phức tạp của việc theo dõi hành vi thông qua một ví dụ thú vị. Trong quá trình nghiên cứu các phương pháp cải thiện phân tích hành vi, nhóm của anh tình cờ gặp một công ty tuyên bố có thể detect hành vi trộm cắp vặt bằng cách phân tích các tư thế cụ thể, chẳng hạn như ai đó đút tay vào túi quần. Ban đầu, ý tưởng này có vẻ thông minh - một số chuyển động nhất định có thể gợi ý hành vi đáng ngờ, phải không?

Tuy nhiên, khi David tìm hiểu sâu hơn, anh nhận ra những hạn chế của phương pháp này. Một tư thế duy nhất, chẳng hạn như tay trong túi, không nhất thiết có nghĩa là ai đó đang ăn cắp ở cửa hàng. Nó có thể chỉ ra rằng họ đang thư giãn, suy nghĩ hoặc thậm chí bị lạnh. Vấn đề với việc tập trung vào các tư thế riêng lẻ là nó bỏ qua bối cảnh lớn hơn. Hành vi không chỉ là một hành động duy nhất - nó là một chuỗi các hành động theo thời gian, được định hình bởi bối cảnh và ý định.
David nhấn mạnh rằng việc theo dõi hành vi thực sự phức tạp hơn nhiều và đòi hỏi một cách tiếp cận toàn diện. Đó là về việc phân tích các chuỗi hành động và hiểu ý nghĩa của chúng trong bức tranh rộng lớn hơn. Mặc dù ngành công nghiệp AI đang có những bước tiến, nhưng ông lưu ý rằng vẫn còn nhiều việc phải làm trong việc thúc đẩy theo dõi hành vi để cung cấp những hiểu biết sâu sắc có ý nghĩa và chính xác.
Sau đó, David đã đưa khán giả vào hậu trường để cho họ thấy nhóm của anh đã xây dựng giải pháp thị giác máy tính để theo dõi sức khỏe của bò với sự trợ giúp của YOLOv8 và khả năng ước lượng tư thế của nó.
Họ bắt đầu bằng cách tạo một tập dữ liệu tùy chỉnh để ước tính tư thế của một con bò, tăng số lượng điểm chính tiêu chuẩn từ 17 lên 145 để làm cho mô hình tốt hơn trong việc phân tích chuyển động. Sau đó, mô hình đã được đào tạo trên một tập dữ liệu khổng lồ gồm hơn 2 triệu hình ảnh và 110 triệu ví dụ về hành vi.
Nhờ sử dụng cơ sở hạ tầng phần cứng tiên tiến, nhóm của David đã có thể huấn luyện mô hình chỉ trong hai ngày thay vì mất hàng tuần như trên phần cứng thông thường. Mô hình đã được huấn luyện sau đó được tích hợp với một trình theo dõi hành vi tùy chỉnh, có khả năng phân tích nhiều khung hình video cùng lúc để detect các mô hình trong hành động của bò.
Kết quả là một giải pháp tầm nhìn do AI thúc đẩy có thể detect Và track Tám hành vi khác nhau của bò như ăn, uống và nằm để phát hiện những thay đổi nhỏ về hành vi có thể báo hiệu các vấn đề sức khỏe. Điều này cho phép người chăn nuôi hành động nhanh chóng và cải thiện việc quản lý đàn.
David kết thúc bài nói chuyện của mình bằng cách chia sẻ một bài học quan trọng với khán giả: "Nếu bạn không cho AI cơ hội thất bại, bạn đang tự mình thất bại vì, cuối cùng, nó là thống kê." Ông chỉ ra rằng AI, bất chấp những điểm mạnh của nó, không phải là hoàn hảo. Đó là một công cụ học hỏi từ các mẫu và sẽ luôn có những lúc nó không làm đúng. Thay vì sợ những sai lầm đó, chìa khóa là xây dựng các hệ thống có thể xử lý chúng và tiếp tục cải thiện theo thời gian.
Điều này cũng đúng khi nói đến các mô hình thị giác máy tính . Ví dụ, Ultralytics YOLO11 , phiên bản mới nhất của Ultralytics YOLO các mô hình, đã được xây dựng có tính đến nhu cầu đưa mọi thứ lên một tầm cao mới so với YOLOv8 .

Đặc biệt, YOLO11 mang lại hiệu suất tốt hơn, đặc biệt là đối với các ứng dụng thời gian thực đòi hỏi độ chính xác cao, như nông nghiệp và chăm sóc sức khỏe. Với các tính năng tiên tiến, YOLO11 đang định nghĩa lại cách các ngành công nghiệp sử dụng AI bằng cách cung cấp những hiểu biết sáng tạo theo thời gian thực và giúp họ giải quyết các thách thức hiệu quả hơn.
Bài phát biểu quan trọng của David tại YV24 là một lời nhắc nhở rằng AI không chỉ là một sự đổi mới thú vị - nó là một công cụ mạnh mẽ để giải quyết các vấn đề thực tế và cải thiện cách chúng ta sống và làm việc. Bằng cách tập trung vào hành vi, AI đã tạo ra tác động trong các lĩnh vực như theo dõi sức khỏe động vật và nhận ra các mẫu có ý nghĩa trong các hành động hàng ngày.
Tiềm năng của AI hành vi rất thú vị và chúng ta chỉ mới bắt đầu. Bằng cách chuyển đổi dữ liệu thô thành thông tin chi tiết hữu ích, AI hành vi chuyển từ giám sát thụ động sang giải quyết vấn đề chủ động. Khi nó phát triển hơn nữa, AI hành vi được thiết lập để thúc đẩy các quyết định thông minh hơn, hợp lý hóa các quy trình và mang lại những cải tiến có ý nghĩa cho cuộc sống của chúng ta.
Luôn kết nối với cộng đồng của chúng tôi để tìm hiểu thêm về AI và các ứng dụng thực tế của nó. Truy cập kho lưu trữ GitHub của chúng tôi để khám phá những đổi mới trong các lĩnh vực như AI trong nông nghiệp và thị giác máy tính trong sản xuất.