Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay

SharkEye sử dụng Ultralytics YOLOv8 để phát hiện đối tượng

Abirami Vina

5 phút đọc

Ngày 28 tháng 1, 2025

Hiểu cách SharkEye được trình bày tại YOLO Tầm nhìn 2024, đòn bẩy Ultralytics YOLOv8 để phát hiện vật thể theo thời gian thực và đảm bảo an toàn bãi biển.

Việc theo dõi động vật trong môi trường sống tự nhiên của chúng, cho dù đó là gia súc gặm cỏ trên trang trại hay cá mập di chuyển gần bờ biển, luôn rất quan trọng đối với sự an toàn và hạnh phúc của chúng. Tuy nhiên, việc quan sát chúng thủ công không hề dễ dàng. Nó thường đòi hỏi hàng giờ kiên nhẫn và tập trung cẩn thận, vì người quan sát phải theo dõi chặt chẽ mọi thay đổi trong hành vi hoặc chuyển động. Ngay cả khi đó, rất dễ bỏ lỡ những dấu hiệu tinh tế nhưng quan trọng.

Nhờ sự can thiệp của trí tuệ nhân tạo (AI), quá trình này đang trở nên nhanh hơn, thông minh hơn và hiệu quả hơn rất nhiều, giảm bớt gánh nặng cho người quan sát đồng thời cải thiện độ chính xác. Đặc biệt, thị giác máy tính có thể được sử dụng để track động vật, phát hiện nguy hiểm và đưa ra quyết định theo thời gian thực. Những nhiệm vụ trước đây mất hàng giờ đồng hồ giờ đây có thể được thực hiện trong vài phút, mở ra những cách mới để hiểu hành vi động vật.

Tại YOLO Tầm nhìn 2024 (YV24), một sự kiện kết hợp thường niên do Ultralytics Các chuyên gia và nhà đổi mới đã tập trung để khám phá cách AI giải quyết những thách thức hàng ngày. Một số chủ đề được giới thiệu bao gồm những tiến bộ trong phát hiện vật thể và giám sát động vật theo thời gian thực, chứng minh cách AI đang nâng cao tính an toàn và hiệu quả trong nhiều lĩnh vực.

Một trong những điểm nhấn của sự kiện là bài phát biểu của Jim Griffin, Nhà sáng lập AI Master Group, nơi ông trình bày cách Vision AI giúp các bãi biển an toàn hơn bằng cách phát hiện cá mập trước khi chúng đến quá gần bờ. Ông giải thích cách họ sử dụng Ultralytics YOLOv8 , một mô hình thị giác máy tính tiên tiến, để nhận dạng chính xác cá mập theo thời gian thực, ngay cả trong những điều kiện khó khăn như sóng dữ, ánh sáng chói và chướng ngại vật dưới nước.

Trong bài viết này, chúng ta sẽ xem xét kỹ hơn về dự án SharkEye và chia sẻ những thông tin chi tiết thú vị từ buổi nói chuyện của Jim.

Tìm hiểu về SharkEye: Một ứng dụng thị giác máy tính

Jim bắt đầu bài nói chuyện bằng cách giới thiệu bãi biển Padaro, một điểm đến lướt sóng nổi tiếng ở California, nơi người lướt sóng và cá mập thường cùng chia sẻ một vùng nước. Nhấn mạnh thách thức thực sự trong việc phát hiện cá mập, ông chia sẻ: “Tất nhiên, rất dễ dàng để detect một con cá mập nếu nó cắn bạn, vì vậy điều chúng tôi muốn làm là xác định những con cá mập trước.”

__wf_reserved_inherit
Hình 1. Jim trên sân khấu tại YOLO Tầm nhìn 2024.

SharkEye được tạo ra để giải quyết vấn đề này, với sự hỗ trợ từ Đại học California, Santa Barbara. Jim mô tả cách máy bay không người lái với camera AI độ phân giải cao được sử dụng để bay khoảng 200 feet trên mặt nước, quét đại dương trong thời gian thực.

Nếu phát hiện thấy cá mập, tin nhắn SMS sẽ được gửi đến khoảng 80 người, bao gồm nhân viên cứu hộ, chủ cửa hàng lướt sóng và bất kỳ ai đã đăng ký nhận thông tin cập nhật. Jim chỉ ra cách những thông báo tức thời này cho phép phản ứng nhanh chóng, giúp người đi biển an toàn hơn khi có cá mập ở gần bờ.

Jim cũng đề cập rằng SharkEye có một bảng điều khiển trực tiếp, nơi người dùng có thể xem số liệu thống kê phát hiện cá mập. Ví dụ: trong hơn 12 tuần, hệ thống đã xác định được hai con cá mập lớn và 15 con nhỏ hơn, trung bình hơn một con cá mập mỗi tuần.

Sau đó, ông giới thiệu Neil Nathan, nhà khoa học dẫn đầu các nỗ lực đằng sau SharkEye. Mặc dù có nền tảng về nghiên cứu môi trường hơn là khoa học máy tính, Nathan đã dẫn đầu thành công dự án. Jim nhấn mạnh cách các công cụ AI hiện đại, như những công cụ được sử dụng trong SharkEye, được thiết kế để dễ tiếp cận, cho phép các cá nhân từ các nền tảng phi kỹ thuật phát triển các giải pháp có tác động.

Sử dụng Ultralytics YOLOv8 ĐẾN detect cá mập

Đi sâu hơn vào chi tiết, Jim đã giải thích chi tiết về những gì ẩn chứa bên trong SharkEye và giải pháp phát hiện cá mập không chỉ đơn thuần là một nhiệm vụ phát hiện vật thể . Nó còn phải xử lý các điều kiện động, khó lường như rong biển trôi nổi, dễ bị nhầm lẫn với cá mập. Không giống như việc phát hiện một vật thể cố định, việc xác định cá mập đòi hỏi độ chính xác và khả năng thích ứng, khiến YOLOv8 một sự lựa chọn lý tưởng.

Một lợi thế khác của YOLOv8 là nó có thể được triển khai trên máy bay không người lái mà không cần dựa vào máy chủ đám mây. Jim giải thích cách tiếp cận này giúp SharkEye có thể gửi cảnh báo ngay lập tức - một phần thiết yếu để đảm bảo phản ứng kịp thời trong điều kiện đại dương khó lường.

Phát hiện đối tượng chỉ với sáu dòng code

Sau khi nêu bật cách SharkEye hoạt động và nỗ lực hợp tác đằng sau nó, Jim đã trình bày một bản demo trực tiếp.

Jim Griffin bắt đầu bản demo trực tiếp của mình bằng cách hướng dẫn khán giả qua một ví dụ quen thuộc - đoạn mã "hello world" cho các mô hình YOLO Ultralytics . Chỉ với sáu dòng Python mã, anh ấy đã trình bày cách một mã được đào tạo trước Ultralytics YOLOv8 mô hình có thể dễ dàng detect một chiếc xe buýt trong hình ảnh. 

__wf_reserved_inherit
Hình 2. Bản demo của Jim tại YOLO Tầm nhìn 2024.

Bản demo của anh ấy đã sử dụng YOLOv8 Mô hình Nano, phiên bản gọn nhẹ dành cho các thiết bị công suất thấp như máy bay không người lái. Mô hình tương tự đã được sử dụng trong SharkEye để phát hiện cá mập theo thời gian thực. 

Để cung cấp thêm ngữ cảnh, Jim đã đề cập rằng mô hình trong bản demo đang được đào tạo về COCO128 , một tập hợp con nhỏ hơn của tập dữ liệu COCO được sử dụng rộng rãi. COCO tập dữ liệu chứa hơn 20.000 hình ảnh trên 80 danh mục đối tượng khác nhau. Trong khi COCO128 hoạt động tốt cho các cuộc trình diễn nhanh, ông chỉ ra rằng SharkEye cần thứ gì đó mạnh mẽ hơn - một tập dữ liệu phát hiện cá mập dành riêng cho ứng dụng có thể xử lý được sự phức tạp của các tình huống thực tế.

Đào tạo tùy chỉnh YOLOv8 cho SharkEye 

Theo Jim, phần khó nhất của dự án SharkEye không phải là huấn luyện mô hình AI mà là thu thập đúng dữ liệu. Ông nhận xét: “Công việc chính của dự án này không phải là AI. Công việc chính của dự án này là bay những chiếc máy bay không người lái đó trong năm năm, loại bỏ hình ảnh khỏi những video đó và gắn thẻ chúng một cách thích hợp.”

Ông mô tả cách nhóm đã thu thập 15.000 hình ảnh tại Bãi biển Padaro. Mỗi hình ảnh phải được gắn nhãn thủ công để phân biệt giữa cá mập, rong biển và các vật thể khác trong nước. Mặc dù quá trình này diễn ra chậm và đòi hỏi khắt khe, nhưng nó đã đặt nền móng cho mọi thứ sau đó.

__wf_reserved_inherit
Hình 3. Sử dụng máy bay không người lái để chụp ảnh cá mập để phát hiện đối tượng theo thời gian thực.

Khi tập dữ liệu đã sẵn sàng, Ultralytics YOLOV8 đã được đào tạo riêng về nó. Jim nói, "Phần đào tạo thực tế không phải là phần khó - chỉ mất 20 giờ trên GPU T4 [Bộ xử lý đồ họa]." Ông cũng nói thêm rằng thời gian có thể được rút ngắn chỉ còn năm giờ với phần cứng mạnh hơn, chẳng hạn như GPU A100.

Đánh giá SharkEye: Độ chính xác hơn độ phủ

Sau đó, Jim đã thảo luận về cách đánh giá hiệu suất của SharkEye. Ông minh họa rằng thước đo chính là độ chính xác - hệ thống xác định cá mập thực tế chính xác như thế nào. Với việc SharkEye đạt được độ chính xác ấn tượng 92%, mô hình này đã chứng tỏ hiệu quả cao trong việc xác định chính xác cá mập giữa môi trường đại dương phức tạp.

Đi sâu hơn vào tầm quan trọng của độ chính xác, Jim đã làm rõ lý do tại sao độ chính xác lại quan trọng hơn độ thu hồi trong trường hợp này. Ông giải thích: “Thông thường, mọi người quan tâm đến độ thu hồi, đặc biệt là trong các lĩnh vực như chăm sóc sức khỏe, nơi việc bỏ sót một ca dương tính có thể gây hậu quả nghiêm trọng. Nhưng trong trường hợp này, chúng tôi không biết có bao nhiêu con cá mập ở ngoài đó, vì vậy điều chúng tôi quan tâm là độ chính xác”. SharkEye đảm bảo rằng các báo động sai được giảm thiểu bằng cách tập trung vào độ chính xác, giúp nhân viên cứu hộ và những người ứng cứu khác hành động nhanh chóng hơn.

__wf_reserved_inherit
Hình 4. Jim giới thiệu SharkEye tại YOLO Tầm nhìn 2024.

Ông kết thúc bài nói chuyện của mình bằng cách so sánh AI với hiệu suất của con người, lưu ý rằng độ chính xác 92% của SharkEye vượt xa độ chính xác 60% của các chuyên gia là con người. Ông nhấn mạnh sự khác biệt này, nói rằng, “Đó là vì chúng ta là con người. Cho dù bạn hay tôi có là chuyên gia đến đâu, nếu chúng ta phải ngồi trước màn hình cả ngày để tìm kiếm cá mập, cuối cùng, tâm trí của chúng ta cũng sẽ xao nhãng.” Không giống như con người, các mô hình AI không mệt mỏi hoặc mất tập trung, khiến nó trở thành một giải pháp đáng tin cậy cho các tác vụ đòi hỏi giám sát liên tục.

Ultralytics YOLO11 : Mới nhất YOLO

Một câu trích dẫn thú vị từ bài phát biểu của Jim Griffin, "Sáu dòng mã có thể cứu sống bạn một ngày nào đó", đã mô tả một cách hoàn hảo mức độ tiên tiến nhưng dễ tiếp cận của AI. Ultralytics YOLO Các mô hình đã được tạo ra với mục tiêu này, giúp công nghệ thị giác máy tính tiên tiến dễ tiếp cận với các nhà phát triển và doanh nghiệp ở mọi quy mô. Ultralytics YOLO11 được xây dựng dựa trên điều này với tốc độ suy luận nhanh hơn và độ chính xác cao hơn. 

Đây là một cái nhìn nhanh về những gì thiết lập YOLO11 riêng biệt:

  • Kiến trúc được thiết kế lại: Kiến trúc backbone và neck được tăng cường của nó cho phép trích xuất đặc trưng tốt hơn và cải thiện độ chính xác.
  • Dễ sử dụng : Có thể truy cập thông qua Python các công cụ mã hóa hoặc không cần mã hóa như Ultralytics TRUNG TÂM.
  • Tính linh hoạt trong các nhiệm vụ : YOLO11 hỗ trợ các tác vụ thị giác máy tính như phát hiện đối tượng, phân đoạn trường hợp, phân loại hình ảnh, theo dõi, ước tính tư thế và hộp giới hạn định hướng (OBB).
  • Độ chính xác được cải thiện : YOLO11 đạt được độ chính xác trung bình cao hơn 22% ( mAP ) so với YOLOv8m trên COCO tập dữ liệu, cung cấp khả năng phát hiện chính xác hơn.

Những tính năng này làm cho YOLO11 rất phù hợp để theo dõi hành vi động vật trong môi trường năng động, dù ở trang trại hay ngoài tự nhiên.

Những điều cần nhớ

Những tiến bộ trong Trí tuệ nhân tạo thị giác (Vision AI) đang giúp giải quyết các thách thức trong thế giới thực dễ dàng hơn bằng cách cung cấp các công cụ thiết thực cho nhiều lĩnh vực khác nhau. Ví dụ, các mô hình thị giác máy tính như YOLO11 có thể được sử dụng để theo dõi và giám sát động vật theo thời gian thực, ngay cả trong điều kiện khắc nghiệt. 

Bài phát biểu quan trọng của Jim Griffin tại YV24 đã minh họa cách YOLOv8 có thể được sử dụng để giải quyết các vấn đề phức tạp với lượng mã hóa tối thiểu. Dự án SharkEye, kết hợp máy bay không người lái với AI để phát hiện cá mập theo thời gian thực, đã chứng minh công nghệ có thể cải thiện an toàn bãi biển như thế nào. 

Đó là một nghiên cứu điển hình hấp dẫn về cách AI dễ tiếp cận trao quyền cho mọi người từ các nền tảng khác nhau để tạo ra các giải pháp hiệu quả. Khi AI tiếp tục phát triển, nó đang chuyển đổi các ngành công nghiệp và giúp các cá nhân có thể khai thác tiềm năng của nó để làm cho thế giới trở nên an toàn hơn, thông minh hơn và hiệu quả hơn.

Hãy trở thành một phần của cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu sâu hơn về AI. Từ thị giác máy tính trong nông nghiệp đến AI trong xe tự lái, hãy xem những công nghệ này đang thúc đẩy sự đổi mới như thế nào. Kiểm tra các tùy chọn cấp phép của chúng tôi để bắt đầu các dự án AI của bạn ngay hôm nay!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí