Khám phá cách Ultralytics đang giải quyết vấn đề ô nhiễm nhựa đại dương bằng cách sử dụng AUV và YOLOv5 để phát hiện và dọn dẹp dưới nước hiệu quả.

Khám phá cách Ultralytics đang giải quyết vấn đề ô nhiễm nhựa đại dương bằng cách sử dụng AUV và YOLOv5 để phát hiện và dọn dẹp dưới nước hiệu quả.

Nhựa đang làm ngạt thở động vật hoang dã biển: mỗi phút, hai xe tải nhựa được đổ xuống đại dương của chúng ta, tương đương với hơn 10 triệu tấn mỗi năm. Các nhà khoa học của DeepPlastic tuyên bố rằng nhựa biển này gây ra các mối đe dọa xã hội đối với "môi trường biển, an toàn thực phẩm, sức khỏe con người, du lịch sinh thái và đóng góp vào biến đổi khí hậu".
Để chống lại điều này, nhóm các nhà nghiên cứu và kỹ sư này đã và đang điều tra cách thị giác máy tính có thể loại bỏ nhựa trong đại dương của chúng ta.
Với công nghệ học sâu, các nhà nghiên cứu của DeepPlastic đã phát triển một phương pháp sử dụng các phương tiện tự hành dưới nước (AUV) để quét, xác định và định lượng nhựa nằm ngay bên dưới bề mặt đại dương, nơi ánh sáng vẫn có thể xuyên qua, hoặc lớp Epipelagic.
“Mục tiêu của chúng tôi là có một mô hình rất nhỏ với tốc độ suy luận rất nhanh có thể được sử dụng để detect nhựa."
Jay Lowe, Nhà nghiên cứu Machine Learning
Nhóm DeepPlastic đã huấn luyện hai mô hình nhỏ và chính xác, YOLOv4 và YOLOv5 , cho phép phát hiện vật thể theo thời gian thực. Các mô hình này được huấn luyện trên tập dữ liệu DeepTrash , bao gồm:
AUV là một robot di chuyển dưới nước. Chúng là những phương tiện di chuyển chậm, có thể lướt tự do xuống đáy đại dương và trở lại bề mặt. Một mô hình học sâu phải được cài đặt vào AUV để chúng có thể nhận dạng và thu thập nhựa dưới nước. AUV có thể được triển khai theo ba bước đơn giản để detect nhựa dưới nước.
1. Cài đặt mô hình Deep Learning vào AUV
2. Quét đại dương
3. Xác định nhựa
Nhóm DeepPlastic đã thử nghiệm một số mô hình học sâu như YOLOv4 và Faster R-CNN trên AUV. Tuy nhiên, các nhà nghiên cứu đã gặp phải một loạt các thách thức khiến việc làm sạch đại dương trở nên khó khăn.
Do không có chuyên gia về deep learning trong nhóm, các nhà nghiên cứu đã không thể tận dụng tối đa các mô hình deep learning.
Suy luận là tốc độ AUV có thể nhận dạng nhựa. Với YOLOv4 và Faster R-CNN, AUV không hiệu quả trong việc phát hiện nhựa, làm giảm khả năng làm sạch nước của chúng.
YOLOv4 và Faster R-CNN chỉ có tỷ lệ thành công trung bình từ 77%-80% khi xác định nhựa.
Khi sử dụng Faster R-CNN, 3-5% san hô được AUV xác định là nhựa, thấp hơn tiêu chuẩn chấp nhận được.
Khi chuyển sang YOLOv5 , các nhà nghiên cứu đã thấy sự chuyển đổi ngay lập tức. Độ chính xác được tăng cường, tốc độ được tối đa hóa và tính đơn giản của YOLOv5 làm cho mọi người trong nhóm đều có thể tiếp cận được.
Tốc độ suy luận nhanh hơn trung bình 20% so với Faster R-CNN
Tỷ lệ chính xác 93%
Ít hơn một giờ để thiết lập YOLOv5
Có một số khía cạnh của YOLOv5 cho phép nhóm dễ dàng làm việc với nó, dựa trên quy trình từng bước đơn giản mà chúng tôi đã thiết lập trên kho lưu trữ.
YOLOv5 cho thấy tốc độ suy luận nhanh hơn 20% so với Faster RCNN, xử lý trung bình 1 hình ảnh trong 9 mili giây. Kết quả là, AUV có thể detect làm nhựa nổi với tốc độ nhanh hơn, giúp tăng lượng nhựa thu được và hiệu quả chung của dự án.
Tỷ lệ chính xác trung bình là 85%, đôi khi lên tới 93%. Đây là một bước nhảy vọt so với mức trung bình 77-80% của các mô hình trước đây.
Thiết lập YOLOv5 là một trải nghiệm liền mạch và dễ dàng cho các nhà nghiên cứu. Người dùng được AZ hướng dẫn trong suốt quá trình thiết lập, cho phép nhóm bắt đầu với YOLOv5 trong vòng chưa đầy một giờ.
Chỉ trong vài ngày, sử dụng một bộ dữ liệu nhỏ gồm 3000 hình ảnh mà không cần tăng cường, nhóm đã có thể huấn luyện các AUV hoạt động trong hồ và sông. Bất chấp nước đục và các điều kiện khắc nghiệt khác, các AUV đã được huấn luyện trên YOLOv5 vẫn có thể detect và xác định nhựa với độ chính xác cao.
“Chúng tôi đang tìm kiếm một thuật toán phát hiện vật thể có độ chính xác cao và tốc độ cực nhanh. Môi trường đại dương nơi chúng tôi làm việc rất khắc nghiệt, địa hình gồ ghề. YOLOv5 được cung cấp trên mọi mặt trận như mô hình phát hiện đối tượng tốt nhất mà chúng tôi có thể sử dụng.
“Chúng tôi thích sử dụng YOLOv5 vì nó rất dễ thiết lập và sử dụng, và nó luôn mang lại kết quả mà chúng tôi mong muốn.
“Đối với bất kỳ mô hình tương lai nào mà chúng tôi sẽ triển khai, chúng tôi sẽ xem xét YOLOv5 là sự lựa chọn đầu tiên của chúng tôi mà không có chút nghi ngờ nào.”
Gautam Tata, Nhà nghiên cứu Machine Learning
Xem kho lưu trữ DeepPlastic, bài báo đã xuất bản và tóm tắt video.