Nghiên cứu tình huống: DeepPlastic và YOLOv5

Ngày 12 tháng 12 năm 2022
Khám phá cách Ultralytics giải quyết ô nhiễm nhựa đại dương bằng cách sử dụng AUV và YOLOv5 để phát hiện và dọn dẹp dưới nước hiệu quả.

Ngày 12 tháng 12 năm 2022
Khám phá cách Ultralytics giải quyết ô nhiễm nhựa đại dương bằng cách sử dụng AUV và YOLOv5 để phát hiện và dọn dẹp dưới nước hiệu quả.
Nhựa đang làm ngạt thở động vật hoang dã dưới biển: mỗi phút, hai xe tải nhựa được đổ xuống đại dương của chúng ta, tương đương với hơn 10 triệu tấn mỗi năm. Các nhà khoa học của DeepPlastic tuyên bố rằng loại nhựa biển này gây ra mối đe dọa xã hội đối với "môi trường biển, an toàn thực phẩm, sức khỏe con người, du lịch sinh thái và góp phần vào biến đổi khí hậu".
Để giải quyết vấn đề này, nhóm các nhà nghiên cứu và kỹ sư này đã nghiên cứu cách công nghệ thị giác máy tính có thể loại bỏ nhựa trong đại dương.
Với công nghệ học sâu, các nhà nghiên cứu DeepPlastic đã phát triển một phương pháp sử dụng các phương tiện tự hành dưới nước (AUV) để quét, xác định và định lượng nhựa nằm ngay bên dưới bề mặt đại dương, nơi ánh sáng vẫn có thể xuyên qua, hay còn gọi là lớp Epipelagic.
“Mục tiêu của chúng tôi là có một mô hình rất nhỏ với tốc độ suy luận rất nhanh có thể được sử dụng để phát hiện nhựa.”
Jay Lowe , Nhà nghiên cứu về máy học
Nhóm DeepPlastic đã đào tạo hai mô hình nhỏ và chính xác, YOLOv4 và YOLOv5 , cho phép phát hiện vật thể theo thời gian thực. Các mô hình này được đào tạo trên tập dữ liệu DeepTrash , bao gồm:
AUV là một robot di chuyển dưới nước. Chúng là những phương tiện chậm có thể lướt tự do xuống độ sâu của đại dương và trở lại bề mặt. Một mô hình học sâu phải được cài đặt vào AUV để chúng có thể nhận dạng và thu thập nhựa dưới nước. AUV có thể được triển khai theo ba bước dễ dàng để phát hiện nhựa dưới nước.
1. Cài đặt mô hình học sâu vào AUV
2. Quét đại dương
3. Nhận dạng nhựa
Nhóm DeepPlastic đã thử nghiệm một số mô hình học sâu như YOLOv4 và Faster R-CNN trên AUV. Tuy nhiên, các nhà nghiên cứu đã phải đối mặt với một loạt thách thức khiến việc làm sạch đại dương trở nên khó khăn.
Do không có chuyên gia về học sâu trong nhóm, các nhà nghiên cứu không thể tận dụng tối đa các mô hình học sâu.
Suy luận là tốc độ AUV có thể nhận dạng nhựa. Với YOLOv4 và Faster R-CNN, AUV không hiệu quả trong việc phát hiện nhựa, làm giảm khả năng làm sạch nước của chúng.
YOLOv4 và Faster R-CNN chỉ có tỷ lệ thành công trung bình là 77%-80% khi xác định nhựa.
Khi sử dụng Faster R-CNN, 3-5% san hô được AUV xác định là nhựa, thấp hơn tiêu chuẩn cho phép.
Khi chuyển sang YOLOv5, các nhà nghiên cứu đã thấy sự chuyển đổi ngay lập tức. Độ chính xác được tăng cường, tốc độ được tối đa hóa và tính đơn giản của YOLOv5 giúp mọi người trong nhóm đều có thể tiếp cận.
Tốc độ suy luận nhanh hơn trung bình 20% khi so sánh với R-CNN nhanh hơn
Tỷ lệ chính xác 93%
Ít hơn một giờ để thiết lập YOLOv5
Có một số khía cạnh của YOLOv5 cho phép nhóm dễ dàng làm việc với nó, dựa trên quy trình từng bước đơn giản mà chúng tôi đã thiết lập trên kho lưu trữ.
YOLOv5 cho thấy tốc độ suy luận nhanh hơn 20% so với Faster RCNN, xử lý trung bình 1 hình ảnh trong 9 mili giây. Do đó, AUV có thể phát hiện nhựa trôi nổi với tốc độ nhanh hơn, giúp tăng lượng nhựa thu được và hiệu quả chung của dự án.
Tỷ lệ chính xác ở mức trung bình 85%, đôi khi lên tới 93%. Đây là bước nhảy vọt so với mức trung bình 77-80% ở các mô hình trước đây.
Việc thiết lập YOLOv5 vừa là trải nghiệm liền mạch vừa dễ dàng đối với các nhà nghiên cứu. Người dùng được AZ hướng dẫn trong suốt quá trình thiết lập, cho phép nhóm bắt đầu sử dụng YOLOv5 trong vòng chưa đầy một giờ.
Trong vòng vài ngày, sử dụng một tập dữ liệu nhỏ gồm 3000 hình ảnh mà không cần tăng cường, nhóm đã có thể huấn luyện AUV hoạt động trong hồ và sông. Bất chấp nước đục và các điều kiện kém khác, AUV được huấn luyện trên YOLOv5 vẫn có thể phát hiện và xác định nhựa với độ chính xác cao.
“Chúng tôi đang tìm kiếm một thuật toán phát hiện vật thể có độ chính xác cao và cực kỳ nhanh. Môi trường đại dương mà chúng tôi làm việc là những địa hình khắc nghiệt, gồ ghề. YOLOv5 đã cung cấp trên mọi mặt trận như một mô hình phát hiện vật thể tốt nhất mà chúng tôi có thể sử dụng.
“Chúng tôi thích sử dụng YOLOv5 vì nó rất dễ thiết lập và sử dụng, đồng thời luôn mang lại kết quả mà chúng tôi mong muốn.
“Đối với bất kỳ mô hình nào mà chúng tôi triển khai trong tương lai, chúng tôi chắc chắn sẽ xem YOLOv5 là lựa chọn đầu tiên.”
Gautam Tata , Nhà nghiên cứu máy học
Kiểm tra kho lưu trữ DeepPlastic , bài báo đã xuất bản và tóm tắt video .