Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Nghiên cứu điển hình: DeepPlastic và YOLOv5

Nhóm Ultralytics

6 phút đọc

Ngày 12 tháng 12 năm 2022

Khám phá cách Ultralytics giải quyết ô nhiễm rác thải nhựa đại dương bằng cách sử dụng AUV và YOLOv5 để phát hiện và làm sạch hiệu quả dưới nước.

Nhựa đang làm ngạt thở động vật hoang dã biển: mỗi phút, hai xe tải nhựa được đổ xuống đại dương của chúng ta, tương đương với hơn 10 triệu tấn mỗi năm. Các nhà khoa học của DeepPlastic tuyên bố rằng nhựa biển này gây ra các mối đe dọa xã hội đối với "môi trường biển, an toàn thực phẩm, sức khỏe con người, du lịch sinh thái và đóng góp vào biến đổi khí hậu".

Để chống lại điều này, nhóm các nhà nghiên cứu và kỹ sư này đã và đang điều tra cách thị giác máy tính có thể loại bỏ nhựa trong đại dương của chúng ta.

Với công nghệ học sâu, các nhà nghiên cứu của DeepPlastic đã phát triển một phương pháp sử dụng các phương tiện tự hành dưới nước (AUV) để quét, xác định và định lượng nhựa nằm ngay bên dưới bề mặt đại dương, nơi ánh sáng vẫn có thể xuyên qua, hoặc lớp Epipelagic.

"Mục tiêu của chúng tôi là có một mô hình rất nhỏ với tốc độ suy luận rất nhanh có thể được sử dụng để phát hiện nhựa."
Jay Lowe, Nhà nghiên cứu Machine Learning

Nhóm DeepPlastic đã huấn luyện hai mô hình nhỏ và chính xác, YOLOv4YOLOv5, cho phép phát hiện đối tượng theo thời gian thực. Các mô hình này được huấn luyện trên bộ dữ liệu DeepTrash, bao gồm:

  • 1900 ảnh huấn luyện, 637 ảnh kiểm thử, 637 ảnh xác thực (chia theo tỷ lệ 60, 20, 20)
  • Ảnh chụp thực tế từ Hồ Tahoe, Vịnh San Francisco và Vịnh Bodega ở CA.
  • Internet images (<20%) taken by scraping Google Images.
  • Hình ảnh biển sâu từ bộ dữ liệu JAMSTEK JEDI

Cách thức hoạt động của Xe tự hành dưới nước (AUV)

AUV là một robot di chuyển dưới nước. Chúng là những phương tiện di chuyển chậm, có thể lướt tự do xuống độ sâu của đại dương và trở lại mặt nước. Một mô hình deep learning phải được cài đặt vào AUV để chúng có thể xác định và thu thập nhựa dưới nước. AUV có thể được triển khai trong ba bước dễ dàng để phát hiện nhựa dưới nước.

1. Cài đặt mô hình Deep Learning vào AUV

2. Quét đại dương

3. Xác định nhựa

Các vấn đề với các mô hình học sâu trước đây & làm sạch đại dương

Nhóm DeepPlastic đã thử nghiệm một số mô hình học sâu như YOLOv4 và Faster R-CNN trên AUV. Tuy nhiên, các nhà nghiên cứu đã gặp phải một loạt các thách thức khiến việc làm sạch đại dương trở nên khó khăn.

Khả năng tiếp cận hạn chế đối với các nhà nghiên cứu đã làm đình trệ đội

Do không có chuyên gia về deep learning trong nhóm, các nhà nghiên cứu đã không thể tận dụng tối đa các mô hình deep learning.

Tốc độ suy luận chậm làm giảm khả năng phát hiện nhựa

Suy luận là tốc độ AUV có thể nhận dạng nhựa. Với YOLOv4 và Faster R-CNN, AUV không hiệu quả trong việc phát hiện nhựa, làm giảm khả năng làm sạch nước của chúng.

Độ chính xác thấp trong nhận dạng đối tượng

YOLOv4 và Faster R-CNN chỉ có tỷ lệ thành công trung bình từ 77%-80% khi xác định nhựa.

Phát hiện kém đã nhầm lẫn san hô với các vật thể nhựa

Khi sử dụng Faster R-CNN, 3-5% san hô được AUV xác định là nhựa, thấp hơn tiêu chuẩn chấp nhận được.

Sức mạnh và độ chính xác cao hơn với YOLOv5

Khi chuyển sang YOLOv5, các nhà nghiên cứu đã thấy một sự thay đổi ngay lập tức. Độ chính xác được tăng cường, tốc độ được tối đa hóa và sự đơn giản của YOLOv5 đã giúp mọi người trong nhóm có thể tiếp cận được.

Tốc độ suy luận nhanh hơn trung bình 20% so với Faster R-CNN

Tỷ lệ chính xác 93%

Chưa đến một giờ để thiết lập YOLOv5

Khả năng tiếp cận tăng lên cho phép các nhà nghiên cứu khai thác tối đa YOLOv5

Có một số khía cạnh của YOLOv5 cho phép nhóm dễ dàng làm việc với nó, dựa trên quy trình từng bước đơn giản mà chúng tôi đã thiết lập trên kho lưu trữ.

  • Việc tải xuống kho lưu trữ rất đơn giản.
  • Tất cả tài liệu đều được tổ chức một cách rõ ràng, dễ theo dõi
  • Đơn giản hóa quá trình huấn luyện mô hình
  • Kiểm tra kết quả thủ công

Tốc độ suy luận cao hơn giúp tối đa hóa hiệu quả làm sạch đại dương

YOLOv5 cho tốc độ suy luận nhanh hơn 20% so với Faster RCNN, xử lý trung bình 1 hình ảnh trong 9 mili giây. Do đó, AUV có thể phát hiện nhựa trôi nổi với tốc độ nhanh hơn, điều này làm tăng lượng nhựa thu được và hiệu quả tổng thể của dự án.

Độ chính xác được nâng cao trong tỷ lệ chính xác

Tỷ lệ chính xác trung bình là 85%, đôi khi lên tới 93%. Đây là một bước nhảy vọt so với mức trung bình 77-80% của các mô hình trước đây.

Các nhà nghiên cứu sử dụng dễ dàng hơn

Việc thiết lập YOLOv5 là một trải nghiệm liền mạch và dễ dàng cho các nhà nghiên cứu. Người dùng được hướng dẫn từ A-Z trong toàn bộ quá trình thiết lập, cho phép nhóm bắt đầu với YOLOv5 trong vòng chưa đầy một giờ.

Tính linh hoạt được cải thiện cho phép các nhà nghiên cứu ứng dụng YOLOv5 vào các môi trường nước khác nhau

Chỉ trong vài ngày, sử dụng một bộ dữ liệu nhỏ gồm 3000 hình ảnh không cần tăng cường, nhóm nghiên cứu đã có thể huấn luyện các AUV hoạt động ở hồ và sông. Mặc dù nước đục và các điều kiện kém khác, các AUV được huấn luyện trên YOLOv5 vẫn có thể phát hiện và xác định nhựa với độ chính xác cao.

"Chúng tôi đang tìm kiếm một thuật toán phát hiện đối tượng có độ chính xác cao và cực kỳ nhanh. Môi trường đại dương mà chúng tôi làm việc rất khắc nghiệt, địa hình gồ ghề. YOLOv5 đã đáp ứng trên mọi phương diện với tư cách là mô hình phát hiện đối tượng tốt nhất mà chúng tôi có thể sử dụng."
"Chúng tôi thích sử dụng YOLOv5 vì nó rất dễ thiết lập và sử dụng, đồng thời nó đã tạo ra những kết quả mà chúng tôi mong muốn một cách nhất quán."
"Đối với bất kỳ mô hình nào trong tương lai mà chúng tôi sẽ triển khai, chúng tôi chắc chắn sẽ xem xét YOLOv5 là lựa chọn đầu tiên."
Gautam Tata, Nhà nghiên cứu Machine Learning

Xem kho lưu trữ DeepPlastic, bài báo đã xuất bảntóm tắt video.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard