Đơn giản hóa quy trình phân loại với Ultralytics YOLOv5 v6.2
Khám phá bản phát hành YOLOv5 v6.2 mới với các mô hình phân loại, tích hợp ClearML, điểm chuẩn GPU, khả năng tái lập đào tạo và hơn thế nữa.

YOLOv5 đang nâng tầm công nghệ nhận diện vật thể lên những đỉnh cao mới! Từ các model phân loại mới, khả năng tái lập quy trình huấn luyện, hỗ trợ Apple Metal Performance Shader (MPS), cho đến khả năng tích hợp với ClearML và Deci, chúng tôi trân trọng giới thiệu bản phát hành YOLOv5 v6.2 mới.
Link to this sectionCác bản cập nhật quan trọng của YOLOv5#
Chúng tôi đã liên tục cải tiến kiến trúc Vision AI YOLO yêu thích của bạn kể từ bản phát hành mới nhất vào tháng 2 năm 2022. Dưới đây là những cập nhật quan trọng nhất trong YOLOv5 v6.2 mới nhất:
- Model phân loại: Các model phân loại YOLOv5-cls đã được pre-train trên ImageNet hiện đã có sẵn lần đầu tiên.
- Logging với ClearML: Tích hợp với trình theo dõi thí nghiệm mã nguồn mở ClearML. Cài đặt bằng pip install clearml sẽ kích hoạt tính năng tích hợp và cho phép người dùng theo dõi mọi lần chạy huấn luyện trong ClearML. Điều này giúp người dùng theo dõi, so sánh các lần chạy và thậm chí lập lịch chạy từ xa.
- Benchmark xuất GPU: Benchmark (mAP và tốc độ) cho tất cả các định dạng xuất của YOLOv5 bằng cách sử dụng python utils/benchmarks.py --weights yolov5s.pt --device 0 cho các benchmark GPU hoặc --device CPU cho benchmark CPU.
- Khả năng tái lập huấn luyện: Huấn luyện YOLOv5 trên đơn GPU với torch>=1.12.0 hiện có khả năng tái lập hoàn toàn, và một tham số --seed mới có thể được sử dụng (seed mặc định=0).
- Hỗ trợ Apple Metal Performance Shader (MPS): Hỗ trợ MPS cho các thiết bị Apple M1/M2 với --device mps (chức năng đầy đủ đang chờ các bản cập nhật torch trong pytorch/pytorch#77764).

Link to this sectionCác model phân loại mới#
Mục tiêu chính của chúng tôi với bản phát hành này là giới thiệu các quy trình phân loại YOLOv5 đơn giản, tương tự như các model nhận diện vật thể hiện có. Các model YOLOv5-cls v6.2 mới chỉ là bước khởi đầu, chúng tôi sẽ tiếp tục cải thiện chúng trong tương lai cùng với các model nhận diện hiện có. Chúng tôi rất mong nhận được đóng góp của bạn cho nỗ lực này!
Bản phát hành này tích hợp 401 PR từ 41 cộng tác viên kể từ lần phát hành trước vào tháng 2 năm 2022. Nó bổ sung quy trình Phân loại bao gồm huấn luyện, kiểm thử, dự đoán và xuất (ra tất cả 11 định dạng), đồng thời cung cấp các model YOLOv5m-cls, ResNet (18, 34, 50, 101) và EfficientNet (b0-b3) đã được pre-train trên ImageNet.
Chúng tôi đã huấn luyện các model phân loại YOLOv5-cls trên ImageNet trong 90 epoch sử dụng instance 4xA100, đồng thời huấn luyện các model ResNet và EfficientNet với cùng các thiết lập huấn luyện mặc định để so sánh. Chúng tôi đã xuất tất cả các model sang ONNX FP32 để kiểm tra tốc độ CPU và sang TensorRT FP16 để kiểm tra tốc độ GPU. Chúng tôi thực hiện tất cả các bài kiểm tra tốc độ trên Google Colab Pro để đảm bảo tính tái lập dễ dàng.
Link to this sectionĐiều gì tiếp theo từ Ultralytics?#
Bản phát hành tiếp theo của chúng tôi, v6.3, dự kiến ra mắt vào tháng 9 năm 2022 và sẽ mang đến sự hỗ trợ chính thức cho việc phân đoạn thực thể (instance segmentation) cho YOLOv5, cùng với bản phát hành lớn v7.0 vào cuối năm nay nhằm cập nhật kiến trúc cho cả 3 tác vụ - phân loại, nhận diện và phân đoạn.
Truy cập kho lưu trữ mã nguồn mở GitHub của chúng tôi cho YOLOv5 để cập nhật thông tin và tìm hiểu thêm về bản phát hành này.






