Làm chủ việc điều chỉnh siêu tham số để tối ưu hóa các mô hình ML như Ultralytics YOLO. Tăng độ chính xác, tốc độ và hiệu suất với các kỹ thuật chuyên môn.
Điều chỉnh siêu tham số là quá trình tìm kiếm các cài đặt cấu hình tối ưu cho một mô hình Học máy (ML). Các cài đặt này, được gọi là siêu tham số, nằm bên ngoài mô hình và không thể học trực tiếp từ dữ liệu trong quá trình huấn luyện. Thay vào đó, chúng được đặt trước khi quá trình huấn luyện bắt đầu và kiểm soát cách thức hoạt động của chính quá trình huấn luyện. Điều chỉnh hiệu quả các siêu tham số này là một bước quan trọng để tối đa hóa hiệu suất của mô hình và đảm bảo nó khái quát hóa tốt cho dữ liệu mới, chưa từng thấy. Nếu không có điều chỉnh thích hợp, ngay cả kiến trúc mô hình tiên tiến nhất cũng có thể hoạt động kém hiệu quả.
Điều quan trọng là phải phân biệt điều chỉnh siêu tham số với các khái niệm chính khác trong ML:
Các chuyên gia sử dụng một số chiến lược để tìm ra các giá trị siêu tham số tốt nhất. Các phương pháp phổ biến bao gồm Tìm kiếm theo Lưới (Grid Search), thử mọi kết hợp giá trị được chỉ định một cách triệt để, Tìm kiếm Ngẫu nhiên (Random Search), lấy mẫu các kết hợp ngẫu nhiên và các phương pháp nâng cao hơn như Tối ưu hóa Bayesian (Bayesian Optimization) và Thuật toán Tiến hóa (Evolutionary Algorithms).
Một số siêu tham số thường được điều chỉnh nhất bao gồm:
Điều chỉnh siêu tham số được áp dụng trên nhiều lĩnh vực khác nhau để đạt được hiệu suất cao nhất:
Ultralytics cung cấp các công cụ để đơn giản hóa việc điều chỉnh siêu tham số cho Ultralytics YOLO các mô hình. Các Ultralytics Tuner
class, được ghi lại trong Hướng dẫn Điều Chỉnh Siêu Tham Số, tự động hóa quy trình bằng cách sử dụng các thuật toán tiến hóa. Tích hợp với các nền tảng như Ray Tune cung cấp thêm các khả năng cho các chiến lược tìm kiếm phân tán và nâng cao, giúp người dùng tối ưu hóa mô hình của họ một cách hiệu quả cho các tập dữ liệu cụ thể (như COCO) và các tác vụ. Người dùng có thể tận dụng các nền tảng như Ultralytics HUB để theo dõi và quản lý thử nghiệm hợp lý, đây thường là một phần quan trọng của việc tuân theo các phương pháp hay nhất cho huấn luyện mô hình (model training). Các thư viện mã nguồn mở phổ biến như Optuna và Hyperopt cũng được sử dụng rộng rãi trong cộng đồng ML cho mục đích này.