Điều chỉnh siêu tham số chính để tối ưu hóa các mô hình ML như Ultralytics YOLO. Tăng độ chính xác, tốc độ và hiệu suất bằng các kỹ thuật chuyên gia.
Điều chỉnh siêu tham số là quá trình tìm kiếm các thiết lập cấu hình tối ưu cho mô hình Học máy (ML) . Các thiết lập này, được gọi là siêu tham số, nằm ngoài mô hình và không thể được học trực tiếp từ dữ liệu trong quá trình huấn luyện . Thay vào đó, chúng được thiết lập trước khi bắt đầu huấn luyện và kiểm soát cách thức hoạt động của chính quá trình huấn luyện. Việc điều chỉnh hiệu quả các siêu tham số này là một bước quan trọng để tối đa hóa hiệu suất mô hình và đảm bảo nó có thể khái quát hóa tốt với dữ liệu mới, chưa được biết đến. Nếu không được điều chỉnh đúng cách, ngay cả kiến trúc mô hình tiên tiến nhất cũng có thể hoạt động kém hiệu quả.
Điều quan trọng là phải phân biệt điều chỉnh siêu tham số với các khái niệm chính khác trong ML:
Các chuyên gia sử dụng một số chiến lược để tìm ra các giá trị siêu tham số tốt nhất. Các phương pháp phổ biến bao gồm Tìm kiếm lưới (Grid Search), thử nghiệm triệt để mọi tổ hợp giá trị được chỉ định, Tìm kiếm ngẫu nhiên (Random Search), lấy mẫu các tổ hợp một cách ngẫu nhiên, và các phương pháp tiên tiến hơn như Tối ưu hóa Bayes và Thuật toán tiến hóa .
Một số siêu tham số được điều chỉnh thường xuyên nhất bao gồm:
Điều chỉnh siêu tham số được áp dụng trên nhiều miền khác nhau để đạt hiệu suất cao nhất:
Ultralytics cung cấp các công cụ để đơn giản hóa việc điều chỉnh siêu tham số cho Siêu phân tích YOLO các mô hình. Các Siêu phân tích Tuner
lớp học, được ghi chép trong Hướng dẫn điều chỉnh siêu tham số, tự động hóa quy trình bằng các thuật toán tiến hóa. Tích hợp với các nền tảng như Ray Điều Chỉnh cung cấp thêm khả năng cho các chiến lược tìm kiếm phân tán và nâng cao, giúp người dùng tối ưu hóa các mô hình của họ một cách hiệu quả cho các tập dữ liệu cụ thể (như COCO) và các nhiệm vụ. Người dùng có thể tận dụng các nền tảng như Trung tâm phân tích siêu dữ liệu để theo dõi và quản lý thí nghiệm hợp lý, thường là một phần quan trọng trong việc thực hiện các phương pháp hay nhất cho đào tạo người mẫu. Các thư viện mã nguồn mở phổ biến như Optuna Và Hyperopt cũng được sử dụng rộng rãi trong cộng đồng ML cho mục đích này.