Điều chỉnh siêu tham số chính để tối ưu hóa các mô hình ML như Ultralytics YOLO . Nâng cao độ chính xác, tốc độ và hiệu suất bằng các kỹ thuật chuyên môn.
Điều chỉnh siêu tham số là quá trình có hệ thống nhằm khám phá tập hợp tối ưu các biến cấu hình bên ngoài, được gọi là siêu tham số, chi phối quá trình huấn luyện mô hình học máy (ML) . Không giống như các tham số mô hình bên trong, chẳng hạn như weights and biases Được học trực tiếp từ dữ liệu huấn luyện trong giai đoạn học, các siêu tham số được thiết lập trước khi huấn luyện và duy trì không đổi trong suốt quá trình. Bước tối ưu hóa này rất quan trọng vì các thiết lập mặc định của mạng nơ-ron hiếm khi mang lại hiệu suất tốt nhất có thể cho một tập dữ liệu cụ thể. Bằng cách tinh chỉnh các điều khiển này, các nhà khoa học dữ liệu có thể cải thiện đáng kể độ chính xác của mô hình, giảm thời gian hội tụ và ngăn ngừa các vấn đề như quá khớp.
Để hiểu về điều chỉnh, việc hình dung mô hình như một cỗ máy phức tạp với nhiều núm xoay và công tắc khác nhau sẽ rất hữu ích. Trong khi cỗ máy tự học cách xử lý nguyên liệu thô (dữ liệu) thành sản phẩm hoàn thiện (dự đoán), người vận hành trước tiên phải thiết lập tốc độ, nhiệt độ và áp suất. Những "núm xoay" này chính là các siêu tham số.
Các siêu tham số phổ biến thường xuyên được tối ưu hóa bao gồm:
Việc tìm kiếm sự kết hợp hoàn hảo giữa các thiết lập có thể là một thách thức do không gian tìm kiếm quá rộng lớn. Các chuyên gia sử dụng một số phương pháp tiêu chuẩn để điều hướng không gian đa chiều này:
Điều cần thiết là phải phân biệt giữa điều chỉnh và đào tạo vì chúng là những giai đoạn riêng biệt trong vòng đời MLOPS :
Các mô hình được điều chỉnh hiệu quả đóng vai trò quan trọng trong việc triển khai các giải pháp AI mạnh mẽ trên nhiều ngành công nghiệp khác nhau.
Trong AI trong Nông nghiệp , máy bay không người lái được trang bị mô hình thị giác máy tính sẽ theo dõi sức khỏe cây trồng. Các mô hình này chạy trên các thiết bị điện toán biên với pin và công suất xử lý hạn chế. Việc tinh chỉnh siêu tham số được sử dụng để tối ưu hóa kiến trúc mô hình (ví dụ: giảm độ sâu lớp) và độ phân giải đầu vào. Điều này đảm bảo hệ thống cân bằng giữa tốc độ suy luận cao với độ chính xác phát hiện đủ để xác định cỏ dại hoặc sâu bệnh theo thời gian thực.
Đối với AI trong Y tế , đặc biệt là trong phân tích hình ảnh y tế , kết quả âm tính giả có thể gây nguy hiểm đến tính mạng. Khi phát hiện bất thường trong ảnh chụp X-quang hoặc MRI, các kỹ sư sẽ chủ động điều chỉnh các siêu tham số liên quan đến quy trình tăng cường dữ liệu và trọng số lớp trong hàm mất mát. Việc điều chỉnh này tối đa hóa khả năng thu hồi của mô hình, đảm bảo rằng ngay cả những dấu hiệu bệnh lý nhỏ nhất cũng được đánh dấu để con người xem xét.
Các ultralytics thư viện đơn giản hóa sự phức tạp của quá trình tối ưu hóa bằng cách bao gồm một thư viện tích hợp
tuner sử dụng thuật toán di truyền. Điều này cho phép người dùng tự động tìm kiếm các siêu tham số tốt nhất cho tập dữ liệu tùy chỉnh của họ mà không cần điều chỉnh giá trị thủ công cho mỗi lần chạy huấn luyện.
Ví dụ sau đây minh họa cách bắt đầu điều chỉnh siêu tham số cho một YOLO11 mô hình. Bộ điều chỉnh sẽ thay đổi các siêu tham số (như tốc độ học, động lượng và suy giảm trọng số) qua nhiều lần lặp lại để tối đa hóa hiệu suất.
from ultralytics import YOLO
# Initialize a YOLO11 model (using the 'nano' weight for speed)
model = YOLO("yolo11n.pt")
# Start tuning hyperparameters on the COCO8 dataset
# This will run for 10 epochs per iteration, for a total of 30 iterations
model.tune(data="coco8.yaml", epochs=10, iterations=30, optimizer="AdamW", plots=False)
Đối với người dùng nâng cao quản lý các thí nghiệm quy mô lớn, việc tích hợp với các nền tảng chuyên dụng như Ray Tune hoặc sử dụng Weights & Biases để trực quan hóa có thể đơn giản hóa hơn nữa quy trình điều chỉnh. Với các nghiên cứu và phát triển sắp tới về kiến trúc như YOLO26 , điều chỉnh tự động vẫn là nền tảng để đạt được hiệu suất tiên tiến một cách hiệu quả.