Tìm hiểu về các kỷ nguyên trong học máy—cách chúng tác động đến việc đào tạo mô hình, ngăn ngừa tình trạng quá khớp và tối ưu hóa hiệu suất với Ultralytics YOLO.
Trong học máy (ML) , một kỷ nguyên đại diện cho một lần chạy hoàn chỉnh của toàn bộ tập dữ liệu huấn luyện thông qua thuật toán học. Đây là một khái niệm cơ bản trong quy trình lặp lại của mạng nơ-ron nhân tạo (NN) , trong đó các mô hình học bằng cách liên tục xem các ví dụ từ dữ liệu. Số kỷ nguyên là một tham số quan trọng quyết định số lần mô hình sẽ học được từ toàn bộ tập thông tin huấn luyện, ảnh hưởng trực tiếp đến hiệu suất và chất lượng cuối cùng của mô hình.
Mục tiêu chính của việc huấn luyện mô hình là cho phép mô hình học các mẫu từ dữ liệu. Điều này đạt được bằng cách điều chỉnh các tham số nội bộ của mô hình, được gọi là trọng số mô hình , để giảm thiểu hàm mất mát , hàm này định lượng sai số giữa dự đoán của mô hình và dữ liệu thực tế. Trong một kỷ nguyên duy nhất, mô hình xử lý mọi mẫu dữ liệu, và một thuật toán tối ưu hóa như Stochastic Gradient Descent (SGD) sẽ cập nhật các trọng số này.
Việc huấn luyện một mô hình qua nhiều kỷ nguyên cho phép nó tinh chỉnh các tham số theo từng giai đoạn. Về mặt lý thuyết, với mỗi lần chạy, mô hình sẽ hoàn thành tốt hơn nhiệm vụ của mình, dù là phân loại hình ảnh hay phát hiện đối tượng . Quá trình này được quản lý bằng các nền tảng học sâu phổ biến như PyTorch hoặc TensorFlow .
Mặc dù có liên quan, nhưng các thuật ngữ này mô tả các khía cạnh khác nhau của quá trình đào tạo và thường bị nhầm lẫn.
Ví dụ, nếu một tập dữ liệu có 10.000 hình ảnh và kích thước lô là 100, một kỷ nguyên sẽ bao gồm 100 lần lặp (10.000 hình ảnh / 100 hình ảnh trên mỗi lô).
Việc chọn đúng số kỷ nguyên là một phần quan trọng của việc điều chỉnh siêu tham số . Nó liên quan đến việc tìm ra sự cân bằng để tránh hai vấn đề thường gặp:
Một kỹ thuật phổ biến để chống lại hiện tượng quá khớp là dừng sớm (early stopping) , trong đó quá trình huấn luyện sẽ dừng lại khi hiệu suất của mô hình trên tập xác thực không còn cải thiện. Tiến trình có thể được theo dõi bằng các công cụ như TensorBoard hoặc thông qua các nền tảng như Ultralytics HUB , giúp trực quan hóa các số liệu huấn luyện qua các kỷ nguyên.
Khái niệm về kỷ nguyên được sử dụng phổ biến trong các ứng dụng học sâu.
Lái xe tự động : Một mô hình phát hiện vật thể cho xe tự hành được đào tạo trên một tập dữ liệu lớn như Argoverse . Mô hình, chẳng hạn như Ultralytics YOLO11 , có thể được đào tạo trong 50-100 kỷ nguyên. Sau mỗi kỷ nguyên, hiệu suất của nó trên một tập xác thực được đo lường bằng các số liệu như Độ chính xác trung bình (mAP) . Các kỹ sư sẽ chọn mô hình từ kỷ nguyên mang lại sự cân bằng tốt nhất giữa tốc độ và độ chính xác trước khi triển khai .
Phân tích Hình ảnh Y khoa : Một mô hình phát hiện khối u trong ảnh chụp não được huấn luyện trên một tập dữ liệu hình ảnh y khoa chuyên biệt. Do các tập dữ liệu này có thể nhỏ, mô hình có thể được huấn luyện trong vài trăm chu kỳ. Để ngăn ngừa hiện tượng quá khớp, các kỹ thuật như tăng cường dữ liệu được sử dụng, và độ lệch chuẩn được theo dõi chặt chẽ sau mỗi chu kỳ. Điều này đảm bảo mô hình cuối cùng có thể khái quát hóa tốt với các ảnh chụp từ bệnh nhân mới. Việc tuân thủ các mẹo huấn luyện mô hình đã được thiết lập là rất quan trọng để thành công trong các ứng dụng quan trọng như vậy.