Thuật ngữ

Kỷ nguyên

Tìm hiểu về các kỷ nguyên trong học máy—cách chúng tác động đến việc đào tạo mô hình, ngăn ngừa tình trạng quá khớp và tối ưu hóa hiệu suất với Ultralytics YOLO.

Trong học máy (ML) , một kỷ nguyên đại diện cho một lần chạy hoàn chỉnh của toàn bộ tập dữ liệu huấn luyện thông qua thuật toán học. Đây là một khái niệm cơ bản trong quy trình lặp lại của mạng nơ-ron nhân tạo (NN) , trong đó các mô hình học bằng cách liên tục xem các ví dụ từ dữ liệu. Số kỷ nguyên là một tham số quan trọng quyết định số lần mô hình sẽ học được từ toàn bộ tập thông tin huấn luyện, ảnh hưởng trực tiếp đến hiệu suất và chất lượng cuối cùng của mô hình.

Vai trò của kỷ nguyên trong đào tạo mô hình

Mục tiêu chính của việc huấn luyện mô hình là cho phép mô hình học các mẫu từ dữ liệu. Điều này đạt được bằng cách điều chỉnh các tham số nội bộ của mô hình, được gọi là trọng số mô hình , để giảm thiểu hàm mất mát , hàm này định lượng sai số giữa dự đoán của mô hình và dữ liệu thực tế. Trong một kỷ nguyên duy nhất, mô hình xử lý mọi mẫu dữ liệu, và một thuật toán tối ưu hóa như Stochastic Gradient Descent (SGD) sẽ cập nhật các trọng số này.

Việc huấn luyện một mô hình qua nhiều kỷ nguyên cho phép nó tinh chỉnh các tham số theo từng giai đoạn. Về mặt lý thuyết, với mỗi lần chạy, mô hình sẽ hoàn thành tốt hơn nhiệm vụ của mình, dù là phân loại hình ảnh hay phát hiện đối tượng . Quá trình này được quản lý bằng các nền tảng học sâu phổ biến như PyTorch hoặc TensorFlow .

Kỷ nguyên so với Lặp lại so với Lô

Mặc dù có liên quan, nhưng các thuật ngữ này mô tả các khía cạnh khác nhau của quá trình đào tạo và thường bị nhầm lẫn.

  • Kỷ nguyên : Một chu kỳ hoàn chỉnh trong đó mô hình đã xem toàn bộ tập dữ liệu đào tạo.
  • Kích thước lô : Số lượng mẫu huấn luyện được sử dụng trong một lần lặp. Do hạn chế về bộ nhớ, việc xử lý toàn bộ tập dữ liệu cùng một lúc thường không khả thi.
  • Lặp lại : Một lần cập nhật duy nhất cho các trọng số của mô hình. Lặp lại bao gồm việc xử lý một lô dữ liệu và thực hiện truyền ngược và truyền xuôi ( truyền ngược ).

Ví dụ, nếu một tập dữ liệu có 10.000 hình ảnh và kích thước lô là 100, một kỷ nguyên sẽ bao gồm 100 lần lặp (10.000 hình ảnh / 100 hình ảnh trên mỗi lô).

Xác định số kỷ nguyên phù hợp

Việc chọn đúng số kỷ nguyên là một phần quan trọng của việc điều chỉnh siêu tham số . Nó liên quan đến việc tìm ra sự cân bằng để tránh hai vấn đề thường gặp:

  • Underfitting : Điều này xảy ra khi mô hình không được huấn luyện đủ số kỷ nguyên. Nó không thể học được các mẫu cơ bản trong dữ liệu và hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
  • Quá khớp (Overfitting) : Điều này xảy ra khi mô hình được huấn luyện quá nhiều kỷ nguyên. Nó bắt đầu "ghi nhớ" dữ liệu huấn luyện, bao gồm cả nhiễu, và mất khả năng khái quát hóa sang dữ liệu mới, chưa được biết đến. Mặc dù có thể đạt độ chính xác tuyệt vời trên tập huấn luyện, nhưng hiệu suất của nó trên dữ liệu xác thực sẽ kém.

Một kỹ thuật phổ biến để chống lại hiện tượng quá khớp là dừng sớm (early stopping) , trong đó quá trình huấn luyện sẽ dừng lại khi hiệu suất của mô hình trên tập xác thực không còn cải thiện. Tiến trình có thể được theo dõi bằng các công cụ như TensorBoard hoặc thông qua các nền tảng như Ultralytics HUB , giúp trực quan hóa các số liệu huấn luyện qua các kỷ nguyên.

Ví dụ thực tế

Khái niệm về kỷ nguyên được sử dụng phổ biến trong các ứng dụng học sâu.

  1. Lái xe tự động : Một mô hình phát hiện vật thể cho xe tự hành được đào tạo trên một tập dữ liệu lớn như Argoverse . Mô hình, chẳng hạn như Ultralytics YOLO11 , có thể được đào tạo trong 50-100 kỷ nguyên. Sau mỗi kỷ nguyên, hiệu suất của nó trên một tập xác thực được đo lường bằng các số liệu như Độ chính xác trung bình (mAP) . Các kỹ sư sẽ chọn mô hình từ kỷ nguyên mang lại sự cân bằng tốt nhất giữa tốc độ và độ chính xác trước khi triển khai .

  2. Phân tích Hình ảnh Y khoa : Một mô hình phát hiện khối u trong ảnh chụp não được huấn luyện trên một tập dữ liệu hình ảnh y khoa chuyên biệt. Do các tập dữ liệu này có thể nhỏ, mô hình có thể được huấn luyện trong vài trăm chu kỳ. Để ngăn ngừa hiện tượng quá khớp, các kỹ thuật như tăng cường dữ liệu được sử dụng, và độ lệch chuẩn được theo dõi chặt chẽ sau mỗi chu kỳ. Điều này đảm bảo mô hình cuối cùng có thể khái quát hóa tốt với các ảnh chụp từ bệnh nhân mới. Việc tuân thủ các mẹo huấn luyện mô hình đã được thiết lập là rất quan trọng để thành công trong các ứng dụng quan trọng như vậy.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard