Yolo Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Epoch (Số Lượt Huấn Luyện)

Tìm hiểu về epochs trong học máy—cách chúng tác động đến quá trình huấn luyện mô hình, ngăn ngừa tình trạng overfitting và tối ưu hóa hiệu suất với Ultralytics YOLO.

Trong học máy (ML), một epoch đại diện cho một lần duyệt đầy đủ toàn bộ tập dữ liệu huấn luyện thông qua thuật toán học. Đây là một khái niệm cơ bản trong quá trình lặp đi lặp lại của việc huấn luyện mạng nơ-ron (NN), nơi các mô hình học bằng cách liên tục xem các ví dụ từ dữ liệu. Số lượng epoch là một tham số quan trọng xác định số lần mô hình sẽ học từ toàn bộ thông tin huấn luyện, ảnh hưởng trực tiếp đến hiệu suất và chất lượng cuối cùng của mô hình.

Vai trò của Epochs trong Huấn luyện Mô hình

Mục tiêu chính của huấn luyện mô hình là giúp mô hình học được các mẫu từ dữ liệu. Điều này đạt được bằng cách điều chỉnh các tham số bên trong của mô hình, được gọi là trọng số mô hình, để giảm thiểu một hàm mất mát, hàm này định lượng sai số giữa các dự đoán của mô hình và ground truth thực tế. Trong một epoch duy nhất, mô hình xử lý mọi mẫu dữ liệu và một thuật toán tối ưu hóa như Stochastic Gradient Descent (SGD) cập nhật các trọng số này.

Huấn luyện một mô hình cho nhiều epoch cho phép nó tinh chỉnh các tham số của mình một cách lặp đi lặp lại. Với mỗi lần lặp, mô hình về mặt lý thuyết sẽ trở nên tốt hơn trong nhiệm vụ của mình, cho dù đó là phân loại hình ảnh hay phát hiện đối tượng. Quá trình này được quản lý bằng cách sử dụng các framework deep learning phổ biến như PyTorch hoặc TensorFlow.

Epochs so với Iterations so với Batches

Mặc dù có liên quan, các thuật ngữ này mô tả các khía cạnh khác nhau của quá trình huấn luyện và thường bị nhầm lẫn.

  • Epoch: Một chu kỳ hoàn chỉnh, trong đó mô hình đã xem toàn bộ tập dữ liệu huấn luyện.
  • Kích thước lô (Batch Size): Số lượng mẫu huấn luyện được sử dụng trong một lần lặp. Do giới hạn về bộ nhớ, việc xử lý toàn bộ tập dữ liệu cùng một lúc thường không khả thi.
  • Vòng lặp (Iteration): Một lần cập nhật duy nhất trọng số của mô hình. Một vòng lặp bao gồm xử lý một batch dữ liệu và thực hiện một lượt forward và backward (backpropagation).

Ví dụ: nếu một dataset có 10.000 hình ảnh và kích thước batch là 100, thì một epoch sẽ bao gồm 100 lần lặp (10.000 hình ảnh / 100 hình ảnh trên mỗi batch).

Xác định Số lượng Epochs (Vòng lặp) Phù hợp

Chọn số lượng epochs (số lần lặp) chính xác là một phần quan trọng của quá trình điều chỉnh siêu tham số. Nó bao gồm việc tìm kiếm sự cân bằng để tránh hai vấn đề phổ biến:

Một kỹ thuật phổ biến để chống lại hiện tượng overfitting là dừng sớm, trong đó quá trình huấn luyện bị dừng lại khi hiệu suất của mô hình trên một tập dữ liệu kiểm định không còn được cải thiện. Tiến trình có thể được theo dõi bằng các công cụ như TensorBoard hoặc thông qua các nền tảng như Ultralytics HUB, giúp trực quan hóa các số liệu huấn luyện theo thời gian.

Các ví dụ thực tế

Khái niệm epoch (số lần lặp) là phổ biến trong các ứng dụng deep learning.

  1. Lái xe tự động: Một mô hình nhận diện đối tượng cho xe tự hành được huấn luyện trên một bộ dữ liệu khổng lồ như Argoverse. Mô hình này, chẳng hạn như Ultralytics YOLO11, có thể được huấn luyện trong 50-100 epochs. Sau mỗi epoch, hiệu suất của nó trên một tập dữ liệu validation được đo bằng các metrics như mean Average Precision (mAP). Các kỹ sư sẽ chọn mô hình từ epoch mang lại sự cân bằng tốt nhất giữa tốc độ và độ chính xác trước khi triển khai.

  2. Phân tích ảnh y tế: Một mô hình để phát hiện khối u trong ảnh chụp não được huấn luyện trên một bộ dữ liệu chẩn đoán hình ảnh y tế chuyên dụng. Vì các bộ dữ liệu như vậy có thể nhỏ, mô hình có thể được huấn luyện trong vài trăm epochs. Để ngăn ngừa overfitting, các kỹ thuật như tăng cường dữ liệu được sử dụng và mất mát xác thực được theo dõi chặt chẽ sau mỗi epoch. Điều này đảm bảo mô hình cuối cùng tổng quát hóa tốt cho ảnh chụp từ bệnh nhân mới. Tuân theo các mẹo huấn luyện mô hình đã được thiết lập là rất quan trọng để thành công trong các ứng dụng quan trọng như vậy.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard