Nâng cao độ chính xác và độ bền của mô hình AI bằng cách làm mịn nhãn—một kỹ thuật đã được chứng minh có thể cải thiện khả năng khái quát hóa và giảm sự tự tin thái quá.
Làm mịn Nhãn là một kỹ thuật điều chỉnh được sử dụng trong quá trình huấn luyện các mô hình học máy , đặc biệt là trong các tác vụ phân loại. Kỹ thuật này giải quyết vấn đề quá tự tin của mô hình bằng cách ngăn mô hình gán toàn bộ xác suất 1.0 cho lớp đúng. Thay vì sử dụng các nhãn "cứng" (trong đó lớp đúng là 1 và tất cả các lớp khác là 0), Làm mịn Nhãn tạo ra các nhãn "mềm", phân phối một phần nhỏ khối lượng xác suất cho các lớp khác. Điều này khuyến khích mô hình ít chắc chắn hơn về các dự đoán của nó, từ đó có thể dẫn đến khả năng khái quát hóa tốt hơn và cải thiện hiệu suất trên dữ liệu chưa biết. Kỹ thuật này đặc biệt được sử dụng trong các mô hình hiệu suất cao và được trình bày chi tiết trong các bài báo như When Does Label Smoothing Help? (Khi nào Làm mịn Nhãn Giúp ích?) .
Trong một bài toán phân loại học có giám sát điển hình, dữ liệu huấn luyện bao gồm các đầu vào và nhãn chính xác tương ứng. Ví dụ, trong một bài toán phân loại hình ảnh , một hình ảnh mèo sẽ có nhãn "mèo" được biểu diễn dưới dạng một vectơ mã hóa one-hot, tương tự như đối với các lớp [mèo, chó, chim]. Khi tính toán hàm mất mát , mô hình sẽ bị phạt dựa trên khoảng cách dự đoán của nó so với mục tiêu khó này.
Làm mịn nhãn (Label Smoothing) sửa đổi mục tiêu này. Nó giảm nhẹ xác suất mục tiêu cho lớp đúng (ví dụ: xuống 0,9) và phân bổ đều xác suất nhỏ còn lại (trong trường hợp này là 0,1) cho các lớp không đúng. Vì vậy, mục tiêu "mềm" mới có thể trông giống như [0,9, 0,05, 0,05]. Thay đổi nhỏ này ngăn lớp logit cuối cùng của mạng nơ-ron tạo ra các giá trị cực lớn cho một lớp, giúp ngăn ngừa hiện tượng quá khớp . Quá trình này có thể được quản lý trong quá trình huấn luyện mô hình bằng các nền tảng như Ultralytics HUB .
Ưu điểm chính của Làm mịn Nhãn là nó cải thiện hiệu chuẩn mô hình. Điểm tin cậy dự đoán của một mô hình được hiệu chuẩn tốt sẽ phản ánh chính xác hơn xác suất đúng thực sự. Điều này rất quan trọng đối với các ứng dụng đòi hỏi sự hiểu biết về độ tin cậy của mô hình, chẳng hạn như trong phân tích hình ảnh y tế . Bằng cách ngăn ngừa sự tự tin thái quá, nó cũng cải thiện khả năng khái quát hóa của mô hình sang dữ liệu mới, một mục tiêu chính của bất kỳ dự án học máy nào . Điều này thường dẫn đến sự gia tăng nhẹ về độ chính xác . Khái quát hóa tốt hơn dẫn đến các mô hình mạnh mẽ hơn cho suy luận thời gian thực và triển khai mô hình cuối cùng.
Làm mịn nhãn là một kỹ thuật đơn giản nhưng hiệu quả được áp dụng trong nhiều mô hình hiện đại.
Điều quan trọng là phải phân biệt Làm mịn nhãn với các kỹ thuật điều chỉnh khác.