Nâng cao độ chính xác và tính mạnh mẽ của mô hình AI bằng kỹ thuật làm mịn nhãn — một kỹ thuật đã được chứng minh để cải thiện khả năng tổng quát hóa và giảm sự tự tin thái quá.
Label Smoothing là một kỹ thuật điều chuẩn (regularization) được sử dụng trong quá trình huấn luyện các mô hình machine learning, đặc biệt là trong các tác vụ phân loại. Nó giải quyết vấn đề mô hình quá tự tin bằng cách ngăn mô hình gán toàn bộ xác suất 1.0 cho lớp chính xác. Thay vì sử dụng các nhãn "cứng" (trong đó lớp chính xác là 1 và tất cả các lớp khác là 0), Label Smoothing tạo ra các nhãn "mềm", phân phối một phần nhỏ của khối lượng xác suất cho các lớp khác. Điều này khuyến khích mô hình bớt chắc chắn hơn về các dự đoán của nó, điều này có thể dẫn đến khả năng tổng quát hóa tốt hơn và cải thiện hiệu suất trên dữ liệu chưa thấy. Kỹ thuật này đã được sử dụng đáng chú ý trong các mô hình hiệu suất cao và được trình bày chi tiết trong các bài báo như When Does Label Smoothing Help?.
Trong một bài toán phân loại học có giám sát điển hình, dữ liệu huấn luyện bao gồm các đầu vào và các nhãn chính xác tương ứng của chúng. Ví dụ: trong một tác vụ phân loại hình ảnh, một hình ảnh về một con mèo sẽ có nhãn "mèo" được biểu diễn dưới dạng một vectơ mã hóa one-hot như đối với các lớp [mèo, chó, chim]. Khi tính toán hàm mất mát, mô hình bị phạt dựa trên mức độ dự đoán của nó khác xa so với mục tiêu cứng này.
Label Smoothing sửa đổi target này. Nó làm giảm nhẹ xác suất target cho lớp chính xác (ví dụ: xuống 0.9) và phân phối xác suất nhỏ còn lại (0.1 trong trường hợp này) đồng đều giữa các lớp không chính xác. Vì vậy, target "mềm" mới có thể trông giống như [0.9, 0.05, 0.05]. Sự thay đổi nhỏ này ngăn cản lớp logit cuối cùng của mạng neural tạo ra các giá trị cực lớn cho một lớp, điều này giúp ngăn ngừa quá khớp (overfitting). Quá trình này có thể được quản lý trong quá trình huấn luyện mô hình bằng các nền tảng như Ultralytics HUB.
Ưu điểm chính của Label Smoothing là nó cải thiện khả năng hiệu chỉnh mô hình. Điểm tin cậy dự đoán của một mô hình được hiệu chỉnh tốt phản ánh chính xác hơn xác suất đúng thực tế. Điều này rất quan trọng đối với các ứng dụng mà việc hiểu mức độ chắc chắn của mô hình là quan trọng, chẳng hạn như trong phân tích hình ảnh y tế. Bằng cách ngăn chặn sự tự tin thái quá, nó cũng cải thiện khả năng khái quát hóa dữ liệu mới của mô hình, một mục tiêu quan trọng của bất kỳ dự án học máy nào. Điều này thường dẫn đến một sự tăng nhẹ về độ chính xác. Khả năng khái quát hóa tốt hơn dẫn đến các mô hình mạnh mẽ hơn cho suy luận thời gian thực và triển khai mô hình cuối cùng.
Label Smoothing là một kỹ thuật đơn giản nhưng hiệu quả được áp dụng trong nhiều mô hình hiện đại.
Điều quan trọng là phân biệt Label Smoothing với các kỹ thuật điều chuẩn khác.