Повысьте точность и устойчивость моделей ИИ с помощью сглаживания меток — проверенного метода улучшения обобщения и снижения самоуверенности.
Label Smoothing (сглаживание меток) — это метод регуляризации, используемый во время обучения моделей машинного обучения, особенно в задачах классификации. Он решает проблему излишней самоуверенности модели, не позволяя модели присваивать полной вероятности 1.0 правильному классу. Вместо использования «жестких» меток (где правильный класс равен 1, а все остальные — 0), Label Smoothing создает «мягкие» метки, распределяя небольшую часть вероятностной массы по другим классам. Это побуждает модель быть менее уверенной в своих прогнозах, что может привести к лучшему обобщению и улучшению производительности на невидимых данных. Этот метод был заметно использован в высокопроизводительных моделях и подробно описан в таких статьях, как Когда помогает сглаживание меток?.
В типичной задаче классификации обучения с учителем обучающие данные состоят из входных данных и соответствующих им правильных меток. Например, в задаче классификации изображений изображение кошки будет иметь метку «кошка», представленную в виде вектора с одним активным элементом, например, для классов [кошка, собака, птица]. При вычислении функции потерь модель штрафуется в зависимости от того, насколько ее прогноз отличается от этой жесткой цели.
Label Smoothing изменяет эту цель. Он немного уменьшает целевую вероятность для правильного класса (например, до 0,9) и равномерно распределяет оставшуюся небольшую вероятность (0,1 в этом случае) между неправильными классами. Таким образом, новая «мягкая» цель может выглядеть как [0,9, 0,05, 0,05]. Это небольшое изменение препятствует тому, чтобы последний логит-слой нейронной сети производил чрезвычайно большие значения для одного класса, что помогает предотвратить переобучение. Этим процессом можно управлять во время обучения модели с использованием таких платформ, как Ultralytics HUB.
Основное преимущество сглаживания меток заключается в том, что оно улучшает калибровку модели. Прогнозируемые оценки достоверности хорошо откалиброванной модели более точно отражают истинную вероятность правильности. Это имеет решающее значение для приложений, где важно понимать уверенность модели, например, в анализе медицинских изображений. Предотвращая излишнюю самоуверенность, оно также улучшает способность модели к обобщению на новые данные, что является ключевой целью любого проекта машинного обучения. Это часто приводит к небольшому повышению точности. Лучшее обобщение приводит к созданию более надежных моделей для вывода в реальном времени и окончательного развертывания модели.
Label Smoothing — это простой, но эффективный метод, применяемый в различных современных моделях.
Важно отличать сглаживание меток от других методов регуляризации.