Глоссарий

Переобучение

Узнайте, как выявлять, предотвращать и устранять переобучение в машинном обучении. Откройте для себя методы улучшения обобщения модели и производительности в реальных условиях.

Переоценка возникает в Машинное обучение (ML), когда модель изучает специфические детали и шумы своих обучающих данных до такой степени. до такой степени, что это негативно сказывается на ее производительности при работе с новыми данными. По сути, модель запоминает обучающие примеры, а не изучает основные закономерности, необходимые для обобщения. Это приводит к тому, что система достигает высокой точности при разработке, но не способна обеспечить надежные при использовании в реальных сценариях.

Понимание феномена

В контексте контролируемого обучения целью состоит в том, чтобы создать модель, которая будет хорошо работать на невидимых входных данных, известных как тестовые данные. Переоценка обычно происходит, когда модель слишком сложной по отношению к объему имеющихся данных, что часто описывается как высокая дисперсия. Такая Модель улавливает случайные колебания или "шум" в наборе данных, как если бы они были значимыми характеристиками. Этот является главной проблемой глубокого обучения (ГОО), требующая от разработчиков баланса между сложностью и гибкостью, который часто называют компромисс между смещением и дисперсией.

Реальные примеры

Переоценка может привести к серьезным последствиям в зависимости от области применения:

Автономные транспортные средства: Рассмотрим систему технического зрения для автономных транспортных средств, обученную исключительно на изображениях автомагистралей, сделанных в солнечную погоду. Модель может оказаться слишком приспособленной к этим специфическим условиям освещения и текстуры дороги. Следовательно, она может не обеспечить точного обнаружения объектов при попадании под дождь, тени или в городских условиях, что создает угрозу безопасности.
Медицинская диагностика: На сайте ИИ в здравоохранении, модель может быть обучена выявлять патологии на рентгеновских снимках. Если набор данных получен из одной больницы, то модель может чрезмерно адаптироваться к специфическим артефактам оборудования для получения изображений в этой больнице. При применении к анализа медицинских изображений из другого медицинском учреждении, производительность модели может значительно снизиться, поскольку она изучает шум оборудования, а не биологические особенности заболевания.

Выявление и предотвращение избыточной подгонки

Разработчики обычно detect чрезмерную подгонку, отслеживая функции потерь во время обучения. Явным индикатором является когда потери при обучении продолжают уменьшаться, в то время как а потери при проверке данных начинают расти. Для борьбы с с этим, используется несколько методов:

Дополнение данных: Это предполагает искусственное увеличение разнообразия обучающего набора. С помощью применения случайных преобразований, таких как вращение или переворачивание, увеличение данных не позволяет модели запоминать точное расположение пикселей.
Регуляризация: Такие методы, как регуляризация L1/L2 или добавление исключающего слоя, наказывают слишком сложные модели, эффективно игнорируя процент нейронов во время обучения. эффективно игнорируя определенный процент нейронов во время обучения, заставляя нейронную сеть нейронную сеть обучаться избыточным, надежным функции.
Ранняя остановка: Эта техника останавливает процесс обучения, как только метрика проверки перестает улучшаться, что предотвращает обучение модели от шума в последующих эпохах.