Глоссарий

Автоэнкодер

Узнайте, как автоэнкодеры сжимают данные, уменьшают шум и обеспечивают обнаружение аномалий, извлечение признаков и многое другое с помощью передовых методов ИИ.

Автоэнкодер — это тип искусственной нейронной сети, используемый для обучения без учителя. Его основная цель — изучить сжатое, эффективное представление (кодирование) набора данных, обычно с целью уменьшения размерности или извлечения признаков. Сеть достигает этого, учась реконструировать свои собственные входные данные. Она состоит из двух основных частей: кодировщика, который сжимает входные данные в низкоразмерное скрытое пространство, и декодера, который реконструирует исходные данные из этого сжатого представления. Пропуская данные через этот «узкий канал», сеть должна научиться идентифицировать и сохранять наиболее важные признаки, отбрасывая шум и избыточность.

Как работают автокодировщики

Архитектура автокодировщика состоит из функции кодировщика и функции декодировщика, которые могут быть простыми нейронными сетями прямого распространения или более сложными структурами, такими как сверточные нейронные сети (CNN).

Энкодер: Эта часть сети принимает многомерные входные данные и преобразует их в латентное представление меньшей размерности. Этот сжатый вектор отражает основную суть входных данных.
Bottleneck (узкое место): Это слой, который содержит сжатое представление входных данных в латентном пространстве. Это ядро автоэнкодера и причина, по которой он эффективен для снижения размерности.
Декодер: Эта часть берет сжатое представление из узкого места и пытается восстановить исходные многомерные входные данные.

Процесс обучения модели включает в себя минимизацию функции потерь, часто называемой ошибкой реконструкции, которая измеряет разницу между исходными входными данными и реконструированными выходными данными. Этот процесс является формой самообучения, поскольку модель учится на самих данных, не нуждаясь в явных метках.

Реальные приложения AI/ML

Автоэнкодеры универсальны и имеют несколько практических применений в машинном обучении и глубоком обучении.

Обнаружение аномалий: Автоэнкодеры очень эффективны для обнаружения аномалий. Модель обучается на наборе данных, содержащем только "нормальные" точки данных. Когда новая, аномальная точка данных (например, производственный дефект или мошенническая финансовая транзакция) подается в энкодер, декодер не сможет точно ее восстановить. Это приводит к высокой ошибке реконструкции, которую можно использовать в качестве сигнала для обозначения аномалии. Это критически важный метод в ИИ для производства и системах финансовой безопасности, тема, изучаемая такими учреждениями, как Институт Алана Тьюринга.
Удаление шума с изображения: Автоэнкодер для удаления шума можно обучить удалять шум с изображений. Модель получает зашумленные изображения в качестве входных данных и обучается выводить исходные, чистые версии. Эта возможность ценна в анализе медицинских изображений для повышения качества МРТ или КТ-снимков или для восстановления старых, зернистых фотографий. Этот изученный подход к удалению шума является более сложным, чем традиционные фильтры обработки изображений.

Существует множество типов автоэнкодеров, включая разреженные автоэнкодеры, денойзинговые автоэнкодеры и сверточные автоэнкодеры. Одной из наиболее значительных разновидностей является вариационный автоэнкодер (VAE), который представляет собой генеративную модель, способную создавать новые образцы данных, похожие на те, на которых она была обучена. Подробный обзор VAE доступен на arXiv.