深圳尤洛视觉
深圳
立即加入
词汇表

自编码器

了解自编码器如何压缩数据、减少噪声,并通过先进的 AI 技术实现异常检测、特征提取等。

自编码器是一种用于无监督学习人工神经网络。它的主要目标是学习一组数据的压缩、高效表示(编码),通常用于降维特征提取。该网络通过学习重建其自身的输入来实现这一点。它由两个主要部分组成:编码器,它将输入数据压缩到低维潜在空间中;以及解码器,它从这种压缩表示中重建原始数据。通过迫使数据通过这个“瓶颈”,网络必须学会识别和保留最显着的特征,同时丢弃噪声和冗余。

自编码器如何工作

自编码器的架构由编码器函数和解码器函数组成,可以是简单的前馈网络,也可以是更复杂的结构,如 卷积神经网络 (CNN)

  1. 编码器: 网络的这一部分获取高维输入数据并将其映射到较低维的潜在表示。这个压缩向量捕获了输入数据的核心本质。
  2. 瓶颈: 这是包含输入的压缩潜在空间表示的层。 它是自编码器的核心,也是它对于降维有效的原因。
  3. 解码器: 这部分从瓶颈中获取压缩表示,并尝试重建原始的高维输入数据。

模型训练过程涉及最小化损失函数,通常称为重建误差,它衡量原始输入和重建输出之间的差异。此过程是一种自监督学习形式,因为模型无需显式标签即可从数据本身中学习。

真实世界的AI/ML应用

自编码器用途广泛,在机器学习深度学习中具有多种实际应用。

  1. 异常检测(Anomaly Detection): 自编码器在异常检测方面非常有效。模型在仅包含“正常”数据点的数据集上进行训练。当一个新的、异常的数据点(例如,制造缺陷或欺诈性金融交易)被输入到编码器时,解码器将无法准确地重建它。这将导致高重建误差,该误差可用作标记异常的信号。这是制造业人工智能和金融安全系统中的一项关键技术,艾伦·图灵研究所等机构对此进行了探索。
  2. 图像去噪: 可以训练去噪自编码器以去除图像中的噪声。该模型以带噪声的图像作为输入,并经过训练以输出原始的、干净的版本。这种能力在医学图像分析中很有价值,可以提高 MRI 或 CT 扫描的质量,或者修复旧的、颗粒状的照片。这种学习到的去噪方法比传统的图像处理滤波器更复杂。

自编码器有很多种类型,包括稀疏自编码器、降噪自编码器和 卷积自编码器。其中一个最重要的变体是 变分自编码器 (VAE),它是一种 生成模型,能够生成与训练数据相似的新数据样本。关于 VAE 的全面 概述可在 arXiv 上找到

Autoencoder 与相关概念

  • PCA: 虽然两者都降低了维度,但主成分分析 (PCA) 仅限于线性变换。自编码器是神经网络,可以学习复杂的非线性映射,通常可以为复杂的数据集带来更好的表示。
  • GAN: 生成对抗网络 (GAN) 主要设计用于生成高度逼真的新数据。虽然 VAE 也可以生成数据,但它们的重点通常是学习结构良好的潜在空间,而 GAN 则擅长输出保真度,有时以潜在空间的可解释性为代价。
  • CNN 和 Transformer:自编码器定义了一种架构模式(编码器-解码器)。它们通常利用其他网络类型(如用于图像数据的 CNN 或用于序列数据的 Transformer)作为构建块。这与 Ultralytics YOLO 等模型不同,后者是为 目标检测图像分割 等任务而构建的监督模型。

工具与实现

可以使用流行的 深度学习 (DL) 框架来实现 Autoencoder:

Ultralytics HUB 这样的平台促进了整个 ML 工作流程,包括数据管理和模型训练,尽管它们主要侧重于检测和分割等监督任务,而不是无监督的自编码器训练。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板