术语表

自动编码器

了解自动编码器如何利用先进的人工智能技术压缩数据、降低噪音并实现异常检测、特征提取等功能。

自编码器是一种用于无监督学习的 人工神经网络。其主要目标是学习一组数据的压缩、高效表示(编码),通常用于降维特征提取。该网络通过学习重建自己的输入来实现这一目标。它主要由两部分组成:编码器和解码器,前者将输入数据压缩到低维度的潜在空间,后者则根据压缩后的表示重建原始数据。通过迫使数据通过这一 "瓶颈",网络必须学会识别和保留最显著的特征,同时剔除噪音和冗余。

自动编码器的工作原理

自动编码器的结构由编码器函数和解码器函数组成,编码器函数可以是简单的前馈网络,也可以是卷积神经网络(CNN)等更复杂的结构。

  1. 编码器:网络的这一部分采用高维输入数据,并将其映射为低维潜在表示。这种压缩向量能捕捉到输入数据的核心本质。
  2. 瓶颈层:这一层包含输入的压缩潜空间表示。它是自动编码器的核心,也是其有效降维的原因。
  3. 解码器:这部分从瓶颈处获取压缩表示,并尝试重建原始的高维输入数据。

模型训练过程包括最小化损失函数,通常称为重构误差,用于测量原始输入与重构输出之间的差异。这个过程是一种自我监督学习,因为模型从数据本身学习,而不需要明确的标签。

真实世界的人工智能/移动语言应用

自动编码器用途广泛,在机器学习深度学习中有着多种实际应用。

  1. 异常检测:自动编码器对异常检测非常有效。模型在仅包含 "正常 "数据点的数据集上进行训练。当一个新的异常数据点(如制造缺陷或欺诈性金融交易)输入编码器时,解码器将无法对其进行准确重构。这将导致较高的重构误差,而重构误差可用作标记异常的信号。这是用于制造和金融安全系统的人工智能的关键技术,艾伦-图灵研究所等机构都在探索这一课题。
  2. 图像去噪可以训练去噪自动编码器来去除图像中的噪声。该模型将有噪声的图像作为输入,经过训练后可输出干净的原始图像。这种功能在医学图像分析中非常有价值,可用于提高核磁共振成像或 CT 扫描的质量,或用于修复颗粒状的老照片。这种经过学习的去噪方法比传统的图像处理过滤器更为复杂。

自动编码器有多种类型,包括稀疏自动编码器、去噪自动编码器和卷积自动编码器。其中最重要的变体之一是变异自动编码器(VAE),它是一种生成模型,能够生成与训练时类似的新数据样本。关于变异自动编码器的全面概述可在 arXiv 上查阅

自动编码器与相关概念

  • PCA:虽然两者都能降低维度,但主成分分析(PCA)仅限于线性变换。而作为神经网络的自动编码器可以学习复杂的非线性映射,从而为复杂的数据集提供更好的表示方法。
  • 生成对抗网络 生成对抗网络(GAN)主要用于生成高度逼真的新数据。虽然 VAE 也能生成数据,但它们的重点通常是学习结构良好的潜在空间,而 GAN 擅长输出保真度,有时会以潜在空间的可解释性为代价。
  • CNN 和变换器:自动编码器定义了一种架构模式(编码器-解码器)。它们通常利用其他网络类型(如用于图像数据的CNN或用于序列数据的变换器)作为构建模块。这与Ultralytics YOLO 等模型不同,后者是针对物体检测图像分割等任务构建的监督模型。

工具和实施

自动编码器可以使用流行的深度学习(DL)框架来实现:

Ultralytics HUB等平台为包括数据管理和模型训练在内的整个 ML 工作流程提供了便利,不过它们主要侧重于检测和分割等有监督任务,而非无监督自动编码器训练。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板