术语表

自动编码器

了解自动编码器如何利用先进的人工智能技术压缩数据、降低噪音并实现异常检测、特征提取等功能。

自编码器是一种用于无监督学习的人工神经网络。其主要目标是学习一组数据的压缩、高效表示（编码），通常用于降维或特征提取。该网络通过学习重建自己的输入来实现这一目标。它主要由两部分组成：编码器和解码器，前者将输入数据压缩到低维度的潜在空间，后者则根据压缩后的表示重建原始数据。通过迫使数据通过这一 "瓶颈"，网络必须学会识别和保留最显著的特征，同时剔除噪音和冗余。

自动编码器的工作原理

自动编码器的结构由编码器函数和解码器函数组成，编码器函数可以是简单的前馈网络，也可以是卷积神经网络（CNN）等更复杂的结构。

编码器：网络的这一部分采用高维输入数据，并将其映射为低维潜在表示。这种压缩向量能捕捉到输入数据的核心本质。
瓶颈层：这一层包含输入的压缩潜空间表示。它是自动编码器的核心，也是其有效降维的原因。
解码器：这部分从瓶颈处获取压缩表示，并尝试重建原始的高维输入数据。

模型训练过程包括最小化损失函数，通常称为重构误差，用于测量原始输入与重构输出之间的差异。这个过程是一种自我监督学习，因为模型从数据本身学习，而不需要明确的标签。

真实世界的人工智能/移动语言应用

自动编码器用途广泛，在机器学习和深度学习中有着多种实际应用。

异常检测：自动编码器对异常检测非常有效。模型在仅包含 "正常 "数据点的数据集上进行训练。当一个新的异常数据点（如制造缺陷或欺诈性金融交易）输入编码器时，解码器将无法对其进行准确重构。这将导致较高的重构误差，而重构误差可用作标记异常的信号。这是用于制造和金融安全系统的人工智能的关键技术，艾伦-图灵研究所等机构都在探索这一课题。
图像去噪可以训练去噪自动编码器来去除图像中的噪声。该模型将有噪声的图像作为输入，经过训练后可输出干净的原始图像。这种功能在医学图像分析中非常有价值，可用于提高核磁共振成像或 CT 扫描的质量，或用于修复颗粒状的老照片。这种经过学习的去噪方法比传统的图像处理过滤器更为复杂。

自动编码器有多种类型，包括稀疏自动编码器、去噪自动编码器和卷积自动编码器。其中最重要的变体之一是变异自动编码器（VAE），它是一种生成模型，能够生成与训练时类似的新数据样本。关于变异自动编码器的全面概述可在 arXiv 上查阅。

自动编码器与相关概念

PCA：虽然两者都能降低维度，但主成分分析（PCA）仅限于线性变换。而作为神经网络的自动编码器可以学习复杂的非线性映射，从而为复杂的数据集提供更好的表示方法。
生成对抗网络 生成对抗网络（GAN）主要用于生成高度逼真的新数据。虽然 VAE 也能生成数据，但它们的重点通常是学习结构良好的潜在空间，而 GAN 擅长输出保真度，有时会以潜在空间的可解释性为代价。
CNN 和变换器：自动编码器定义了一种架构模式（编码器-解码器）。它们通常利用其他网络类型（如用于图像数据的CNN或用于序列数据的变换器）作为构建模块。这与Ultralytics YOLO 等模型不同，后者是针对物体检测或图像分割等任务构建的监督模型。

工具和实施

自动编码器可以使用流行的深度学习（DL）框架来实现：

PyTorch可灵活定义自定义编码器和解码器架构。请参阅 PyTorch 教程。
TensorFlow/Keras提供可简化构建和训练过程的高级 API。查看 Keras 自动编码器指南。

Ultralytics HUB等平台为包括数据管理和模型训练在内的整个 ML 工作流程提供了便利，不过它们主要侧重于检测和分割等有监督任务，而非无监督自动编码器训练。

自动编码器

灵活的企业许可解决方案为您的创新提供动力

使用 Ultralytics YOLO 在数秒内训练人工智能模型

使用 Ultralytics HUB 简单训练 YOLO 模型

自动编码器的工作原理

真实世界的人工智能/移动语言应用

自动编码器与相关概念

工具和实施

在此类别中阅读更多内容

制造企业资源规划指南

制造执行系统（MES）：人工智能驱动的生产

了解快速成型制造：技术和使用案例

加入 Ultralytics 社区