术语表

深度伪造

了解从娱乐到错误信息等深度伪造的技术、应用和道德问题。了解检测和人工智能解决方案。

利用深度学习技术制作的合成媒体被称为 "deepfakes"。该术语是 "深度学习 "和 "伪造 "的谐音,指的是将某人的肖像和声音替换成其他人的视频或音频,通常具有高度的逼真性。这是通过在目标人物的大量现有图像和视频上训练神经网络来学习和复制其面部表情、举止和语言模式来实现的。

深度伪造背后的技术

Deepfake 的生成主要依赖于两个关键的机器学习概念:生成对抗网络(GAN)自动编码器

  • 生成对抗网络(GAN):生成式对抗网络由两个相互竞争的神经网络组成:生成器和判别器。生成器生成虚假图像(例如,视频中的一帧对调人脸),而判别器则试图判定图像的真假。这一对抗过程迫使生成器制作出越来越有说服力的假图像,从而骗过鉴别器。这种技术是现代生成式人工智能的基石。
  • 自动编码器:这种方法采用编码器-解码器架构。两个自动编码器在两个不同人的镜头上进行训练。要进行人脸互换,第一个人的图像先通过第一个编码器,然后使用针对第二个人训练的解码器进行解码。这样,第二个人的图像就会呈现出第一个人的表情和方向。在交换过程开始前,通常先使用对象检测模型(如Ultralytics YOLO)来定位视频中的人脸。

应用和实际案例

虽然 deepfake 技术经常被恶意使用,但它也有一些合法和创造性的应用。

  • 娱乐与媒体:该技术可用于为不同语言的电影无缝配音,使演员的唇部动作与新的对白相匹配。它还可以为演员去老化,或以数字方式再现历史人物,如工业光魔公司(Industrial Light & Magic)所探索的传记片。
  • 合成数据生成:创建逼真的人工数据集是一项强大的应用。例如,人脸合成数据可用于训练人脸识别等任务的计算机视觉模型,而不会损害真实个体的数据隐私。这有助于提高模型的鲁棒性,减少数据集的偏差

道德挑战与检测

深度伪造技术可能被滥用,因此成为一个重大的伦理问题。该技术可用于制造令人信服的假新闻、传播政治虚假信息、实施欺诈以及生成未经同意的露骨内容。这些风险凸显了制定健全的人工智能伦理原则和负责任的人工智能开发的重要性。

为此,出现了一个深度假货检测领域,在生成和检测方法之间展开了一场技术军备竞赛。研究人员和公司正在开发人工智能模型,以发现深层造假算法经常留下的细微视觉假象和不一致之处。Deepfake Detection Challenge(深度伪造检测挑战赛)等倡议和人工智能合作伙伴关系(Partnership on AI)等组织正致力于提高这些检测能力,以减轻该技术的负面影响。公众也可以使用英特尔FakeCatcher等工具来识别生成的内容。学会如何辨别图像是否是人工智能生成的,正在成为现代数字领域的一项基本技能。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板