用語集

ディープフェイク

エンターテイメントから誤報まで、ディープフェイクの技術、用途、倫理的懸念を発見する。ディープフェイクの検出とAIソリューションについて学びます。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ディープフェイクとは、高度な人工知能(AI)および機械学習(ML)技術、特にディープラーニング(DL)を用いて作成された、非常にリアルで合成的に生成または操作された動画、画像、音声のことである。この用語は、"ディープラーニング "と "フェイク "の合成語である。これらの技術は、顔、声、行動を説得力のあるものに置き換えたり合成したりすることを可能にし、あたかも誰かが実際にはやっていないことを言ったりやったりしたかのように見せる。ディープフェイク・テクノロジーはオンライン・コミュニティから生まれたが、急速に進化し、創造的な機会と重大な倫理的課題の両方を提示している。

ディープフェイクはどのように作られるか

多くのディープフェイクを支える中核技術には、Generative Adversarial Networks(GAN)が関わっている。GANは、偽のコンテンツ(例えば、顔が入れ替わった画像)を作成するジェネレーターと、本物のコンテンツと偽のコンテンツを区別しようとする識別器という、2つの競合するニューラルネットワークで構成されている。繰り返し学習することで、ジェネレーターは、識別器、ひいては人間の観察者を欺くことができるリアルなフェイクを作り出すことにますます習熟していく。オートエンコーダはもう1つの一般的な手法で、大規模なデータセットから顔の圧縮表現(エンコーディング)を学習し、これらの表現をデコードしてターゲット動画に顔を再構成したり、入れ替えたりする。説得力のあるディープフェイクを作成するには、多くの場合、膨大な学習データ(ターゲットとなる個人の画像またはビデオクリップ)と大規模な GPUの計算リソースが必要となり、多くの場合、Ultralytics HUBのようなプラットフォームで管理される。

応用と実例

ディープフェイク技術には、有益な用途から悪意ある活動まで、さまざまな用途がある:

  • エンターテインメントとメディア:映画制作において、俳優の老化防止、歴史上の人物の再現、翻訳された音声に合わせて唇の動きを変えることによる吹き替えの改善などに使用される。例えば、映画制作者はディープフェイクの技術を『マンダロリアン』(原題:The Mandalorian)で使用した。 マンダロリアンでディープフェイクの技術を使い、俳優の若いバージョンをデジタルで再現した。また、トレーニングビデオやプレゼンテーションの作成にAIアバターを使用し、合成ビデオコンテンツを効果的に生成するプラットフォーム「Synthesia」もその一例だ。
  • 教育とアクセシビリティ:教育目的のために、バーチャル講師を作ったり、歴史上の人物に命を吹き込んだりする。声のクローンを作ることで、声を失った人を助けることができる。
  • 合成データ生成:特にコンピュータ・ビジョンの分野では、実データが乏しかったり繊細であったりする場合がある。これは、以下のようなモデルのロバスト性を向上させるのに役立ちます。 Ultralytics YOLO11のようなモデルの頑健性を向上させるのに役立つ。
  • 偽情報と悪意:政治的な誤報の拡散、有名人の偽の推薦やスキャンダルの作成、非合意のポルノの生成、なりすましによる詐欺の実行(取引を承認するための音声偽装など)。これらはAIの倫理と データプライバシーに関する深刻な懸念を引き起こす。

ディープフェイク検出

ディープフェイクの台頭は、検出手法の研究に拍車をかけている。このような手法には、通常とは異なる瞬きのパターン、不自然な表情、照明や影の不一致など、生成されたコンテンツに特徴的な微妙な矛盾やアーティファクトを識別するためのMLモデルの学習が含まれることが多い。コンピュータビジョン(CV)技術は、この取り組みの中心である。しかし、ディープフェイクの生成技術は検出を回避するために絶えず改良されているため、検出は現在進行中の軍拡競争である。Meta AIによるDeepfake Detection Challenge(DFDC)のような組織や、以下のような企業の取り組みがあります。 Microsoftのような組織やマイクロソフトのような企業のイニシアチブは、検出技術の現状を前進させることを目指している。標準的なベンチマークと データセットは、これらの検出モデルの開発と評価に不可欠です。

他のメディア操作との違い

ディープフェイクが(Adobe PhotoshopやAfter Effectsを使ったような)従来の写真や動画の編集と異なるのは、既存のピクセルを手動で変更したり、より単純なアルゴリズムで変更したりするのではなく、学習したパターンに基づいて、まったく新しいリアルな映像や音声の要素を生成するためにディープラーニングを使用する点にある。画像認識が画像内のオブジェクトや特徴を特定することに重点を置いているのに対し、ディープフェイク技術は、もっともらしい画像や動画を合成することに重点を置いている。これは、視覚領域における生成AIの高度な応用である。悪用される可能性があることから、責任あるAIの開発と社会的認知の重要性が強調されている。

すべて読む