Entdecken Sie die Technologie, Anwendungen und ethischen Bedenken von Deepfakes, von Unterhaltung bis hin zu Fehlinformationen. Lernen Sie Erkennungs- und KI-Lösungen kennen.
Deepfakes sind sehr realistische, synthetisch erzeugte oder manipulierte Videos, Bilder oder Audioaufnahmen, die mit fortschrittlichen Techniken der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML), insbesondere Deep Learning (DL), erstellt wurden. Der Begriff ist ein Portmanteau aus "Deep Learning" und "Fake". Diese Techniken ermöglichen den überzeugenden Ersatz oder die Synthese von Gesichtern, Stimmen und Handlungen, so dass es so aussieht, als ob jemand etwas gesagt oder getan hätte, was er in Wirklichkeit nicht getan hat. Die ursprünglich aus Online-Communities stammende Deepfake-Technologie hat sich rasch weiterentwickelt und bietet sowohl kreative Möglichkeiten als auch erhebliche ethische Herausforderungen.
Die Kerntechnologie hinter vielen Deepfakes sind Generative Adversarial Networks (GANs). Ein GAN besteht aus zwei konkurrierenden neuronalen Netzen: einem Generator, der den gefälschten Inhalt erzeugt (z. B. ein Bild mit einem vertauschten Gesicht), und einem Diskriminator, der versucht, zwischen echten und gefälschten Inhalten zu unterscheiden. Durch iteratives Training wird der Generator immer geschickter darin, realistische Fälschungen zu erzeugen, die den Diskriminator und schließlich den menschlichen Beobachter täuschen können. Eine weitere gängige Technik sind Autoencoder, die komprimierte Darstellungen (Kodierungen) von Gesichtern aus großen Datensätzen lernen und diese Darstellungen dann dekodieren, um Gesichter in Zielvideos zu rekonstruieren oder auszutauschen. Die Erstellung überzeugender Deepfakes erfordert häufig umfangreiche Trainingsdaten (Bilder oder Videoclips der Zielpersonen) und erhebliche GPU-Rechenressourcen, die häufig über Plattformen wie Ultralytics HUB verwaltet werden.
Die Deepfake-Technologie hat eine Reihe von Anwendungen, die von nützlichen bis zu bösartigen Aktivitäten reichen:
Das Aufkommen von Deepfakes hat die Erforschung von Erkennungsmethoden vorangetrieben. Dabei werden häufig ML-Modelle trainiert, um subtile Unstimmigkeiten oder Artefakte zu erkennen, die für generierte Inhalte charakteristisch sind, z. B. ungewöhnliche Blinzelmuster, unnatürliche Gesichtsausdrücke oder Unstimmigkeiten bei Beleuchtung oder Schatten. Computer Vision (CV)-Techniken sind für diese Bemühungen von zentraler Bedeutung. Die Erkennung ist jedoch ein ständiges Wettrüsten, da die Techniken zur Erzeugung von Deepfakes ständig verbessert werden, um der Erkennung zu entgehen. Organisationen wie die Deepfake Detection Challenge (DFDC) von Meta AI und Initiativen von Unternehmen wie Microsoft zielen darauf ab, den Stand der Erkennungstechnologie zu verbessern. Standard-Benchmarks und -Datensätze sind für die Entwicklung und Evaluierung dieser Erkennungsmodelle von entscheidender Bedeutung.
Deepfakes unterscheiden sich von der herkömmlichen Foto- oder Videobearbeitung (z. B. mit Adobe Photoshop oder After Effects) in erster Linie durch die Verwendung von Deep Learning, um auf der Grundlage gelernter Muster völlig neue, realistische Bild- oder Tonelemente zu erzeugen, anstatt nur vorhandene Pixel manuell oder durch einfachere Algorithmen zu verändern. Während sich die Bilderkennung auf die Identifizierung von Objekten oder Merkmalen innerhalb eines Bildes konzentriert, geht es bei der Deepfake-Technologie um die Synthese plausibler Bilder oder Videos. Sie stellt eine hochentwickelte Anwendung der generativen KI im visuellen Bereich dar. Das Missbrauchspotenzial unterstreicht die Bedeutung einer verantwortungsvollen KI-Entwicklung und des öffentlichen Bewusstseins.