Glossar

Deepfakes

Entdecken Sie die Technologie, Anwendungen und ethischen Bedenken von Deepfakes, von Unterhaltung bis hin zu Fehlinformationen. Lernen Sie Erkennungs- und KI-Lösungen kennen.

Deepfakes sind sehr realistische, synthetisch erzeugte oder manipulierte Videos, Bilder oder Audioaufnahmen, die mit fortschrittlichen Techniken der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML), insbesondere Deep Learning (DL), erstellt wurden. Der Begriff ist ein Portmanteau aus "Deep Learning" und "Fake". Diese Techniken ermöglichen den überzeugenden Ersatz oder die Synthese von Gesichtern, Stimmen und Handlungen, so dass es so aussieht, als ob jemand etwas gesagt oder getan hätte, was er in Wirklichkeit nicht getan hat. Die ursprünglich aus Online-Communities stammende Deepfake-Technologie hat sich rasch weiterentwickelt und bietet sowohl kreative Möglichkeiten als auch erhebliche ethische Herausforderungen.

Wie Deepfakes erstellt werden

Die Kerntechnologie hinter vielen Deepfakes sind Generative Adversarial Networks (GANs). Ein GAN besteht aus zwei konkurrierenden neuronalen Netzen: einem Generator, der den gefälschten Inhalt erzeugt (z. B. ein Bild mit einem vertauschten Gesicht), und einem Diskriminator, der versucht, zwischen echten und gefälschten Inhalten zu unterscheiden. Durch iteratives Training wird der Generator immer geschickter darin, realistische Fälschungen zu erzeugen, die den Diskriminator und schließlich den menschlichen Beobachter täuschen können. Eine weitere gängige Technik sind Autoencoder, die komprimierte Darstellungen (Kodierungen) von Gesichtern aus großen Datensätzen lernen und diese Darstellungen dann dekodieren, um Gesichter in Zielvideos zu rekonstruieren oder auszutauschen. Die Erstellung überzeugender Deepfakes erfordert häufig umfangreiche Trainingsdaten (Bilder oder Videoclips der Zielpersonen) und erhebliche GPU-Rechenressourcen, die häufig über Plattformen wie Ultralytics HUB verwaltet werden.

Anwendungen und Beispiele

Die Deepfake-Technologie hat eine Reihe von Anwendungen, die von nützlichen bis zu bösartigen Aktivitäten reichen:

  • Unterhaltung und Medien: In der Filmproduktion zur Alterung von Schauspielern, zur Nachbildung historischer Figuren oder zur Verbesserung von Synchronisationen, indem die Lippenbewegungen an den übersetzten Ton angepasst werden. Zum Beispiel haben Filmemacher Deepfake-Techniken in Der Mandalorianer um eine jüngere Version eines Schauspielers digital nachzubilden. Ein weiteres Beispiel ist Synthesia, eine Plattform, die KI-Avatare für die Erstellung von Trainingsvideos und Präsentationen einsetzt und so synthetische Videoinhalte generiert.
  • Bildung und Zugänglichkeit: Erstellung virtueller Lehrkräfte oder Erweckung historischer Persönlichkeiten zu Bildungszwecken. Das Klonen von Stimmen kann Menschen helfen, die ihre Stimme verloren haben.
  • Synthetische Datenerzeugung: Erstellung künstlicher Datensätze für das Training anderer ML-Modelle, insbesondere im Bereich der Computer Vision, wo reale Daten knapp oder empfindlich sein können. Dies kann dazu beitragen, die Robustheit von Modellen wie Ultralytics YOLO11 für Aufgaben wie Gesichtserkennung zu verbessern.
  • Desinformation und Böswilligkeit: Verbreitung politischer Fehlinformationen, Fälschung von Prominentenempfehlungen oder -skandalen, Erstellung von Pornografie ohne Einwilligung und Betrug durch Nachahmung (z. B. Stimmfälschungen zur Autorisierung von Transaktionen). Dies wirft ernste Bedenken hinsichtlich der Ethik der KI und des Datenschutzes auf.

Deepfake-Erkennung

Das Aufkommen von Deepfakes hat die Erforschung von Erkennungsmethoden vorangetrieben. Dabei werden häufig ML-Modelle trainiert, um subtile Unstimmigkeiten oder Artefakte zu erkennen, die für generierte Inhalte charakteristisch sind, z. B. ungewöhnliche Blinzelmuster, unnatürliche Gesichtsausdrücke oder Unstimmigkeiten bei Beleuchtung oder Schatten. Computer Vision (CV)-Techniken sind für diese Bemühungen von zentraler Bedeutung. Die Erkennung ist jedoch ein ständiges Wettrüsten, da die Techniken zur Erzeugung von Deepfakes ständig verbessert werden, um der Erkennung zu entgehen. Organisationen wie die Deepfake Detection Challenge (DFDC) von Meta AI und Initiativen von Unternehmen wie Microsoft zielen darauf ab, den Stand der Erkennungstechnologie zu verbessern. Standard-Benchmarks und -Datensätze sind für die Entwicklung und Evaluierung dieser Erkennungsmodelle von entscheidender Bedeutung.

Unterscheidung von anderen Medienmanipulationen

Deepfakes unterscheiden sich von der herkömmlichen Foto- oder Videobearbeitung (z. B. mit Adobe Photoshop oder After Effects) in erster Linie durch die Verwendung von Deep Learning, um auf der Grundlage gelernter Muster völlig neue, realistische Bild- oder Tonelemente zu erzeugen, anstatt nur vorhandene Pixel manuell oder durch einfachere Algorithmen zu verändern. Während sich die Bilderkennung auf die Identifizierung von Objekten oder Merkmalen innerhalb eines Bildes konzentriert, geht es bei der Deepfake-Technologie um die Synthese plausibler Bilder oder Videos. Sie stellt eine hochentwickelte Anwendung der generativen KI im visuellen Bereich dar. Das Missbrauchspotenzial unterstreicht die Bedeutung einer verantwortungsvollen KI-Entwicklung und des öffentlichen Bewusstseins.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert