Glosario

Deepfakes

Descubra la tecnología, las aplicaciones y los problemas éticos de los deepfakes, desde el entretenimiento hasta la desinformación. Conozca las soluciones de detección e IA.

Los deepfakes son vídeos, imágenes o grabaciones de audio altamente realistas, generados sintéticamente o manipulados, creados mediante técnicas avanzadas de Inteligencia Artificial (IA) y Aprendizaje Automático (AM ), en particular Aprendizaje Profundo (AD). El término es un portmanteau de "deep learning" y "fake". Estas técnicas permiten sustituir o sintetizar de forma convincente rostros, voces y acciones, haciendo que parezca que alguien ha dicho o hecho algo que en realidad nunca hizo. Aunque tiene su origen en las comunidades en línea, la tecnología deepfake ha evolucionado rápidamente, presentando tanto oportunidades creativas como importantes retos éticos.

Cómo se crean los deepfakes

La tecnología básica de muchos deepfakes son las redes neuronales generativas adversariales (GAN). Una GAN consta de dos redes neuronales que compiten entre sí: un generador que crea el contenido falso (por ejemplo, una imagen con una cara intercambiada) y un discriminador que intenta distinguir entre el contenido real y el falso. Mediante un entrenamiento iterativo, el generador se vuelve cada vez más experto en producir falsificaciones realistas que pueden engañar al discriminador y, en última instancia, a los observadores humanos. Otra técnica habitual son los autocodificadores, que aprenden representaciones comprimidas (codificaciones) de rostros a partir de grandes conjuntos de datos y luego decodifican estas representaciones para reconstruir o intercambiar rostros en los vídeos de destino. Crear deepfakes convincentes suele requerir una cantidad considerable de datos de entrenamiento (imágenes o clips de vídeo de los individuos objetivo) y recursos computacionales de GPU significativos, a menudo gestionados a través de plataformas como Ultralytics HUB.

Aplicaciones y ejemplos

La tecnología Deepfake tiene diversas aplicaciones, desde usos beneficiosos hasta actividades maliciosas:

  • Entretenimiento y medios de comunicación: Se utiliza en el cine para envejecer a los actores, recrear personajes históricos o mejorar el doblaje alterando los movimientos de los labios para que coincidan con el audio traducido. Por ejemplo, los cineastas utilizaron técnicas de deepfake en El mandaloriano para recrear digitalmente una versión más joven de un actor. Otro ejemplo es Synthesia, una plataforma que utiliza avatares de IA para crear vídeos de formación y presentaciones, generando así contenidos de vídeo sintéticos.
  • Educación y accesibilidad: Crear instructores virtuales o dar vida a personajes históricos con fines educativos. La clonación de voz puede ayudar a las personas que han perdido la voz.
  • Generaciónde datos sintéticos: Creación de conjuntos de datos artificiales para entrenar otros modelos de ML, especialmente en visión por ordenador, donde los datos reales pueden ser escasos o sensibles. Esto puede ayudar a mejorar la robustez de modelos como Ultralytics YOLO11 para tareas como el reconocimiento facial.
  • Desinformación y malicia: Difundir desinformación política, crear falsos apoyos o escándalos de famosos, generar pornografía no consentida y perpetrar fraudes mediante la suplantación de identidad (por ejemplo, falsificaciones de voz para autorizar transacciones). Todo ello plantea serias dudas sobre la ética de la IA y la privacidad de los datos.

Detección de Deepfake

El auge de las deepfakes ha estimulado la investigación de métodos de detección. Estos a menudo implican el entrenamiento de modelos de ML para identificar inconsistencias sutiles o artefactos característicos del contenido generado, como patrones de parpadeo inusuales, expresiones faciales poco naturales o inconsistencias en la iluminación o las sombras. Las técnicas de visión por ordenador (CV ) son fundamentales en este esfuerzo. Sin embargo, la detección es una carrera armamentística en curso, ya que las técnicas de generación de deepfakes mejoran continuamente para eludir la detección. Organizaciones como el Deepfake Detection Challenge (DFDC) de Meta AI e iniciativas de empresas como Microsoft pretenden avanzar en el estado de la tecnología de detección. Para desarrollar y evaluar estos modelos de detección es fundamental disponer de puntos de referencia y conjuntos de datos estándar.

Distinción de otras manipulaciones mediáticas

Los deepfakes se diferencian de la edición tradicional de fotos o vídeos (como el uso de Adobe Photoshop o After Effects) principalmente en su uso del aprendizaje profundo para generar elementos visuales o de audio totalmente nuevos y realistas basados en patrones aprendidos, en lugar de limitarse a alterar los píxeles existentes manualmente o mediante algoritmos más sencillos. Mientras que el reconocimiento de imágenes se centra en identificar objetos o características dentro de una imagen, la tecnología deepfake se centra en sintetizar imágenes o vídeos verosímiles. Representa una sofisticada aplicación de la IA generativa en el ámbito visual. El potencial de uso indebido subraya la importancia del desarrollo responsable de la IA y de la concienciación pública.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles