Descobre a tecnologia, as aplicações e as preocupações éticas dos deepfakes, desde o entretenimento à desinformação. Aprende soluções de deteção e de IA.
Os deepfakes são vídeos, imagens ou gravações de áudio altamente realistas, gerados ou manipulados sinteticamente, criados com recurso a técnicas avançadas de Inteligência Artificial (IA) e de Aprendizagem Automática (AM), em especial a Aprendizagem Profunda (AP). O termo é um portmanteau de "deep learning" e "fake". Estas técnicas permitem a substituição ou síntese convincente de rostos, vozes e acções, fazendo com que pareça que alguém disse ou fez algo que na realidade nunca fez. Embora tenha tido origem em comunidades em linha, a tecnologia deepfake evoluiu rapidamente, apresentando tanto oportunidades criativas como desafios éticos significativos.
A tecnologia central por trás de muitos deepfakes envolve Redes Adversárias Generativas (GANs). Uma GAN consiste em duas redes neurais concorrentes: um gerador que cria o conteúdo falso (por exemplo, uma imagem com um rosto trocado) e um discriminador que tenta distinguir entre conteúdo real e falso. Através de treino iterativo, o gerador torna-se cada vez mais apto a produzir falsificações realistas que podem enganar o discriminador e, em última análise, os observadores humanos. Os autoencoders são outra técnica comum, aprendendo representações comprimidas (codificações) de rostos a partir de grandes conjuntos de dados e depois descodificando essas representações para reconstruir ou trocar rostos em vídeos alvo. A criação de deepfakes convincentes requer muitas vezes dados de treino substanciais (imagens ou clips de vídeo dos indivíduos alvo) e GPU e recursos computacionais GPU significativos, muitas vezes geridos através de plataformas como o Ultralytics HUB.
A tecnologia Deepfake tem uma série de aplicações, desde utilizações benéficas a actividades maliciosas:
O surgimento de deepfakes estimulou a investigação de métodos de deteção. Estes envolvem frequentemente o treino de modelos de ML para identificar inconsistências subtis ou artefactos caraterísticos do conteúdo gerado, tais como padrões invulgares de pestanejar, expressões faciais não naturais ou inconsistências na iluminação ou nas sombras. As técnicas de Visão por Computador (CV) são fundamentais para este esforço. No entanto, a deteção é uma corrida armamentista contínua, uma vez que as técnicas de geração de deepfake melhoram continuamente para evitar a deteção. Organizações como o Deepfake Detection Challenge (DFDC) da Meta AI e iniciativas de empresas como a Microsoft têm como objetivo fazer avançar o estado da tecnologia de deteção. Os benchmarks e conjuntos de dados padrão são cruciais para desenvolver e avaliar esses modelos de deteção.
Os deepfakes diferem da edição tradicional de fotos ou vídeos (como o uso do Adobe Photoshop ou do After Effects) principalmente no uso do deep learning para gerar elementos visuais ou sonoros totalmente novos e realistas com base em padrões aprendidos, em vez de apenas alterar os pixels existentes manualmente ou por meio de algoritmos mais simples. Enquanto o reconhecimento de imagens se centra na identificação de objectos ou caraterísticas numa imagem, a tecnologia deepfake centra-se na síntese de imagens ou vídeos plausíveis. Representa uma aplicação sofisticada de IA generativa no domínio visual. O potencial de utilização indevida sublinha a importância do desenvolvimento responsável da IA e da sensibilização do público.