Colunistas

O deepfake de Elis Regina e as fantasmagorias das IAs

Giselle Beiguelman Publicado em: 11 de julho de 2023

Frame do filme publicitário da nova ID.Buzz, da VW, criado pela agência AlmapBBDO.

O comercial da Volkswagen (VW) que usou inteligência artificial para ressuscitar Elis Regina (1945-1982), cantando em dueto póstumo com sua filha Maria Rita, deu o que falar, suscitando polêmicas e mobilizando os mais diversos afetos. As polêmicas mais relevantes orbitaram em torno da ética das imagens, colocando em questão a relação da família com sua memória e a descontextualização de uma música composta durante a ditadura (“Como nossos pais”, Belchior, 1976) em uma peça publicitária. No plano afetivo, foram incontáveis os suspiros, saudades e emoções registradas nas redes sociais. No entanto, a pergunta que não quer calar é: que fantasmagorias do presente essas imagens deepfaked, como as de Elis, produzem?

A tecnologia de IA aplicada usa recursos de transferência de estilo (algoritmos de aprendizado de máquina chamados Redes Generativas Adversárias, em inglêsGenerative, Adversary Networks -GANs), empregadas no desenvolvimento de deepfakes. Isso envolve: 1) Coleta de dados (dezenas de milhares de imagens e vídeos de alta qualidade do rosto da pessoa que será “substituída” no vídeo); 2) Treinamento da rede (o momento em que os dados coletados conformam a rede generativa propriamente dita, a partir de duas partes principais: o gerador e o discriminador. O gerador é responsável por criar as imagens falsas, enquanto o discriminador tenta distinguir entre as imagens reais e falsas; 3) Aprendizado: durante o treinamento da GAN, um tipo de rede chamado de neural(suposta analogia com o cérebro humano), em que o gerador tenta criar imagens falsas que sejam tão convincentes que o discriminador não consiga mais distingui-las das imagens reais.

Conforme o treinamento avança, o gerador vai refinando suas capacidades de criação e aprendendo a reproduzir características, texturas e nuances presentes nas imagens reais. À medida que o discriminador é exposto a essas imagens falsas cada vez mais realistas, ele se torna menos capaz de diferenciá-las das imagens genuínas. Esse é o ponto em que se pode dizer que as imagens falsas superaram a veracidade do discriminador e que o sistema se torna capaz de gerar imagens mais reais que o real.

A partir daí temos os ingredientes para um deepfake, e começa o processo de alimentar um vídeo de origem, no caso o da dublê da Elis Regina, com o rosto da cantora. Todo o procedimento, para chegar a um grau de fidelidade como o atingido, demanda muitas operações. O da propaganda feita agência AlmapBBDO para VW demandou quase 2.500 horas de produção e profissionais de pelo menos três empresas. Importante ressaltar, ainda, que a substituição não é feita por técnicas de edição humana. É a inteligência artificial que substitui os frames do vídeo de origem pelos frames com o rosto gerado. O resultado final é um vídeo em que o rosto da pessoa original é substituído pelo rosto gerado pela IA e neste momento estamos diante de uma nova era das imagens técnicas.

Para além do homem sem a câmera, que conhecemos desde os ensaios do artista Joan Fontcuberta, no começo dos 2000, e a consolidação do que se convencionou chamar o pós-fotográfico, estamos também frente à emergência das “imagens- sem-o-humano”. É recorrente a observação que todo o processo começa com humanos. Afinal, são humanos que definem que o comercial dos 70 anos da VW no Brasil, anunciando sua versão elétrica da Kombi, batizada ID.Buzz, será feita com IAs. São humanos, também, os responsáveis pela rotulação de imagens, em condições de trabalho aviltantes, que são usadas na coleta dos dados para o processamento das redes neurais dos sistemas de inteligência artificial. Além disso, são também humanos que criaram o modelo de aprendizado de máquina que torna tudo isso possível. Isso posto, segundo os defensores desse ponto de vista, não seria correto chamar esse tipo de imagem de não-humana. Fecho, contudo, com a teórica Joanna Zylinska: são imagens não-humanas porque são imagens feitas por máquinas (daí o seu nome generativas, ou seja, fruto de dados que geram outros dados) para serem lidas por outras máquinas. Esse é um longo debate e foge ao ponto central deste texto, no qual a questão central é o impacto das IAs e, particularmente, das imagens generativas e deepfakes, na nossa compreensão de passado, presente e futuro.

As emoções que imagens imprevistas nos trazem, como as de Elis cantando com sua filha, Maria Rita, remontam ao impacto que a fantasmagoria teve ao longo do século 19. Palavra de várias definições, fantasmagoria refere-se aos espetáculos de “teatro de horror” do belga Etienne-Gaspard Robert (que ficou famoso pelo apelido Robertson), em que lanternas mágicas, com diferentes posicionamentos, criavam imagens distorcidas em recintos absolutamente escuros, no século 18. Mas refere-se também às diferentes fabulações de imagens técnicas que criaram a sensibilidade moderna. Como explica o teórico do cinema estadunidense Thomas Gunning, essa sensibilidade diz respeito a uma consciência dividida em que, sincronicamente, o espectador sabe que o que vê não é real e o espanto diante da aparição dos “fantasmas” que o cinema criou ao longo da história. Essa ambivalência entre o real e o fictício, diz Gunning, é o que leva as pessoas em filmes 3D a se afastar ou querer tocar em “objetos” que visualizam na projeção.

Figura que transita entre a presença e a ausência, o real e o virtual, o fantasma ocupa um lugar de destaque na história das imagens maquínicas. Oliver Grau e Jonathan Crary são alguns dos teóricos que mostraram a relação entre a fantasmagoria e os ilusionismos do século 19. O filósofo e historiador Georges Didi-Huberman sistematizou, em sua interpretação da obra de Aby Warburg, uma possibilidade de compreender a história da arte à luz das potências dos fantasmas das imagens. Esses fantasmas são as sobrevivências, as latências que reaparecem nas imagens por meio de “inconscientes do tempo”, como denomina o autor. Mas é o teórico brasileiro Erick Felinto quem situa o fantasma como chave de leitura para a cultura contemporânea, assombrada por fantasmas algorítmicos, “em que as imagens da tela possuem uma realidade mais intensa e vívida que a do nosso cotidiano” (A imagem espectral: Comunicação, cinema e fantasmagoria tecnológica, 2008).

Contudo, os fantasmas das IAs carregam consigo uma outra dinâmica, que faz dos deepfakes um agente potencialmente mais perverso. Como comentei em uma outra coluna publicada aqui na revista ZUM, eles trazem possibilidades de consolidação de novos negacionismos históricos, capazes de emplacar as mais estapafúrdias teses, como “provar” que a Apolo11 nunca chegou à Lua, tema do ótimo In Event of Moon Disaster (2019), citado nesse mesmo texto, e que leva os deepfakes ao limite, pois sequer há dublagem no filme. Nele o presidente Richard Nixon reporta, diretamente do Salão Oval da Casa Branca, o desastre ocorrido com a Apolo 11. Seu discurso foi escrito por William Safire e seria lido no caso de um acidente com a missão lunar de 1969, que, como se sabe, não aconteceu. Para tanto, a voz de Richard Nixon foi sintetizada, também com IA, e seus movimentos faciais e labiais coincidem exatamente com o que é dito.

Não é a primeira vez que vemos imagens adulteradas em circulação e faz bem pouco tempo que a Internet fartou-se de comentar as fotos de Donald Trump preso e do Papa Francisco desfilando com um casaco branco super fashion. A discussão que importa não é se as imagens podem iludir ou falsear, mas sobre as formas de instrumentalização do passado que se interpõem no jogo de temporalidades da propaganda da VW.

Há um deslocamento evidente aí da retrômania que contaminou a publicidade, o design e a cultura pop do início dos 2000, quando um verdadeiro tsunami de lambretas, cadeiras com pés palito, frigobars coloridos, carros antigos, remakes de filmes e relançamentos musicais fizeram sucesso. Nessa curva histórica que situou o início do século 21 numa esquina do passado, a tônica era uma busca pela saudade do não vivido.

No entanto, duas décadas do boom da memória como commodity e bem de consumo fácil, parece que o antropoceno, e a perda de perspectiva de futuro que ele traz consigo, foi o que nos restou. Algo que a assinatura da propaganda insinua, avisando que “o novo veio de novo”. Seriam essas as fantasmagorias das IAs? O assombro diante da impossibilidade de acessar o próprio presente, já que o futuro só existe como miragem de um passado que é, ele mesmo, remake do fake. ///

Giselle Beiguelman é colunista do site da ZUM, artista e professora da FAUUSP. É autora de Políticas da imagem: vigilância e resistência na dadosfera (2021) e Memória da amnésia: políticas do esquecimento (2019), entre outros. Site: desvirtual.com.

Tags: Aprendizado maquínico, Deepfake, Inteligência artificial, Publicidade

Leia também