Ensaios

Deixando o universo fotográfico

Fred Ritchin Publicado em: 6 de maio de 2022

Imagine um encontro via Zoom com, neste caso, todos os retângulos ocupados por imagens sintéticas que simulam fotografias e que depois são usadas como avatares. Essas imagens foram fabricados usando a Rede Adversária Generativa (em inglês generated adversarial network, GAN) StyleGAN2 no site thispersondoesnotexist.com em 19 de fevereiro de 2022.

O advento do digital nos trouxe uma mudança de paradigma no qual a função essencial de testemunho da fotografia foi significativamente comprometida, em parte pela emergência de imagens sintéticas que podem, de forma convincente, representar pessoas e lugares que nunca existiram. No entanto, este ensaio foi escrito antes da invasão da Ucrânia pela Rússia, quando muitas das imagens que circulam agora, que falsamente alegam descrever o que está acontecendo durante essa guerra horrenda, são, na realidade, descontextualizadas, alteradas ou fabricadas, revelando os crescentes desafios das mídias baseadas em lentes como árbitras dos eventos mundiais e da nova era na qual nos encontramos.

Recentemente, num dia de inverno em Nova York, cercado por muitas pessoas mascaradas vagando pelo Metropolitan Museum of Art, entrei em uma galeria dedicada a pinturas inglesas do século 18. Lá encontrei duas jovens, seus casacos embolados sobre um banco próximo, se revezando para posar na frente das pinturas, imitando os gestos das pessoas retratadas nos quadros.

Movendo-se pela sala, uma fotografava a outra enquanto murmurava instruções de como melhorar a pose. Diferentemente de nós, que marchávamos com a intenção de ver a maior quantidade possível de arte, elas pareciam bem felizes e satisfeitas ao executarem seu intricado balé com seus celulares à mão.

Como Alice, a personagem de Lewis Carroll, elas atravessaram um espaço que se abria para um mundo além, ligado internamente à aura dessas famosas pinturas. E, por sua vez, elas ainda entravam em um outro mundo de imagens, o das mídias sociais, no qual elas celebravam e compartilhavam suas experiências, um universo paralelo no qual as imagens de dois séculos poderiam se fundir.

Elas tinham criado um mundo virtual à sua escolha, combinando o tempo e o espaço, ressoando com aparências, onde as ações não têm as consequências físicas e a imortalidade é presumida. As fotografias produzidas, embora feitas por uma câmera, não tinham a intenção de registrar o visível e interrogar o real, como a fotografia tinha sido empregada antes, mas em vez disso para torná-lo maleável e amorfo. Elas tinham usado suas câmeras para emigrar.

Anteriormente, a relação dialética entre o fotógrafo, a câmera e aquilo que existia era de central importância para a mídia, assim como era crítica para a sua leitura.

Enquanto um fotógrafo escolhia um ponto de vista e um momento para disparar o obturador, a câmera e suas lentes serviam como lastro e contraponto. Observadores poderiam interpretar a fotografia de várias formas, certos de que era um registro do visível, revogando ou contornando a intenção inicial do fotógrafo.

Essa dependência da câmera e da subjetividade do fotógrafo são reconhecidas no prefácio de Henri Cartier-Bresson ao seu livro muito influente de 1952, O momento decisivo: “Essas fotografias tiradas ao acaso por uma câmera errante não tentam de modo algum dar uma imagem geral de quaisquer um dos países nos quais essa câmera esteve”.

Imagens geradas por inteligência artificial algumas vezes se parecem com fotografias, mas com resultados inesperados. Fred Ritchin usou um gerador de texto-para-imagem que permite que uma pessoa insira uma frase e o software produza uma imagem em dois minutos. Imagem: “A família perfeita”.

Quase um século antes, em 1859, o crítico Charles Baudelaire depreciou essa nova mídia logo após sua invenção, chamando-a de não mais que um dispositivo de registro, sugerindo que ela seria utilizada por “secretários e escriturários de seja lá quem for que precise de uma exatidão factual absoluta em sua profissão… Mas se for permitido invadir o domínio do impalpável e do imaginário, acima de tudo daqueles cujo valor depende somente da adição de algo à alma de um homem, então ela será muito pior para nós”.

Entretanto o que Baudelaire ignorou foi a importância estenográfica da fotografia para a sociedade como uma testemunha verossímil, em grande parte devido a mesma “exatidão factual” que ele considerou tão limitada. O velho clichê, “a câmera não mente” efetivamente não inclui o fotógrafo, nem um pincel ou lápis.

Mas essa fidelidade ao visível, embora incompleta, foi rompida drasticamente pelo advento do digital. Feita de tons contínuos em vez de pixels discretos, a fotografia analógica não convida a grandes modificações além das mudanças no contraste e alguns cortes no enquadramento. As dificuldades do retoque manual tornavam o processo extremamente exigente e demorado, além de caro para a maioria, e as alterações feitas geralmente eram relativamente fáceis de detectar.

A arquitetura da fotografia analógica não convidava a tal reinvenção em larga escala, e sua força reside amplamente em deixá-la em paz. “Uma fotografia não é apenas uma imagem (como uma pintura é uma imagem), uma interpretação do real; é também um traço, algo diretamente decalcado do real, como uma pegada ou uma máscara mortuária”, escreveu Susan Sontag nos anos 1970.

Agora os milhões de pixels que compõem a fotografia podem ser facilmente e quase imperceptivelmente modificados por um software, transformando a fotografia em um mosaico que pode ser embaralhado de acordo com a preferência de alguém. A transformação da fotografia em uma mídia mais sintética, como a pintura, tem priorizado sua modificação enquanto diminuiu a importância de seu registro inicial. “A câmera não mente” tem pouca ressonância atualmente.

Uma fotografia que funciona principalmente como a expressão de uma cena sem alterações significativas pode muito bem precisar ser distinguida, possivelmente por uma moldura especial ou um símbolo, de um conjunto de imagens similares que tem sido consideravelmente manipuladas ou, como veremos, criadas por algoritmos para simular fotografias sem o envolvimento de uma câmera. Um grande percentual da fotografia mais convencional agora é feita não por humanos, mas por máquinas, para que o código digital da imagem possa ser lido por ouras máquinas, tal como acontece na vigilância. O paradigma mudou.

Se “o meio é a mensagem” como Marshal McLuhan afirmou nos anos 1960, então a mensagem da fotografia se tornou a maleabilidade daquilo que é considerado real em vez de seu registro e contemplação. (Preocupado com essa eventualidade, dei o título In Our Own Image: The Coming Revolution in Photography ao livro que publiquei em 1990).

Essa tendência é a apoteose do consumismo, na qual consumidores (ou amadores capazes de produzir e consumir imagens) conseguem o que desejam, ou para ser mais exato, o que eles são persuadidos por diversas formas de mídia a desejarem. Enquanto os produtos oferecidos para o consumo são geralmente abaixo do padrão, ou nocivo ao bem-estar do consumidor, isso é geralmente é tratado como irrelevante pelos meios nos quais eles são expostos – um tomate macio e de boa aparência, mas sem sabor, acaba prevalecendo sobre um enrugado que seja mais saboroso ou mais nutritivo.

Essencialmente, os indivíduos estão sendo encorajados a reconstituir o mundo para fazê-lo parecer diferente embora, em grande parte, continuem impotentes, destinados a serem deidades menores em suas próprias cosmologias.

“Uma sociedade capitalista exige uma cultura baseada em imagens. Ela precisa fornecer grandes quantidades de entretenimento para estimular compras e anestesiar dos sofrimentos de classe, raça e sexo”. Afirmou Sontag em Sobre fotografia há quase meio século. Ela prossegue com um raciocínio que é ainda mais pertinente hoje: “A mudança social é substituída pela mudança de imagens. A liberdade de consumir uma pluralidade de imagens é igualada à liberdade em si. O estreitamento da liberdade de escolha política para a liberdade econômica de consumo exige a produção e o consumo ilimitado de imagens”.

A “alteração nas imagens” que ela descreve entrou em metástase para além de qualquer referência ao real. Agora, enquanto comprime o tamanho de um arquivo de imagem digital, um software comumente extrapola o número de pixels na foto para produzir um determinado efeito. Elas não são mais registros reais do que estava visível, mas imagens feitas de acordo com o que o software determina como aquela cena deveria parecer.

E em uma conexão ainda mais ampla, não há somente diversos filtros digitais que podem ser usados para fazer alguém parecer mais magro ou mais atraente, ou para modificar uma cena para fazê-la parecer retrô, como se fosse fotografada décadas antes ou vice-versa, mas existem algoritmos que dispensam totalmente a necessidade de observação real para produzir imagens fotograficamente realistas de pessoas e situações que nunca existiram.

Tais imagens sintéticas recentemente começaram a se infiltrar extensivamente na esfera da imprensa, usadas de diversas formas.

*O uso de imagens sintéticas para criar falsos bloqueiros anti-Ucrânia, captura de tela feita às 18h29 do dia 28 de fevereiro de 2022 do Twitter.*

Uma pessoa poderá fazer com que um local de trabalho pareça mais diverso ou que seu círculo social pareça mais animado. Produzidas rapidamente e em quantidades imensas, a existência de tais imagens tornará mais suspeita a credibilidade das fotografias produzidas com lentes, um efeito desestabilizante chamado “o dividendo do mentiroso” no qual os verdadeiros registros podem ser desconsiderados mais facilmente como um provável fake. Como resultado, tudo o que é inconveniente ou desagradável, ou exige uma resposta como indivíduo ou cidadão, como desastres naturais ou um massacre, podem ser negados como jamais tendo acontecido, e o mesmo ceticismo pode ser aplicado ao arquivo histórico.

Sem dúvida serão os autocratas e extremistas de um lado ou do outro quem mais se beneficiarão de um colapso da credibilidade das mídias baseadas em lentes. Por exemplo, Kim Phúc, de nove anos, estava realmente correndo pela estrada com a pele queimada por napalm como apareceu na famosa fotografia de Nick Ut da Guerra do Vietnã, uma imagem que fez tantas pessoas se voltarem contra o conflito?

Goerge Floyd foi realmente sufocado brutalmente pelo policial Derek Chauvin em Minneapolis em 2020, o joelho de Chavin em seu pescoço, enquanto outros oficiais apenas assistiam, ou isso foi inventado pela imaginação de alguém?

Mais uma vez, podem pensar que a terra é plana.

Atualmente, atraídos pela verossimilhança das imagens produzidas por mídias baseadas em lentes e pela semelhança que as imagens sintéticas têm com elas, líderes de países já fazem discursos fabricados. E celebridades, quase exclusivamente mulheres, são incluídas em filmes pornográficos. Dada a disponibilidade de diversas imagens online, as mesmas simulações podem ser feitas de qualquer um, incluindo um colega de turma ou do trabalho, um desconhecido ou até mesmo de uma criança.

Os danos para a reputação e a autopercepção de valor das pessoas serão profundos, como o uso frequente da “pornografia de vingança” contra antigas parceiras já tem demonstrado.

Além disso, tais imagens customizadas podem ser usadas como armas para encorajar o racismo e a misoginia, assim como fraturar comunidades e provocar conflitos violentos, enfraquecendo processos democráticos. E enquanto há pesquisadores trabalhando para serem capazes de identificar rapidamente essas imagens sintéticas, é improvável que os processos técnicos, as leis contemporâneas ou cursos rápidos de letramento midiático, por si só, sejam o suficiente para lidar com os desafios que emergem conforme essas imagens estejam mais difundidas.

Aqueles que necessitam de ajuda internacional, sofrendo com a fome, conflitos, epidemias, desastres ambientais e outras catástrofes serão os que mais sofrerão. No entanto, outros também serão afetados negativamente, uma vez que uma maior desconexão dos problemas e eventos contemporâneos exacerba a ansiedade e a passividade, tornando ainda mais difícil lidar com o que está acontecendo. Os atuais ataques de “fake news” são um aspecto feio dessa transição.

Como resultado, o mundo virtual será ampliado para compensar a falta de agência no mundo físico. Ele provavelmente será povoado por muito mais seres sintéticos – alguns serão criados para servir como avatares, feitos para se parecerem com os indivíduos que eles representam, enquanto outros serão criados para terem aparência e atitudes completamente diferentes, tornando as relações sociais online ainda mais incertas.

Incapazes de confiar nos outros, mais pessoas possivelmente poderão se tornar mais introvertidas e dedicadas apenas a pequenos grupos. A infraestrutura global de comunicação online paradoxalmente as fará se sentirem mais isoladas e sozinhas.

Imagine, por exemplo, uma reunião via Zoom com vários retângulos ocupados por avatares, ali para alcançar os objetivos específicos daqueles a quem representam ou talvez alguns sejam o próprio software. Um site já recomenda que o participante “use fotos geradas que se assemelhem a sua cor de pele, idade, gênero, comprimento de cabelo, etc” e as use como forma de “dar uma ideia da sua aparência para as pessoas, enquanto ainda protege sua identidade”.

Tais imagens sintéticas, geralmente confundidas com fotografias, irão transformar filmes e videogames, uma vez que se pode substituir os rostos de diferentes tipos de personagens por outros, incluindo os de pessoas conhecidas.

Este comportamento não está confinado apenas às telas: enquanto isso, nas ruas, alguns podem escolher ou serem forçados a usarem lentes de contato ou óculos programados para substituir imagens alternativas para ocultar certos aspectos do ambiente – uma pessoa sem teto sentada na calçada substituída por um hidrante, ou pessoas de um grupo racial substituídas por um outro grupo. Pessoas com determinadas convicções religiosas, ou de outro tipo, poderiam utilizar softwares treinados para transformar uma mulher seminua de biquini em um anúncio de férias numa ilha na imagem de uma palmeira, por exemplo.

Steve Man, um autodeclarado ciborgue, tem chamado isso de uma estratégia de “realidade reduzida”. Pode-se ir além e chamar isso de a materialização de um universo paralelo de acordo com certas preferências ideológicas.

A publicação de Veles, livro mais recente do fotógrafo Jonas Bendiksen, da agência Magnun, se propõe a documentar uma cidade no norte da Macedônia conhecida como um hub de disseminação de desinformação, com a intenção de iniciar um debate sobre o papel das imagens sintéticas e da inteligência artificial por trás delas. O livro parece ser uma reportagem fotográfica convencional, mas todas as imagens de pessoas, embora não identificadas como tais, foram criadas por um software programado por Bendiksen com esse objetivo; e o texto de 5 mil palavras que acompanha as imagens também foi produzido por uma inteligência artificial.

Surpreendentemente, ninguém percebeu o subterfúgio, nem sequer seus colegas profissionais, e meses depois o fotógrafo se viu obrigado a reconhecer o que fez, uma confissão pela qual ele foi criticado por aqueles que viram seu projeto como uma traição.

Mais recentemente, a Smarterpix, um banco de imagens e agência fotográfica operada pela PantherMedia, fez uma parceria com a empresa de tecnologia VAIsual para oferecer o primeiro conjunto de imagens licenciadas de banco de imagens que consistem em retratos realistas de pessoas que não existem.

De acordo com uma reportagem no site PetaPixel, todas essas imagens “podem ser geradas com um fundo verde permitindo que elas sejam facilmente fundidas ou inseridas em outros elementos sintéticos ou em fundos fotográficos da vida real para criar conteúdos inteiramente novos”. Michael Osterreider, CEO da VAIsual, disse que considera as imagens sintéticas “o futuro da indústria do banco de imagens” e afirmou que “estima que nos próximos cinco a dez anos, 95% de todas as imagens serão mídias geradas por inteligência artificial”.

Segundo a reportagem de Jaron Schneider, a PantherMedia argumenta que essas imagens “representam a próxima geração de conteúdo sem fricção”, uma vez que eles “não exigem um modelo de divulgação e podem ser utilizadas em qualquer contexto, e aqueles que fazem download das imagens não precisam mais conferir os termos de uso ou temer as custas de processos judiciais”.

De forma semelhante, Mark Milstein, CEO da Microstock Solutions, tinha sugerido no ano passado a Gestão de Ativos Digitais (em inglês, Digital Asset Managements, DAMs) “que oferecessem opções de mídia sintética que darão aos usuários a capacidade de gerar volumes infinitos de fotografias únicas, feitas sob demanda, com baixo ou nenhum custo, sem restrições legais ou preocupações com concorrentes usando a mesma imagem… A mídia sintética, fotos geradas por poderosos algoritmos, serão a alma e o coração das DAMs. Procurar por conteúdo num banco de imagens será uma coisa do passado”.

O que é consideravelmente mais inovador e esclarecedor do que essas simulações são as imagens geradas por inteligência artificial que deveriam se parecer com fotografias, mas não parecem, e podem comunicar outros tipos de percepções.

Imagens sintéticas do exército russo na Segunda Guerra Mundial feitas por Alexey Yurenev para o seu projeto “Heroi silencioso” com a colaboração da rede neural StyleGan2 treinada em uma base de dados de imagens da Segunda Guerra Mundial. Imagens 1 e 2: “Soldado” e “Resultado da batalha”.

Os dois geradores de imagens a partir de texto que usei, nos quais se insere uma frase e o software responde produzindo uma imagem em um ou dois minutos, são um projeto inovador de inteligência artificial de Alexey Yurenev. O “Silent Hero” (Herói silencioso) explora aspectos em grande parte desconhecidos da Segunda Guerra Mundial, a partir da experiência de seu avô, um homem pouco comunicativo, que serviu como soldado russo, para produzir imagens que são sinistras, assombrosas, estranhamente ambíguas, matéria de sonhos e pesadelos.

Essas imagens são inquietantes de maneiras que as fotografias não são, como se o subconsciente e o subliminar pudessem ser delineados, concretizando uma ampla paisagem psicológica efêmera que anteriormente só foi conhecida pelo indivíduo que a experimentou.

Usando um gerador de imagens a partir de textos pode-se escrever, por exemplo, “um homem assustador me seguiu por uma rua escura” e o software vai produzir uma imagem com as feições de uma figura que parece um homem, mas que não se parece com uma fotografia “real” e sim algo mais assustador, como se tivesse saído das profundezas do inconsciente de alguém. Sem dúvida esses geradores começarão a desaparecer em breve, conforme as inteligências artificiais se tornarem capazes de simular fotografias com mais precisão. Elas precisariam do botão “sonho” e “pesadelo”, assim como um de “memória”, que induziria o software a continuar a produzir essas tentativas quase inimagináveis.

Sem dúvida essas imagens vão modificar nossa compreensão e as relações em nossas psiquês, assim como em outros domínios. No final, o impacto das imagens sintéticas pode ser ainda mais profundo do que as revoluções na consciência causadas anteriormente pela fotografia, que tem sido responsável por colocar a visão em primeiro plano em relação aos outros sentidos, comprimindo o espaço, destacando a fração de segundo em que parece prender o tempo, fazendo o muito distante e o excessivamente pequeno visíveis, e concretizando o presente como passado, substituindo a memória humana.

Essas mudanças paradigmáticas deveriam nos desafiar com questões urgentes a respeito do papel da fotografia, assim como o das imagens sintéticas. A função de testemunha crível das mídias baseadas em lentes se manterá no futuro? E se não, vamos substitui-la pelo quê? Há formas mais holísticas e saudáveis de utilizar as mídias baseadas em lentes e as imagens sintéticas?

Certamente aqueles que fotografarem no futuro terão que considerar outras abordagens do meio se a autenticidade e a credibilidade forem suas grandes preocupações. Poderão ter que refletir sobre como melhor contextualizar suas imagens enquanto se tornam mais transparentes em suas práticas, como utilizar outras mídias como vídeo e som em sinergia com a fotografia enquanto criam estratégias narrativas que se relacionam melhor com seus públicos. E como colaborar com mais proximidade com aqueles que retratam para representá-los com mais exatidão, entre outras considerações.

Cada fotógrafo precisar reconhecer ainda mais sua autoria, sua responsabilidade não só com suas imagens, mas também com a maneira em que elas são apresentadas e como são entendidas.

Finalmente, ao mesmo tempo em que deixamos o universo fotográfico que conhecemos podemos começar a discutir como transicionar para um mundo que é menos baseado em sua representação como uma imagem? ///

Tradução do inglês de Stephanie Borges.

Artigo publicado originalmente no site ReVue.

Fred Ritchin é escritor, professor, editor e curador. Escreveu três livros sobre o futuro das imagens: In Our Own Image (1990), After Photography (2008) e Bending the Frame (2013). Criou a primeira versão multimídia do The New York Times (1994-95) e também concebeu e editou o primeiro foto-ensaio documentário não linear para a Times online, “Bósnia: Uncertain Paths to Peace” (1996), indicado ao prêmio Pulitzer. É reitor emérito do International Center of Photography e atualmente leciona em várias instituições, dedicado especialmente a estratégias de imagens para os direitos humanos. O site TheFifthCorner.org que reúne seus textos, palestras e outros recursos, foi lançado em 2020.

Tags: fake news, filosofia da imagem, Imagem sintética, pós-fotografia

ZUM - revista de fotografia

Deixando o universo fotográfico

Leia também