Colunistas

Tá na cara! O Big Brother virou Big Data

Giselle Beiguelman Publicado em: 13 de março de 2020

Pesquisa da IBM sobre Reconhecimento Facial que utiliza como base imagens do Flickr com licença Creative Commons.

O mercado global em torno das tecnologias de Reconhecimento Facial deve dobrar nos próximos anos, passando de 3,2 bilhões de dólares para 7 bilhões em 2024. Os principais setores de aplicação são segurança, saúde e operações financeiras. O que isso tem a ver com você? Bem, de certa forma, somos todos patrocinadores dessa economia bilionária.

Não, não espere lucros e dividendos. Mas entenda de que forma somos todos os motores desse novo “big deal” da era digital. Reconhecimento Facial é uma tecnologia baseada em aprendizado de máquina, um dos pilares da Inteligência Artificial (IA). Funciona, basicamente, a partir de duas operações bastante complexas: rastreamento e extração.

O rastreamento é a tradução geométrica de características que são comuns a maior parte dos rostos. Nessa etapa, são detectados pontos nodais, como a distância entre os olhos, o comprimento do nariz e tamanho do queixo. Esses pontos, que aparecem com frequência na iconografia relacionada ao Reconhecimento Facial, são medidos por algoritmos treinados e o resultado dessas equações é a leitura facial. No processo de extração, as características individuais que particularizam um rosto e o diferenciam de outros são calculadas, também por algoritmos. Esses cálculos, que individualizam as imagens, são feitos por meio de comparações com outras imagens previamente armazenadas da pessoa.

Mas armazenadas onde? Na massa amorfa do Big Data que é organizada e disponibilizada nos datasets (conjunto de dados organizados). E quem fornece esses dados? Nós!

Importante ter em mente que o treinamento dos algoritmos que comandam o processo de reconhecimento demanda quantidades massivas de imagens. Elas são extraídas de registros oficiais como, por exemplo, as fotos coletadas durante a emissão do RG no Estado de São Paulo (como é o caso do recém inaugurado sistema da Polícia Civil estadual), de câmeras de vigilância instaladas no mundo todo, de sistemas de biometria (como os celulares e computadores que usam nossa carinha como senha) e dos quaquilhões de registros faciais que vamos largando pelas redes sociais, como Facebook, YouTube e Flickr.

Ah, você nem lembrava que o Flickr existia… Mas ali se encontra um manancial de fotos com licença Creative Commons que estão construindo datasets poderosíssimos. Sem dúvida, há uma distorção total da noção do que é a Creative Commons, uma licença para desbloquear direitos autorais, mas que não é adequada para proteger a privacidade individual. Algo que fica bastante evidente com a popularização das IAs, demandando o estabelecimento de normas éticas para sua implementação, um alerta feito pelo diretor executivo da Wikimedia, Ryan Merkley.

Afinal, quando alguém posta fotos do seu casamento, formatura, nascimento dos filhos, entre muitos e muitos outros selfies, não está pensando que isso será capturado por sistemas de catalogação a serviço de outras empresas, como as de vigilância. Nesse sentido, falar em Reconhecimento Facial diz respeito a uma nova dimensão de controle social pelas imagens que se impõe pela “fotografia inteligente.” Digitais, essas imagens “smart”, diz a Professora Sarah Kember (Goldsmith University fo London), são um complexo que combina a figuração com informação e biotecnologias.

A importância que a área de Reconhecimento Facial ganha no mercado é proporcional a sua relevância para o monitoramento do corpo onde quer que ele esteja. Quanto mais evoluem as tecnologias ambientais (Ambient Technologies), integrando-nos a sistemas computacionais e em rede, por meio de sensores, microfones e câmeras, mais decisivo é o processo de mapeamento do rosto. Dito de forma simples, o rosto é a nova digital. Uma vez identificado, nossa presença pode ser rastreada no espaço.

Há ainda uma série de falhas no sistema, por conta de um certo déficit de dados. Pasme: a montanha de imagens despejadas diariamente na Internet ainda não é suficiente para que se consiga capturar e computar tudo e tornar os sistemas mais eficientes. Variações de iluminação e diferenças significativas na qualidade das imagens são outros fatores que explicam os erros. Mas não é necessário ser pessimista demais (ou otimista, dependendo do ponto de vista), para imaginar que essas deficiências sejam brevemente sanadas.

Fichas antropométricas criadas pelo criminalista francês Alphonse Bertillon (1843-1914), criador do “Retrato Falado”.

A relação da fotografia com as tecnologias de controle na história é de longa data e uma arqueologia desse interminável casamento remonta ao retrato falado do criminologista francês Bertillon (1853-1914). Se fizéssemos esse exercício com foco no nosso presente, atualizando o seminal ensaio de Allan Sekula (The body as archive [O corpo como arquivo] October, 1986), ela desembocaria necessariamente nos procedimentos de Reconhecimento Facial.

Contudo, diferentemente das formas analógicas de registro fotográfico, as digitais são per se relacionais. Carregam consigo não só as informações do dispositivo, localização, horário de quem fotografou, mas também permitem rastrear quem está à nossa volta. Ou você nunca se surpreendeu com o Facebook, marcando quadradinhos nas suas imagens e perguntando quem são aquelas pessoas? Ou com o Google Photos, quando identifica seu filho desde a mais tenra idade nos seus álbuns e dos seus amigos?

Não me espanta que incorporemos essas funcionalidades sem estranhamento com muita rapidez. A cultura da vigilância está a tal ponto introjetada no nosso cotidiano que não nos intimida usar um vocabulário tão policialesco como “seguir” e ser “seguido” nas redes sociais. Outros indícios dessa diluição dos parâmetros de controle e vigilância no cotidiano são o farto uso de recursos de Reconhecimento Facial em aplicativos para composição de short videos, a nova febre do entretenimento on-line.

TikTok, um aplicativo chinês que terminou o ano de 2019 com 1 bilhão de downloads, e Kwai, uma empresa de Singapura, com 700 mil usuários ativos, são bons exemplos dessa tendência. Majoritariamente usados por jovens, o primeiro é uma rede social inteiramente baseada em micro vídeos. O segundo, uma plataforma de vídeo que, entre outros recursos, dispõe de um aplicativo que, ao receber sua foto, automaticamente busca pelo seu doppelganger (seu duplo ambulante) que flana em algum ponto do globo terrestre.

Tela do aplicativo Microvision, da empresa de tecnologia chinesa Tencent, lançado em dezembro de 2019

Para finalizar, lembre-se que a Tencent, também chinesa, dona do WeChat (uma espécie de mega WhatsApp), e quinta maior empresa de tecnologia do mundo, lançou no fim do ano passado o Microvision (Weishi) que dispõe de sofisticadas ferramentas, bem simples de usar, que permitem a edição do formato e características do rosto em vídeo.

O que essas empresas concorrentes entre si têm em comum? Tecnologias derivadas de sistemas de Reconhecimento Facial e multidões de usuários no mundo todo. Isso aponta para novas estéticas e novos formatos? Sim. Aponta para um novo capítulo da história do audiovisual, com potências sem precedentes para criar um vocabulário inédito de comunicação e produção de linguagens? Sim, outra vez.

Contudo, nos seus meandros implicam também um inequívoco processo de naturalização da vigilância. Não somente pela diluição de suas tecnologias no uso corriqueiro. Mas, acima de tudo, porque o princípio básico de melhoria dos recursos de Inteligência Artificial reside na sofisticação do aprendizado maquínico. Isso depende de datasets mais robustos, capazes de treinar máquinas para reconhecer os padrões com maior fidelidade. Conjuntos de dados, no entanto, não são tão artificiais assim, não brotam em computadores. São as crias qualificadas do Big Data nosso de cada dia, fornecidos por nós nas ruas, nos aeroportos, nos cafés e, cada vez mais, nas redes, onde compartilhamos nossas imagens.

Essa situação nos põe diante do mais desconcertante paradoxo da política das imagens na contemporaneidade: somos vistos (supervisionados) a partir daquilo que vemos (as imagens que produzimos e os lugares em que estamos). Ou seja: os grandes olhos que nos monitoram, veem pelos nossos olhos, sem que sejamos capazes de enxergá-los. ///

Giselle Beiguelman é colunista do site da ZUM, artista e professora da FAUUSP. Assina também a coluna Ouvir Imagens na Rádio USP e é autora de Memória da amnésia: políticas do esquecimento (2019), entre outros. Entre seus projetos recentes, destacam-se Odiolândia (2017), Memória da Amnésia (2015) e a curadoria de Arquinterface: a cidade expandida pelas redes (2015).

Tags: Big Data, fotografia digital, Inteligência artificial, Reconhecimento facial, vigilância

ZUM - revista de fotografia

Tá na cara! O Big Brother virou Big Data

Leia também