Ciência forense na era da inteligência artificial -

Anderson Rocha é professor do Instituto da Computação da Unicamp e coordenador do laboratório de Inteligência Artificial Recod.ai. Ele está entre os 20 pesquisadores mais influentes do Brasil e integra o grupo dos 2% de cientistas mais citados do mundo na área de ciência da computação. Nessa entrevista, explica como a área forense digital evoluiu nas últimas décadas, os desafios trazidos pela IA e o impacto dessas tecnologias na sociedade.

Por Juliana Vicentini

O que é a área forense digital e por que se tornou tão importante em um mundo cada vez mais conectado?

A ciência forense é muito importante de forma geral, porque, infelizmente, há criminosos. A partir do momento em que o mundo se tornou mais digital, houve também a necessidade de identificar os crimes nesse ambiente e elaborar um conjunto de técnicas para lidar com eles. De forma geral, ela procura traços no mundo digital para responder: O que aconteceu? Como ocorreu? Quem cometeu? Por quê? Geralmente é muito difícil responder o porquê, então focamos especialmente nas três primeiras perguntas.

Quais tipos de conteúdo e crimes podem ser investigados por meio da forense digital?

Depende do cenário e dos tipos de mídia como imagem, som, vídeo ou texto. Para cada uma delas há diferentes tipos de crime. Por exemplo, se há falsificação de um resultado, de uma imagem ou de um vídeo, analisamos com técnicas de IA se houve alguma edição.

Se o crime é um golpe no WhatsApp via áudio é preciso verificar se esse áudio, por exemplo, foi falsificado. Já no caso de um phishing – envio de uma mensagem textual para um cliente de um banco querendo suas credenciais, por exemplo – temos que identificar se o texto em si foi criado, modificado ou manipulado. Para alguém tentando invadir um celular utilizando a face do dono, há um problema de spoofing.

Fake news não são necessariamente crimes, dependendo do contexto, mas é algo que temos interesse em identificar, pois representam um problema para a democracia e para a confiança na mídia digital. Nesse caso, analisa-se em conjunto texto, som, imagem e vídeo.

Quais eram os principais indícios utilizados para identificar fraudes digitais antes da era da IA generativa?

Há 10 ou 15 anos basicamente utilizávamos técnicas de processamento de imagens e de áudio para identificar pistas. Se uma imagem tivesse sido falsificada, olhávamos inconsistências geométricas, iluminação e sombras. Para áudios, buscávamos problemas de transições e na frequência da voz.

Isso era quando tínhamos menos informações e muito mais controle do que acontecia. A manipulação exigia um certo conhecimento por parte do usuário. Era preciso um especialista em áudio para criar algo incrível. Ele tinha que ser, por exemplo, especializado em Photoshop para criar uma falsificação fotográfica.

Com a popularização da IA generativa, quais são os principais desafios enfrentados pela forense digital?

Qualquer pessoa pode criar uma falsificação incrível utilizando IA generativa, com modelos presentes no ChatGPT, Claude, Midjourney, separadamente, ou o DALL-E no ChatGPT e vários outros. Há um refinamento cada vez maior na geração dessas imagens. Assim, nem sempre você consegue pegá-las com técnicas de processamento tradicionais. Precisamos de muitos exemplos para treinar modelos, soluções e algoritmos capazes de identificar distorções e inconsistências. No caso de imagens, elas estão em iluminação, sombras, vizinhança de pixel e estrutura. Precisamos combater a falsificação também utilizando IA treinada para isso.

Como a própria IA pode ser usada para detectar conteúdos falsificados?

Temos duas grandes linhas hoje funcionando bem na literatura e no nosso laboratório. A IA discriminativa, que analisa pistas de baixo nível – como quantidade de pixels ou inconsistências presentes na imagem, vídeo ou áudio. Um exemplo é a propriedade de ruído (pontos), bastante diferente em fotos tiradas com câmeras de verdade e em imagens geradas totalmente no computador. São ruídos e assinaturas diferentes, porque na câmera há interação entre luz, fótons e sensor de captura. Quando você gera por IA não consegue – ainda – imitar perfeitamente esse processo de conversão do mundo físico para o mundo digital. Pode ser que futuramente isso venha a acontecer. A pista de ruído, contudo, ainda é muito forte na identificação de um conteúdo gerado por IA, mas isso pode mudar.

Há também o caminho da IA generativa, em nível mais alto. Estamos treinando modelos capazes de explicar uma falsificação textualmente. Você pode, por exemplo, pensar em algo como o GPT da Forense Digital: faz o upload de uma imagem ou partes de um vídeo e pede para ele analisar. Ele olha diversas propriedades e explica textualmente. Há um doutorado em andamento no nosso grupo com uma pesquisa para juntar a IA discriminativa e a IA generativa.

Se qualquer pessoa pode criar um conteúdo digital convincente em poucos minutos, o que ainda é considerado como confiável?

Quando todos começam a criar sua própria realidade temos uma multitude de realidades sintéticas. Qual é a real? É uma pergunta difícil. Há um caminho tortuoso pela frente em que, à medida que esse tipo de conteúdo se multiplique, precisaremos não só de soluções técnicas, mas de regulamentação em algum nível.

É preciso educação digital para conscientizar diferentes níveis da população, de forma a torná-la um pouco mais resiliente. Precisaremos de alguma padronização e proveniência em relação aos conteúdos, além de valorizar aqueles que tenham credibilidade, meios de comunicação reconhecidos ou que usam selos de qualidade para mostrar o que é verdadeiro, e o que não é.

Qual a importância do pensamento crítico em uma sociedade cada vez mais impactada pela IA?

Vivemos um momento muito único na história e a IA chegou para ficar. Ela não pode ser vista simplesmente como genérica ou neutra. Como pode ser aplicada nas áreas mais transversais possíveis, todo setor humano é afetado por ela. Há muitos aspectos positivos e também negativos. É importante as pessoas terem consciência, sem acreditarem em tudo que veem, leem ou escutam. E, mais importante, não delegarem para a IA o seu aspecto mais importante como ser humano, que é o pensamento crítico.

Juliana Vicentini tem pós-doutorado em comunicação (USP) e é especialista em jornalismo científico (Labjor/Unicamp).

Material produzido com o apoio da Fapesp (Processo nº 2025/26523-7), vinculado ao Projeto Horus do Recod.ai (Processo nº 23/12865-8).

_comciência

Ciência forense na era da inteligência artificial

_revista de jornalismo científico do Labjor