Pessoas e máquinas aprendem com professores a reconhecer fake news

Por Renan Augusto Trindade 

Projetos de ciência da computação auxiliam na identificação das notícias falsas

Imagem: Henrique Fontes/Assessoria de Comunicação ICMC/USP 

Fakenews: reconhecimento e atitudes para fazermos a diferença é um curso oferecido pelo Instituto de Ciências Matemáticas e de Computação (ICMC/USP) a pessoas de 60 anos ou mais, com coordenação da professora Kamila Rios Rodrigues, pesquisadora da área de interação humano-computador (IHC) e letramento digital para idosos.

A IHC estuda fatores humanos relacionados à tecnologia. Com a ajuda da psicologia cognitiva, busca entender como processamos e reagimos às informações para projetar o design de uma solução computacional. Entretanto, desenvolvedores têm ignorado dificuldades inerentes ao processo de envelhecimento, como problemas de destreza, baixa acuidade visual ou auditiva. Apesar da preocupação das empresas com a experiência do usuário, ainda é difícil para o idoso acessar as soluções, resume a pesquisadora. O tamanho do dispositivo, as fontes e a proximidade dos botões dificultam.

As novas gerações de idosos têm letramento digital, mas para alguns ainda há desafios, e a marginalização em relação à tecnologia foi evidenciada na pandemia, com dificuldades para se comunicar com a família e amigos.

Letramento digital para idosos

A Universidade Aberta à Terceira Idade oferece no ICMC o curso de letramento digital. A equipe se esforça para que os alunos ganhem autonomia. “É uma troca. Transmitimos um pouco do nosso saber sobre tecnologia, e eles nos dão uma lição de vida, cuidado, parceria e compromisso”, afirma Kamila. Com turmas para iniciantes e avançados, o curso é estruturado de forma que no futuro outras universidades e institutos possam ofertá-lo. Há uma apostila para anotações e um ajudante digital, o Sensem, que envia o alerta da tarefa semanal e o reforço da semana anterior. Tutores da própria família ajudam os iniciantes a acompanhar as aulas no formato virtual. A metodologia inclui simulações de diversos recursos de smartphones, inclusive aplicativos que tiveram uso intensificado durante a pandemia, como entrega de comida ou de transporte urbano. “Alguns aplicativos os marginalizavam. Como eles precisavam usar e não sabiam, era sempre o filho ou o neto que usava”, resume Kamila.

Nessa mesma linha, o curso sobre fake news teve início esse ano com turmas de 30 alunos, equipe multidisciplinar – uma característica da IHC – com cerca de 10 monitores e especialistas de psicologia, gerontologia, antropologia e palestrantes de diversas áreas. Profissionais da computação abordam temas como deepfake e psicólogos, advogados, publicitários, cientistas políticos e sociais enriquecem a discussão. Além disso, são apresentadas algumas agências de checagem de fatos. “Cada aula é um novo desafio, dada a dificuldade em se abordar o assunto e ensinar como identificar uma notícia falsa. Mostramos a facilidade em produzi-la, pois as pessoas acham real e não conseguem entender como pode ser uma farsa”, diz Kamila.

Com alta procura, as inscrições já estão abertas para uma nova turma, em novembro. O público dos cursos é heterogêneo, sendo a maioria mulheres e de diversas classes sociais. Apesar das dificuldades – estudadas por pesquisadores e verificadas na prática pela equipe –, os alunos finalizam o curso com autonomia e mais engajados. “A partir do momento que eles têm um espaço de fala com pessoas dispostas a escutá-los, tendo empatia com aquela situação que estão vivendo e a presença de profissionais da psicologia e gerontologia, eles se sentem acolhidos, saem dos cursos empoderados e ganham força para lutar contra opressões dentro de casa”, relata a pesquisadora.

PLN e o FakeCheck – Os “linguistas computacionais”

Outra iniciativa do mesmo instituto é o projeto FakeCheck, que identifica notícias falsas com acurácia de 89%. O professor da Universidade Federal do Piauí (UFPI), Roney Lira de Sales Santos, quer melhorar esse número e colaborou atuando no processamento de linguagem natural (PLN), que é o ramo da inteligência artificial que “ensina” os computadores a entender o que fazemos e falamos.

Dados, em geral na forma de textos, são fundamentais em trabalhos desse tipo e no caso dos conteúdos enganosos – que envolvem além das fake news, boatos, ironias e sarcasmos, por exemplo – existem muitos na internet. O PLN tem recursos, ferramentas e aplicações prontas ou sendo feitas para tratar deles. “No trabalho que realizo envolvendo notícias falsas jornalísticas, que são mais “comportadas”, elas vêm normalmente como texto. Então temos o ferramental, basta criar as técnicas e métodos – que não são fáceis, mas podem ser criados a partir desses dados de texto”, explica.

Atributos em língua portuguesa são diferentes daqueles em inglês, por isso as técnicas utilizadas desde a eleição de Donald Trump nos Estados Unidos para detectar fake news não seriam aplicadas no Brasil. “Os atributos são a base para que o algoritmo de aprendizagem de máquina consiga fazer tudo automaticamente. Nós sabemos que manualmente as agências de fact-checking já fazem isso, mas demanda muita gente e muito tempo”, afirma Roney, que junto com outros pesquisadores criou um corpus – conjunto de dados – em língua portuguesa com 7200 notícias, sendo metade verdadeira e a outra falsa.

O trabalho tem duas abordagens: linguística e conteúdo. A primeira considera que o enganador não se importa com a gramática. “Notícias jornalísticas verdadeiras são bem escritas, revisadas e têm estrutura gramatical correta”, ele explica. O algoritmo reconhece os erros e marca a falsa. Além disso, notícias verdadeiras tratam de fatos e por isso nelas há poucos adjetivos, advérbios, verbos no imperativo, pronomes e verbos auxiliares que trariam emoção ao texto, abandonando o foco da notícia factual. “Percebemos que uma característica das notícias falsas era a presença dessas classes gramaticais”, exemplifica Roney.

Caso o enganador use a gramática correta, há a segunda abordagem, na qual os eventos são importantes. “Se Roney falou com Renan no dia 24 de setembro de 2021 às 18 horas e 47 minutos, isso deve ser organizado em estruturas chamadas gráficos de conhecimento”, explica. O texto é dividido em sentenças, e essas se dividem em “eventos”. “Se quem entrevistou o Roney não for o Renan, ou a data não for aquela, a estrutura diz que o caminho não existe”. Para construir esses gráficos, buscas de notícias em grandes veículos ajudam na elaboração do chamado Valor de Verdade. Porém, lidar com o volume de dados é trabalhoso. “Eu não vou resolver todos os problemas de fake news, mas ajudo quem vier depois a melhorar e continuar esses métodos”, diz.

“Para resolver o problema das fake news temos que atuar em três pilares: o tecnológico, o da educação e o da legislação”, diz Thiago Salgueiro Pardo,  professor do ICMC/USP que estuda  linguística computacional, apontando também o marco civil da internet.

Renan Augusto Trindade é formado em física (USP) e aluno da especialização em jornalismo científico do Labjor/Unicamp.

Clique aqui para o índice do Dossiê Fake News, outubro de 2021