Soberania de dados acadêmicos é desafio para universidades públicas

A maioria das informações está hospedada em servidores de grandes empresas de tecnologia. O fato levanta questões importantes sobre governança de dados e dependência tecnológica.

Por Lívia Mendes e Marcos Vinícius Ribeiro Ferreira

De acordo com a Rede pela Soberania Digital, a maior parte das comunicações acadêmicas e de pesquisa produzidas nas instituições públicas brasileiras estão em data centers fora de seu controle institucional. Essa configuração alimenta um sistema de inteligência e de lucros, a partir de análise de dados, que fragilizam a soberania digital e autonomia universitária. Frente a esse cenário, pesquisadores brasileiros repensam a questão, defendendo uma melhor infraestrutura digital nacional, que garanta o armazenamento e processamento de dados sem a dependência de players estrangeiros.

Segundo pesquisa do Observatório Educação Vigiada, 79% das instituições públicas de Ensino Superior brasileiras têm seus e-mails institucionais alocados em servidores privados. Localizados fora do país, estes servidores são gerenciados por empresas envolvidas no lucrativo mercado de coleta, análise e comercialização de dados pessoais, conhecidos como Gafam (Google, Apple, Facebook, Amazon, Microsoft). A Google, o maior player desse mercado, armazena 72% dos e-mails institucionais das universidades públicas brasileiras, como USP e Unicamp. Esse cenário aponta para uma situação de vulnerabilidade em relação à segurança da produção científica e tecnológica do Brasil.

Para que servem os dados das universidades

Quando se fala sobre dados, as universidades públicas brasileiras possuem políticas que visam à garantia de que estejam seguros, ainda mais quando são relativos a temas sensíveis e pessoais. Nas últimas décadas, universidades como a USP e a Unicamp, por exemplo, construíram infraestruturas para hospedar dados e backups relacionados a essas informações, por meio de superintendências e escritórios dedicados à análise e segurança de dados, evitando vazamentos e ataques.

Como indicou em entrevista a vice-coordenadora do Escritório de Gestão de Indicadores de Desempenho Acadêmico (Egida) da USP, Sarita Mazzini Bruschi, “é necessário muito cuidado para manusear dados. Existem questões éticas envolvidas, principalmente com relação ao anonimato. O armazenamento deve ser seguro para não haver vazamentos. Isso demanda uma infraestrutura de computação para tais dados estarem protegidos”.

Na maioria dos casos, as universidades analisam dados relacionados a suas comunidades de forma a obter “uma média, que permite levantar indicadores e fazer projeções, sem que se precise saber informações pessoais ou individuais”, contou a professora.

No caso da USP, ela possui “sistemas corporativos que armazenam informações mais internas, sob a responsabilidade da Superintendência de Tecnologia da Informação (STI)”, comentou Sarita. Contudo, os dados de pesquisa são de responsabilidade dos pesquisadores, das próprias unidades e faculdades que, a princípio, responsabilizam-se por cuidar desse armazenamento com mecanismos de transparência, de forma ética.

É importante que as universidades forneçam condições para que os pesquisadores armazenem dados de maneira correta, “preferencialmente de forma aberta, a não ser que os dados sejam sensíveis”, afirmou Sarita.

O alerta é importante, pois, como afirmou a coordenadora de inovação do Hospital Israelita Albert Einstein, Livia Oliveira-Ciabati, “os produtos gratuitos permitem à detentora do serviço de armazenamento, no mínimo, ler esses dados”. Essas regras estão expressas nos termos de aceite, “que na maioria das vezes ninguém lê”, diz. Nos serviços pagos, em que uma empresa contrata uma nuvem para armazenar um site ou um conjunto de dados, outras leis passam a valer, pois existe um contrato que protege o uso desses dados – mas há também questões a serem ponderadas.

Esse modelo de comunicação e hospedagem de dados intermediada pela Google, por exemplo, foi financeiramente atraente para as universidades. Com esse tipo de parceria, não há a necessidade de criação de infraestrutura de hardware, manutenção, pagamento de contas de luz, refrigeração e atualização dos componentes, o desenvolvimento de software de e-mail, armazenamento de documentos, edição de texto, planilhas, entre outros serviços, que já vêm inclusos no pacote das big techs.

A USP, por exemplo, tem um data center e um serviço de nuvem (cloud USP) próprios, mas as comunicações por serviços de e-mail são feitas pelo Gmail, sendo, portanto, hospedados no Google. Isso desonera a universidade da manutenção desses sistemas, contudo, permite que empresas também tenham acesso aos dados que circulam por meio de suas redes de comunicação e servidores. Isso garante também insumos necessários para melhoramento de seus serviços e treinamento de sistemas inteligentes, como as inteligências artificiais (IAs).

Nos últimos anos, os serviços antes gratuitos – ou ao menos com preços mais acessíveis – passaram a cobrar valores bem maiores, o que levou universidades como a USP e a Unicamp a reduzirem a oferta de armazenamento dos sistemas Google para suas comunidades acadêmicas.

Por uma soberania digital e de dados

A decisão de não investir em um pátio tecnológico capaz de promover maior soberania sobre os dados faz com que as empresas estrangeiras tenham amplo acesso aos dados das instituições nacionais. Segundo Sérgio Amadeu da Silveira, professor da Universidade Federal do ABC, a “universidade brasileira sofreu cortes e foi pressionada a fazer cada vez mais com menos. Nessa conjuntura, “as big techs logo se ofereceram para hospedagem de e-mails e de repositórios de pesquisa”.  O resultado é que “esses dados são extraídos do Brasil e vão para uma jurisdição onde não temos governança ou controle”.

Livia Ciabati-Oliveira lembra que “a Lei Geral de Proteção de Dados requisita que dados sensíveis, principalmente, sejam sempre armazenados em servidores no Brasil. Porém, se de alguma forma esses dados são anonimizados, eles podem ficar em um data center fora do país”. A pesquisadora pondera a diferença entre o que consta na lei e o que é efetivamente realizado: “o que é legal e o que é factível”, completa.

“A  Lei Geral de Proteção de Dados (LGPD) é muito permissiva, e a extração de dados pode ser considerada uma nova forma de colonização, agora no digital”, diz Sérgio. Como exemplos, ele aponta países como Índia, Indonésia e China, que não permitem que seus dados sejam hospedados sem anonimização em servidores estrangeiros ou, ao menos, mantenham cópias dos bancos de dados em território nacional. 

“A localização de dados é condição necessária para soberania, mas não é suficiente.  Hoje, mais de 80% dos data centers em nosso país estão sob controle do capital financeiro internacional. Precisamos de uma política de data centers federados, sob controle dos pesquisadores, das universidades, com o menor impacto ambiental possível”, completa Sérgio.

Lívia Mendes é doutora em linguística e especialista em jornalismo científico (Labjor/Unicamp)

Marcos Vinícius Ribeiro Ferreira é bolsista de jornalismo científico (Fapesp, processo 2025/24158-0) no ICMC/USP, especialista em jornalismo científico (Labjor/Unicamp) e doutorando em ensino de ciências (PIEC/USP).