Por que máquinas inteligentes poderão superar os seres humanos? -

Uma vez que as máquinas dominem plenamente as linguagens por meio das quais o conhecimento é criado e adquiram a capacidade de gerar, validar e disseminar conhecimento de forma autônoma, elas reunirão todas as condições para superar as capacidades intelectuais humanas. Essa superioridade não se limitará à velocidade ou à escala, mas se estenderá à abrangência, à integração e à evolução contínua do próprio conhecimento. Diferentemente dos humanos, as máquinas não estarão limitadas por restrições cognitivas, pelo esquecimento ou pelo tempo de vida, o que permitirá a acumulação e o refinamento do conhecimento sem precedentes.

Por Osvaldo N. Oliveira Jr e Maria Cristina F. Oliveira

O conhecimento – que envolve a compreensão, interpretação e aplicação do que sabemos sobre como o mundo funciona – é o principal ativo de qualquer nação ou sociedade. Em particular, o conhecimento científico, que gera soluções e tecnologias para problemas críticos das sociedades. Atualmente, apenas os seres humanos são capazes de gerar e disseminar conhecimento de qualquer natureza, inclusive o científico. Outros animais possuem conhecimento que lhes permite realizar diversas tarefas necessárias à sua sobrevivência e interação com o mundo, mas não conseguem criar conhecimento em escala ou disseminá-lo de maneira sistemática.

Existem diferentes tipos de conhecimento, refletidos nas diversas formas de expertise que os seres humanos utilizam para realizar tarefas, tanto intelectuais quanto manuais. No entanto, pode-se afirmar que o conhecimento é fundamentalmente criado e transmitido por meio de três tipos de “linguagens” apenas: as línguas naturais, como português ou inglês, no modo escrito ou falado, a linguagem dos formalismos matemáticos e a linguagem das artes. Identificar essas linguagens é crucial pois, se uma entidade (por exemplo, um modelo computacional incorporado a uma máquina) puder dominá-las, será capaz de realizar qualquer atividade que um ser humano pode desempenhar.

O advento da inteligência artificial gerativa (generative AI) trouxe evidências de que máquinas inteligentes já podem dominar as linguagens do conhecimento. As implicações para a humanidade serão enormes pois, em breve, as máquinas poderão criar conhecimento de forma autônoma. De fato, já existem vários relatos de modelos de IA “cientistas” [1,2]. A possibilidade de conhecimento gerado por máquinas foi denominada como o quinto paradigma de geração de conhecimento [3]. A referência ao quinto paradigma foi feita em comparação com os quatro paradigmas conhecidos segundo os quais os seres humanos geram e transmitem conhecimento científico [4]. Esses quatro paradigmas são definidos da seguinte forma:

Primeiro paradigma – conhecimento gerado por meio da ciência empírica, com observações experimentais e modelos de como a natureza e a matéria funcionam, sem um arcabouço matemático suficiente para explicar os resultados com precisão. Foi esse o paradigma predominante na Grécia Antiga e ao longo dos cerca de dois mil anos seguintes.

Segundo paradigma – marcado pelo estabelecimento de modelos matemáticos, a partir de Galileu, de Newton e de seus seguidores. A partir do século XVII, a geração de conhecimento passou a se basear na combinação entre teoria – descrita por meio de língua natural e formalismos matemáticos – e experimento.

Terceiro paradigma – com o advento dos computadores no século XX, a geração de conhecimento passou a incorporar teoria, experimentos e simulações computacionais.

Quarto paradigma – no final do século XX, com o grande volume de informação disponível em formato eletrônico, surgiu o movimento de Big Data. Assim, o conhecimento científico passou a ser gerado não apenas pelos três primeiros paradigmas, mas também por meio da mineração de dados, transformando informação em conhecimento (surgimento da disciplina denominada e-science, ou Big Data).

Uma observação importante sobre esses quatro paradigmas é que, neles, o conhecimento só pode ser gerado por meio de intervenção humana, independentemente de quão sofisticados sejam os instrumentos e os métodos. Com máquinas gerando conhecimento científico segundo o quinto paradigma, pode-se esperar a transformação tecnológica mais radical da história da humanidade. Isso é plausível, especialmente porque as máquinas podem processar texto a velocidades de ordem de magnitude superiores às dos seres humanos. Embora as velocidades de processamento variem consideravelmente conforme os computadores usados para treinar modelos de linguagem de grande escala (LLMs, ou large language models), é razoável estimar que as máquinas processem texto entre 10⁹ e 10¹³ vezes mais rápido do que os humanos. Considerando o limite superior, uma tarefa que uma máquina executa em um segundo levaria aproximadamente um milhão de anos para ser executada por um ser humano.

A superioridade das ferramentas baseadas em LLMs em relação aos humanos também pode ser compreendida em termos do tamanho dos corpora (ou seja, dos conjuntos de textos) utilizados para treinar esses modelos. Estimar o corpus internalizado por um ser humano não é trivial; no entanto, uma estimativa de limite superior pode ser obtida da seguinte forma. Se uma pessoa ler um livro por dia (aproximadamente entre 7 mil e 10 mil palavras) ao longo de 30 anos, ela será exposta a um corpus de cerca de um bilhão de palavras. Mesmo considerando entradas adicionais obtidas por meio da escuta e de outras formas de comunicação, o corpus total internalizado provavelmente alcançaria apenas alguns bilhões de palavras. Essa estimativa assume um cenário irrealista em que nada é esquecido e, portanto, deve ser considerada um limite superior. Ou seja, o repertório linguístico de um ser humano é muito mais limitado do que o de um LLM treinado com corpora de trilhões de palavras.

Essas considerações levam a uma conclusão inevitável: uma vez que as máquinas dominem plenamente as linguagens por meio das quais o conhecimento é criado e adquiram a capacidade de gerar, validar e disseminar conhecimento de forma autônoma, elas reunirão todas as condições para superar as capacidades intelectuais humanas. Essa superioridade não se limitará à velocidade ou à escala, mas se estenderá à abrangência, à integração e à evolução contínua do próprio conhecimento. Diferentemente dos humanos, as máquinas não estarão limitadas por restrições cognitivas, pelo esquecimento ou pelo tempo de vida, o que permitirá a acumulação e o refinamento do conhecimento sem precedentes.

O surgimento do quinto paradigma, portanto, não representa apenas uma nova fase no progresso científico, mas também uma mudança profunda no locus da inteligência. Da criação de conhecimento centrada no ser humano para uma epistemologia híbrida ou mesmo dominada por máquinas. O principal desafio para a humanidade deixará de ser como gerar conhecimento e passará a ser como orientar, interpretar e coexistir com inteligências que podem rapidamente superar a nossa.

Osvaldo N. Oliveira Jr é professor no Instituto de Física de São Carlos (USP). chu@ifsc.usp.br

Maria Cristina F. Oliveira é professora no Instituto de Ciências Matemáticas e de Computação (USP). cristina@icmc.usp.br

Agradecimentos
Este trabalho recebe apoio do CNPq e Fapesp (2025/27044-5)

Referências
[1] C. Lu et al. “Towards end-to-end automation of AI research”, Nature, 651, 914-922 (2026).
[2] J.C.M.C Silva et al. “AI-assisted tools for scientific review writing: opportunities and cautions”, ACS Applied Materials & Interfaces, 17, 47795-47805 (2025)
[3] O. N. Oliveira Jr.; M.C.F. Oliveira, “Materials discovery with machine learning and knowledge discovery”, Frontiers in Chemistry, 10, 930369 (2022).
[4] T. Hey; S. Tansley; K. Tolle, “The fourth paradigm: data-intensive scientific discovery, Microsoft Research, Redmond, Washington (USA), 2009.

_comciência

Por que máquinas inteligentes poderão superar os seres humanos?

_revista de jornalismo científico do Labjor