REVISTA ELETRÔNICA DE JORNALISMO CIENTÍFICO
Dossiê Anteriores Notícias Reportagens Especiais HumorComCiência Quem Somos
Dossiê
Editorial
Parábola do cão digital - Carlos Vogt
Reportagens
Computação cognitiva: capturando corações, mentes e paladares
Roberto Takata
Memória artificial: sobre dados, vigilantes e vigiados
Kátia Kishi
Big Data traz demandas grandes à saúde
Patrícia Santos
A arte que trafega em dados
Janaína Quitério
As novas tecnologias em uso na agricultura: integrar dados para produzir com eficiência
Carolina Medeiros
Artigos
Ciência de dados: desafio para a ciência, indústria e governo
Artur Ziviani, Fábio Porto e Eduardo Ogasawara
Big data e jornalismo: datasets, APIs, algoritmos e sensores
Walter Teixeira Lima Junior
Big data e as capacidades de gestão da informação
Antônio Carlos Gastaud Maçada, Rafael Alfonso Brinkhues, José Carlos Freitas Júnior
Representação e análise de dados espaço-temporais
Karine Reis Ferreira
O céu é dos robôs
Ana Paula Zaguetto
Resenha
Decifrando códigos
Fabiana Micaele Silva
Entrevista
Danilo Doneda
Entrevistado por Sarah Schmidt
Poema
Campeão
Carlos Vogt
    Versão para impressão       Enviar por email       Compartilhar no Twitter       Compartilhar no Facebook
Reportagem
Computação cognitiva: capturando corações, mentes e paladares
Por Roberto Takata
10/07/2015

O apresentador leu seu cartão: “Um relato sobre os principados de Valáquia e Moldávia, de William Wilkinson, inspirou o mais famoso romance deste autor”. Os três concorrentes deram suas respostas; na verdade, suas perguntas às quais o enunciado lido pelo apresentador era a resposta. Todos acertaram (a pergunta/resposta é “Quem foi Bram Stoker?” e o romance em questão é Drácula). Dois dos concorrentes eram multicampeões do programa, acumulando, juntos, mais de US$ 5 milhões em prêmios ao longo de suas várias participações; mas foi o novato quem venceu naquela noite de 16 de fevereiro de 2011, obtendo mais pontos nos dois dias da competição com suas respostas. No ar desde 1964, Jeopardy!, um game show com a singular forma de responder com perguntas, teve também um campeão bem singular: Watson. Um dos concorrentes, Ken Jennings, ao dar sua resposta, complementou: “Saúdo nossos novos senhores, os computadores”.

Batizado em homenagem ao primeiro CEO da IBM, Thomas J. Watson, o supercomputador Watson é o sucessor do DeepQA, do qual herdou a capacidade de entender a linguagem natural – como os seres humanos se comunicam naturalmente através da fala e da escrita – para recuperar informações de um banco de dados, ao invés do método usual de palavras-chave e classificação das respostas ordenadas de acordo com um índice.

O feito de Watson no game show lembra outro, realizado também por um projeto da IBM, quando o Deep Blue derrotou o então campeão mundial, o russo Garry Kasparov, em 1997, em uma série de partidas de xadrez. Mas, comparado à capacidade de entender perguntas feitas em linguagem natural e buscar respostas a elas, ganhar em um jogo de tabuleiro é uma realização bem mais simples.

Por exemplo, Watson durante o desafio de Jeopardy!, na noite anterior em que se sagrou campeão, foi apresentado ao enunciado: “Seu maior aeroporto leva o nome de um herói da Segunda Guerra Mundial; seu segundo maior aeroporto, de uma batalha da Segunda Guerra Mundial”. Watson respondeu: “Toronto?”. Errou (a pergunta/resposta é “O que é Chicago?”, o herói da Segunda Guerra é o aviador Edward O’Hare e a batalha é a de Midway).

Mas que aplicações pode haver na computação cognitiva – que lida com situações complexas, com informações ambíguas, incertas, duvidosas e até contraditórias – além de bater campeões de jogos de perguntas e respostas – ou, no caso, respostas e perguntas? “O sistema de computação cognitiva da IBM é capaz de trabalhar com dados estruturados e não-estruturados, levando a grande flexibilidade no aproveitamento do seu conteúdo”, explica Fabio Scopeta, líder do IBM Watson para o Brasil e a América Latina, em entrevista por e-mail. Assim, há um ano e meio, a corporação resolveu apostar nesse potencial para transformar Watson em uma unidade de negócios com um investimento de US$ 1 bilhão. O sistema tem sido utilizado para treinamento de pessoal na área de saúde, desenvolvimento de soluções ecológicas e auxílio a cientistas para formular novas hipóteses e investigá-las a partir da análise e síntese dos terabytes de dados disponíveis em bancos de dados, como fichas de pacientes e clientes, registros de funcionamento dos equipamentos de produção, banco de dados científicos, financeiros e governamentais.

No entanto, segundo reportagem do Wall Street Journal de janeiro de 2014, a empresa tem encontrado dificuldades para fazer o projeto decolar e atingir objetivos bastante ambiciosos de gerar US$ 10 bilhões em revendas até 2025, com U$ 1 bilhão anual a partir de 2018. Até outubro de 2013, segundo o jornal americano, o faturamento total do projeto estava na casa de apenas US$ 100 milhões.

A IBM, de todo modo, continua firme em seus objetivos. “Em 2014, o IBM Watson dobrou sua base de clientes a cada trimestre e estendeu sua atuação para 17 indústrias em 24 países”, diz Scopeta. O grupo espera expandir a atuação do projeto com o aprendizado de novos idiomas, entre eles japonês, espanhol e português.

É previsto que até o final de 2015, Watson seja capaz de interagir de forma natural em português brasileiro. “O processo de aprendizagem de outro idioma por um sistema de computação cognitiva é gradual e isso não é algo que acontece a curto prazo”, ressalta Scopeta. O objetivo é treinar o sistema para compreender pelo menos 300 mil palavras, entendendo tanto a semântica (significados) quanto a sintaxe (construção das frases). Esse desenvolvimento tem sido feito junto com o primeiro cliente no Brasil, o Bradesco, por meio de diversos documentos da instituição – mas sem o uso de dados confidenciais dos clientes do banco.

Watson não está sozinho no mercado para aplicações da computação cognitiva na exploração de big data não-estruturados. O projeto Autonomy foi desenvolvido em Cambridge, Reino Unido, por uma empresa homônima, fundada em 1996 a partir da Cambridge Neurodynamics, firma especializada em reconhecimento de impressões digitais por computadores. Após um processo de aquisição bastante polêmico em 2011, o Autonomy passou a pertencer à Hewlett-Packard, onde foi desenvolvido o projeto HP IDOL (Intelligent Data Operating Layer – Camada Inteligente de Operação de Dados).

O HP Autonomy/IDOL utiliza uma abordagem diferente para o tratamento dos dados. A programação por linguagem natural (NPL) do Watson demanda um treino extensivo para o reconhecimento de regras linguísticas, com amplos dicionário e corpus anotados. Para aplicações comuns, esses dicionários e corpus já estão construídos; no entanto, para aplicações mais específicas com jargões próprios de determinadas áreas, como os dados médicos, eles precisam ser construídos e anotados manualmente. A NPL também pode encontrar dificuldades com o uso comum, mas não padrão da linguagem, como nos posts pessoais em mídias sociais (com abreviações, gírias, ortografia não-convencionais, emoticons e emojis).

“A HP IDOL utiliza uma abordagem probabilística, independente da linguagem para compreender a informação humana, ajustada com o uso da linguística”, explica Joe Leung, gerente de marketing analítico da HP, em entrevista por e-mail. Leung completa: “Para textos que não se ajustam às regras linguísticas padrões, a IDOL enfrenta o desafio tratando todas as palavras como símbolos abstratos de significação que existe nos padrões e relações, independentemente das regras formais da linguagem”. Isso tem permitido ao projeto da HP, entre outras coisas, a analisar o desempenho e orientar as ações da Polícia Metropolitana de Londres através do acompanhamento automatizado das mídias sociais.

Mas não só de grandes corporações, como instituições bancárias, e clientes governamentais, como departamentos de polícia, tais projetos viverão. O usuário individual comum também poderá utilizar serviços gerados por essas plataformas. O projeto da IBM inclui o Chef Watson que, com base na computação cognitiva, faz recomendações culinárias para os usuários. “Para chegar nesse resultado, o sistema leu o banco de receitas da Bon Appétit (um dos maiores sites de receitas do mundo) e foi treinado para entender as melhores combinações químicas entre os alimentos e que tipo de gosto costuma agradar os humanos”, esclarece Scopeta. 65 receitas inéditas geradas pelo projeto foram compiladas nas 224 páginas do livro Cognitive cooking with Chef Watson: recipes for innovation from IBM & the Institute of Culinary Education” (Cozinha cognitiva com Chef Watson: receitas para inovação da IBM & do Instituto de Educação Culinária).