Cena de “A Invenção de Hugo Cabret”: os robôs escritores reais são aplicativos criados para buscar informações, analisá-las e transformá-las em texto (Reprodução)
Maurício Grego
Publicado em 2 de maio de 2012 às 15h46.
São Paulo — Um blog no site da revista Forbes vem provocando discussão na mídia americana e mundial. Mantido pela empresa Narrative Science, ele divulga, todos os dias, dezenas de análises de ações negociadas nas bolsas americanas. Os textos do blog são inteiramente escritos por um software de inteligência artificial, sem interferência humana. E não é fácil distinguir esses textos de outros similares, produzidos por humanos.
O blog da Narrative Science na Forbes começou a ser publicado em outubro do ano passado. É o exemplo mais conhecido de uma tendência que vem ganhando força nos Estados Unidos e que deve se alastrar nos próximos anos. Sistemas de inteligência artificial também já produzem noticiário esportivo, matérias sobre restaurantes e análises do desempenho de candidatos à presidência americana nas redes sociais, por exemplo.
A Narrative Science nasceu de um trabalho acadêmico na universidade Northwestern, em Evanston, cerca de 40 quilômetros ao norte de Chicago. Lá, uma equipe que reunia jornalistas e engenheiros criou um software capaz de narrar partidas de beisebol. Em 2010, eles montaram a empresa para desenvolver e comercializar seu invento.
O sistema escreve notícias e relatórios que seguem uma estrutura fixa, sempre com base em dados disponíveis na forma de números ou textos (o computador ainda não aprendeu a fazer entrevistas, é claro). A matéria-prima podem ser informações das bolsas de valores, de sites especializados, do Twitter e de apps para smartphone onde a torcida pode comentar um jogo, por exemplo. O software analisa os dados, determina o que é importante e transforma isso em texto seguindo fórmulas pré-configuradas.
Estilos variados
Quando a Narrative Science fecha um contrato com um novo cliente, um grupo de meta-redatores configura o software para que siga os padrões de texto desse cliente. A equipe leva em conta as preferências do público leitor. Nos esportes, por exemplo, há mais ênfase às boas jogadas do que aos erros cometidos pelos jogadores. Cada texto procura seguir o estilo usual do tema. Assim, as palavras empregadas numa notícia sobre beisebol são diferentes daquelas usadas num texto sobre finanças.
Vejamos, por exemplo, um trecho do blog na Forbes: “Os analistas esperam que a Consolidated Edison apresente ganhos de $1,04 por ação, 7,2% mais do que um ano atrás, quando ela apresentou ganho de $0,97 por ação. Nos últimos três meses, a estimativa do mercado subiu de $1,03. Os analistas projetam ganhos de $3,75 por ação para o ano fiscal.”
O texto, obviamente, está longe de ser uma obra literária. Mas ele é suficiente para muitos investidores que buscam informações sobre as ações da Consolidated Edison. Além disso, não é muito diferente do que escreveria um redator humano sobre o mesmo assunto.
Restaurantes e política
O sistema também funciona para produzir uma matéria do tipo “Os dez melhores restaurantes na cidade X”. Para isso, ele varre as avaliações registradas em sites especializados e encontra os restaurantes com as maiores notas. Procura, então, informações que possam ser destacadas sobre o serviço, a comida e a carta de vinhos, por exemplo. Juntando tudo, monta a lista com os destaques de cada restaurante.
No caso da análise de informações publicadas no Twitter, o software identifica os tuítes que se referem ao assunto sobre o qual deve escrever. Verifica, então, quantos tuítes mencionam aquele assunto; calcula se esse número tem crescido ou diminuído; registra quais outros temas aparecem junto com ele; e avalia se as palavras usadas são positivas ou negativas.
Kristian Hammond, CTO e cofundador da Narrative Science, dá um exemplo desse tipo de narrativa em seu blog. O texto é sobre os candidatos à presidência dos Estados Unidos. Vejamos um trecho:
“Newt Gingrich teve o maior aumento na quantidade de tuítes sobre ele hoje. A atividade associada ao candidato no Twitter deu um salto desde ontem, com a maioria dos usuários tuitando sobre impostos e questões de caráter. Newt Gingrich tem sido consistentemente popular no Twitter, e foi quem mais cresceu no site nos últimos quatro dias. O número de tuítes sobre Ron Paul, ao contrário, caiu nas últimas 24 horas. Outro que perdeu tráfego foi Rick Santorum, que tem tido queda constante no número de tuítes a seu respeito.”
O sistema da Narrative Science também inclui citações de tuítes, como neste outro trechos do texto sobre os candidatos: “Tuiteiros com grande influência estão aumentando as menções à posição de Newt Gingrich sobre os impostos. Tuitando sobre essa questão, @elvisroy000 diz: ‘Newt Gingrich corta impostos e equilibra o orçamento. Nos anos 80 e 90, ele era conservador’.”
Business Intelligence
A mesma tecnologia pode complementar os sistemas de análise de dados de gestão – ou business intelligence – das empresas. Um dos clientes da Narrative Science é uma rede de franquias de lanchonetes. A franqueadora contratou a empresa para produzir um relatório mensal automático para os franqueados. O software analisa os resultados e pode até sugerir itens do menu a ser promovidos nas lojas.
Por enquanto, o sistema só funciona em inglês. Mas Hammond diz, em seu blog, que ele foi projetado, desde o início, para gerar texto em múltiplos idiomas. “Nós ainda não fazemos isso, basicamente, por que nossa base de clientes ainda não requisitou. Mas é só uma questão de juntar pessoas que são nativas em outras línguas para configurar a plataforma para esses idiomas”, diz ele.