EXAME.com (EXAME.com)
Maurício Grego
Publicado em 19 de maio de 2014 às 18h20.
São Paulo -- O DataViva, site criado pelo governo de Minas Gerais em parceria com o Instituto de Tecnologia de Massachusetts (MIT), oferece um arsenal de ferramentas inovadoras para a visualização de dados de todo o Brasil.
Esse site de big data é parada quase obrigatória para quem está empenhado em criar ou expandir geograficamente algum negócio no país. Ele permite cruzar dados de duas fontes distintas.
A primeira são os registros de exportações do Ministério do Desenvolvimento, Indústria e Comércio. Eles contém informações detalhadas sobre as empresas exportadoras.
A outra fonte é a base de dados da Relação Anual de Informações Sociais (RAIS), que as empresas entregam ao Ministério do Trabalho e Emprego. Ela inclui dados sobre ocupações profissionais e salários.
Desse cruzamento podem-se extrair uma variedade de informações. Imaginemos, por exemplo, um empreendedor querendo abrir uma startup para fornecer algum produto ou serviço que atenda a uma determinada indústria.
Nos mapas e diagramas do DataViva, ele pode ver em que cidades há aquele tipo de indústria, quantas pessoas trabalham nela, em quais ocupações e quanto ganham em média.
Assim, fica mais fácil decidir onde instalar a startup e como integrá-la à cadeia de suprimentos das empresas locais.
Também é possível fazer o caminho contrário. Pesquisando as atividades industriais de uma determinada cidade, podem-se identificar oportunidades de negócios nela.
Instituições de ensino podem usar as informações do DataViva para oferecer cursos que preparem pessoas para as carreiras mais requisitadas na região. E esses dados podem ajudar governos a decidir onde investir mais em infraestrutura e educação.
Montanhas de números
Os dados presentes no DataViva já estavam disponíveis publicamente antes, mas apenas na forma de montanhas de números. Quem resolvesse extrair alguma informação útil deles precisaria dedicar bastante tempo para baixá-los e analisá-los em planilhas.
No DataViva, bastam alguns cliques (e um pouco de paciência, já que o site é bastante lento) para visualizar essas informações de diversas formas.
Há opções para vê-las num mapa, num diagrama que relaciona diferentes produtos e ocupações profissionais e em gráficos comparativos, por exemplo.
São oito aplicativos online, que combinam diferentes parâmetros para obter 100 milhões de visualizações diferentes. Os dados cobrem um período de dez anos. Incluem informações sobre cerca de 1.300 produtos, 400 atividades industriais e 900 ocupações profissionais.
O DataViva começou a ser desenvolvido em 2011. Parte do trabalho foi feita por uma equipe liderada pelo professor César Hidalgo no MIT. O projeto custou 1,2 milhão de reais, pagos pela Fundação de Amparo à Pesquisa do Estado de Minas Gerais (Fapemig).
O site foi aberto em setembro de 2013, e inaugurado em dezembro. Mas ainda está oficialmente em fase de testes. Os autores dizem que pretendem agregar mais fontes de dados no futuro.
O software usado no DataViva tem código aberto e está disponível no site GitHub. Outros governos, institutos de pesquisa e empresas podem adaptá-lo à visualização de diferentes bases de dados.
Este vídeo mostra o DataViva em uso: