Apesar de parte dos dados gerados diariamente ser de uso privado e sigiloso, há um potencial imenso a ser explorado no que se refere a dados abertos (open data). Utilizando a definição da Open Knowledge Foundation, o termo se refere a dados que podem ser livremente utilizados, reutilizados e redistribuídos. Eles seguem três leis básicas propostas por David Eaves, referência na área:

  • Se o dado não pode ser indexado, isto é, encontrado na web, ele não existe. Isso é bem claro:  se o dado não pode ser encontrado pelo usuário numa busca simples no Google, é como se ele, de fato, não existisse.
  • Se não está em formato compreensível por máquina (por exemplo, se está como imagem), ele não gera engajamento. Isso não significa que documentos em pdf ou formatos semelhantes não forneçam dados de valor. Significa apenas que o usuário não consegue trabalhar esse dado (no excel por exemplo), o que limita bastante o seu uso.
  • Se não é possível replicá-lo por alguma questão legal, ele não “tem/dá poder”. Se não é possível compartilhar o resultado de um trabalho com dados pela existência de licenças para uso, seu potencial para gerar valor é reduzido.

Open Data é o mesmo que Big Data?

Como colocado por Joe Gurin, presidente do Center for Open Data Enterprise, enquanto o big data é definido pelo seu volume, variedade e velocidade, o open data é definido pelo seu uso.[1]  As bases de big data que seguem as leis ditadas acima passam também a serem consideradas dados abertos.

Figura 1 – Tipos de Dados

tipos de dado

                                                                        Fonte: Gurin, J. (2014)

Estudo da Mckinsey Global revela que uma agenda global de dados abertos tem potencial para gerar três trilhões de dólares, em particular nos setores de educação, transporte e saúde. A consultoria Lateral Economics estima que políticas pró-abertura de dados podem resultar em acréscimo de até 1,1% do PIB para as economias do G20.

Dados abertos são um combustível para inovações em serviços e produtos justamente por serem fáceis de encontrar e manipular, com produtos resultantes dessa manipulação que podem ser amplamente compartilhados. Por mais senso comum que isso pareça, é a partir desses dados abertos que vários aplicativos, por exemplo, melhoram diariamente a vida de usuários em diversas áreas, como lazer, segurança e transporte.

Boa parte dos aplicativos mais usados hoje atingiram esse sucesso por conseguirem traduzir, em formato de aplicativo, milhares de dados – abertos – fornecidos pelo governo. Um exemplo disso é o aplicativo sul-coreano Naver, que usa open data do Ministério dos Transportes para gerar um aplicativo capaz de destrinchar o complexo sistema de ônibus do país. No Reino Unido, a plataforma Illustreets coleta informações de diversos departamentos como transporte e educação para construir índices que auxiliam na escolha de regiões para morar. Em Uganda, 80% dos recursos destinados a escolas se perdia pela corrupção. Após a divulgação dos dados abertos sobre a destinação desses recursos, essa cifra reduziu-se para 10%.

Como o Governo pode promover dados abertos?

Diversos são os motivos para que o Governo lidere a agenda de dados abertos. Conforme elencado pelo Tribunal de Contas da União (TCU), eles contribuem para o aumento da transparência na gestão pública, o surgimento de novos serviços e inovações a partir de seu uso, a melhoria na qualidade dos dados do governo e a viabilização de novos negócios. No Brasil, a Lei de Acesso à Informação e a Instrução Normativa que instituiu a Infraestrutura Nacional de Dados Abertos (INDA) fornecem as diretrizes para todas as iniciativas do Governo nessa área. O Governo também tem papel relevante como promotor da cultura e do uso de dados abertos. Hackathons (maratonas de programação) e desconferências  são iniciativas populares nesse sentido. No Brasil já houve Hackathons organizados pela Câmara dos DeputadosINEP e Ministério da Justiça[1]

Entende-se, claramente, que ainda há muitos desafios a serem enfrentados para o crescimento da disponibilidade de dados abertos no Brasil e no mundo, principalmente no que se refere à segurança da informação e qualidade dos dados. Há custos inerentes de disponibilização e manutenção das bases e necessidade de servidores para sua gestão, para padronização e suporte. Com o crescimento no número de fontes capazes de fornecer bases de dados abertas, sistemas cada vez mais complexos serão necessários para administrar esse volume de informações. A manutenção de uma trajetória firme para disponibilizar cada vez mais dados abertos é importante para garantir que o País não fique ainda mais atrás na corrida de inovação.

[1] Para mais informações sobre dados abertos no Brasil, clique aqui.

 

Agradeço os comentários do economista Rafael Leão durante a elaboração deste post.