Skip to content

Latest commit

 

History

History
98 lines (71 loc) · 4.71 KB

File metadata and controls

98 lines (71 loc) · 4.71 KB

Levantamento de portais estaduais e municipais de transparência e dados abertos, bem como os portais institucionais, obtido a partir de diversas fontes públicas de dados.

This text is also available in English: 🇬🇧README.md.

Frictionless-repository

Portais de Transparência e Dados Abertos de estados e municípios do Brasil

Obter uma lista dos portais da transparência e de dados abertos de todos os 27 estados e 5.570 municípios brasileiros pode ser uma tarefa descomunal. Este projeto tem o objetivo de consolidar e manter atualizadas todas essas informações de referência.

Além disso, cada estado e município tem seu poder executivo e legislativo, o que efetivamente duplica a quantidade de trabalho necessária.

Descoberta de dados

Para encontrar os portais de transparência e de dados abertos são nescessários alguns passos. Em primeiro lugar, precisamos encontrar os sites institucionais das câmaras ou assembleias legislativas e prefeituras no Brasil.

Sites de câmaras e prefeituras

Poderia se esperar que um banco de dados contendo os sites oficiais de todas as câmaras e prefeituras municipais do Brasil já existisse. Mas, na verdade, não há. Então, tentamos obter possíveis links a partir de diversas fontes.

Essas fontes estão no diretório sources (fontes). Verifique cada pasta individual da fonte para mais informações. Alguns exemplos de fontes já implementadas são:

Os scripts que de fato fazem a importação estão no diretório tools/import (ferramentas/importar). Eles devolvem dados que contêm os possíveis links para os sites das administrações locais, os quais são armazenados no diretório data/unverified (dados/não verificados). Espera-se que os dados guardados aqui ainda contenham muito lixo e não devem ser incluídos (commit) no repositório.

Fontes potenciais futuras de dados são discutidas nas issues deste repositório.

Validação

O próximo passo é a validação de links. Isso é feito automaticamente, por um bot, e manualmente, com a ajuda de um script. O código desses está no diretório tools/validation (ferramentas/validação). A saída, com dados validados, vai para o diretório data/valid.

Nós também aplicamos o conceito de integração contínua de dados para manter a integridade dos dados já validados. É como a integração contínua, mas para dados em vez de software. Ela ajuda a manter dados incorretos fora do repositório, já que todo commit e pull request é automaticamente verificado, graças a um workflow no Github Actions que chama a validação do Frictionless Repository.

Os metadados são mantidos usando a especificação Data Package, o que também remove a fricção do processo de reutilizar os dados. Para mais informações, veja o site do Frictionless Data.

Encontrando portais da transparência e dados abertos nos sites oficiais

Assim que temos os links para os sites oficiais de câmaras e prefeituras, nós analisamos o conteúdo das páginas para procurar pela presença de links para portais da transparência e dados abertos.

Esse passo ainda não está implementado.

Objetivos

O objetivo desse projeto é construir uma base de dados de referência sobre os estados e municípios brasileiros, contemplando os poderes legislativo e executivo, contendo os seguintes dados sobre cada um deles:

  • site oficial
  • portal da transparência
  • portal de dados abertos

Como contribuir

Contribuições ao projeto são bem vindas. Se você tem uma ideia ou quer melhorar algo, por favor confira o nosso guia para contribuições.

Também pretendemos colaborar no monitoramento da transparência de estados e municípios em projetos como o Colaboradados e a lista de catálogos de dados abertos no Brasil.