Skip to content

okumuralab/baddata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 

Repository files navigation

政府統計のチェックリスト

三重大学教育学部 奥村晴彦 (この文書は CC BY で公開しています)

ご意見はIssuesまたはツイッターにどうぞ。

基本的な考え方

「もっと手間をかけろ」ではなく,「もっと手間を省け」(シンプルな表ほど機械可読性が高い。罫線やセル結合を駆使した帳票化は機械可読性を妨げる),「わざわざPDF化せず元データ(Excelファイル等)をそのまま公開すればよい」という考え方を広める。「PDFのほうが改ざんされにくい」といった誤解を解く。

API化まで現場に押し付けず,Excelファイルでもいいからデータをタイムリーに出してもらう。API化は力のあるところがやればよい(われわれボランティアでもできる)。Excelファイルからデータを抽出する方法はいろいろある

チェックリスト

具体例

PDFだけの例

(ほかにもたくさんあるはず。あったら教えてください)

いただいた意見

一覧情報が不足

実は、学校の「校名・住所・電話番号・URL・メールアドレス」の5つ組は、文部科学省のどこもデータを持っていない。それでは緊急時に連絡のしようがない。それはまずいと思い、全学校の基本情報をオープンデータにするサービスを始めます。それがedumap。 #netcommons

— norico arai (@noricoco) 2014年7月22日
<script async src="//platform.twitter.com/widgets.js" charset="utf-8"></script>

edumap

例えば全国自治体について,ホームページから情報を自動収集したり,○○担当部局に郵便を出す必要が生じた場合,地方公共団体コード(あるいは国税庁の法人番号)・公式ホームページURL・郵便番号付き住所等を対応づけるデータが欲しいが,人間が地道に探さないと簡単には得られない。

IDを付ける

@noricoco @h_okumura @konotarogomame 機械可読も大事ですが、私はIDの重要性を訴えたいです。IDは複数のデータを紐付ける基盤で、政府が一元付与・運用すれば皆で共有できる。道路の話で言えば、実は高速道路さえ公的IDがないのですよ。ビックリです。

— 北本 朝展 (@KitamotoAsanobu) 2016年10月26日
<script async src="//platform.twitter.com/widgets.js" charset="utf-8"></script>

県ごとのデータはJIS X 0401「都道府県コード」を付け,その順に並べる。自治体ごとのデータにも総務省全国地方公共団体コードを付けると集約が簡単になる(参考:ウィキペディア全国地方公共団体コード)。

首相官邸の地方公共団体に向けたデータフォーマット標準例には「○○町」「○○町」…のように自治体名ごとにデータが列挙されているが,全国地方公共団体コードも付けることが望ましい。

参考リンク

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published