- 小坂 淳
- 株式会社環
- 東京都
- ウェブ解析士マスター
対象:Webマーケティング
- 森 美明
- (Webデザイナー)
- 和久井 海十
- (ITコンサルタント)
言葉が普及初めのころというのは、その「字面」から想像しその意味を解釈することが多いです。
それにより、正しい意味とその解釈がずれたりすることも多いです。
その代表例がビッグデータだと思います。
ビッグデータについてはここでは議題にしていないので、興味ある方は下記をご参照ください。
皆さん、こんにちは、土曜日も仕事。環の小坂です。
今日はオープンデータの話。
最近「いいことをした」はずなのに、少しだけ炎上してしまったかわいそうな自治体がありました。
今まで公にしていなかった情報を利用範囲はあるものの公開する。
これは本来は素晴らしい取り組みへの第一歩であり、少なくとも非難されるものではありません。
ところが何か所かで煙がたってしまったのです。
オープンデータの定義も記載されています。
つまり「いいことなんだけど、オープンデータじゃないじゃん」という話で、データを扱う人の界隈では騒ぎになってしまったわけです。
そこで、今日はオープンデータとは何なんでしょうか?
世の中には「和製英語」が多いです。
例えば、ウェブ解析用語でよく使われる「セッション(訪問者数)」は英語では「visit」。
実はオープンデータも世界と日本で違う意味で使われている可能性があると感じました。
正確にはオープンデータを使いたい人の印象は同じなんだけど、
発信する側の定義が違うんじゃないかということです。
オープンデータは国が推進しているものなので、国のサイトを見てみましょう。
背景は下記です。
近年、公共データの活用促進、すなわち「オープンデータ」の推進により、行政の透明性・信頼性の向上、国民参加・官民協働の推進、経済の活性化・行政の効率化が三位一体で進むことが期待されています。 ここでは、オープンデータの意義、その内容、我が国政府の取組、総務省の取組及び自治体の取組について紹介します。
そして定義
政府において、オープンデータとは、「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」であり「人手を多くかけずにデータの二次利用を可能とするもの」のことを言います。
ここでは、オープンデータの意義、目的等について説明します。
つまり、日本においては施策的な意味合いが少しあり、国が奨励している方法があります。
意義
●透明性・信頼性の向上:
公共データが二次利用可能な形で提供されることにより、国民が自ら又は民間のサービスを通じて、政府の政策等に関して十分な分析、判断を行うことが可能となる。それにより、行政の透明性が高まり、行政への国民からの信頼を高めることができる。
●国民参加・官民協働の推進:
広範な主体による公共データの活用が進展し、官民の情報共有が図られることにより、官民の協働による公共サービスの提供、さらには行政が提供した情報による民間サービスの創出が促進される。これにより、創意工夫を活かした多様な公共サービスが迅速かつ効率的に提供され、厳しい財政状況、諸活動におけるニーズや価値観の多様化、情報通信技術の高度化等我が国を取り巻く諸状況にも適切に対応することができる。
●経済の活性化・行政の効率化:
公共データを二次利用可能な形で提供することにより、市場における編集、加工、分析等の各段階を通じて、様々な新ビジネスの創出や企業活動の効率化等が促され、我が国全体の経済活性化が図られる。また、国や地方自治体においても、政策決定等において公共データを用いて分析等を行うことで、業務の効率化、高度化が図られる。
重要だと感じるのは、「国民参加」ですね。
前述の騒ぎになった件は、許可する対象が狭いことと手続きがあることが問題になっています。
ーーーーちなみにopendatahandbookでは下記ーーーー
利用できる、そしてアクセスできるデータ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロードできるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。
再利用と再配布ができる データを提供するにあたって、再利用や再配布を許可しなければならない。また、他のデータセットと組み合わせて使うことも許可しなければならない。
誰でも使える 誰もが利用、再利用、再配布をできなければならない。データの使い道、人種、所属団体などによる差別をしてはいけない。たとえば「非営利目的での利用に限る」などという制限をすると商用での利用を制限してしまうし「教育目的での利用に限る」などの制限も許されない。
ーーーーーーーーーーーーーーーーーーー
総務省によると条件は二つで、
(1) 機械判読に適したデータ形式で、
(2) 二次利用が可能な利用ルールで公開されたデータ
だけです。
ここで重要なのは2番目ですね。総務省のサイトにはこのように記載があります。
(2) 二次利用が可能な利用ルール
二次利用が可能な利用ルールについては、第三者がデータを一部改変して利用すること、すなわちデータの二次利用を、データ所有者が予め許諾していることを明示することが必要となります。例えば、著作物には著作権が発生しますが、二次利用を広く認めるには、その著作権の不行使を予め宣言しておくことが求められます。他方、現在の各府省等のホームページの利用条件の中には、無断での改変を禁じているものがあり、広く二次利用を認めるものとはなっていない場合があります。また、数値データ等、著作物に該当しないデータについて、著作権の対象であるような包括的な表現となっている場合もあります。
つまり、
・著作権の不行使が大事。
・だけど広い二次利用を認めないものもあるよ。
ということです。
今回の発表は「オープンデータ」という言葉を使わずに、
「県が持っているデータを限定的に開放しますよ。使って活性化しましょう。」とすればよかったところで、
「オープンデータ」という定義が世界と国で少しずれているだけではなく、
一般の人がその容易な文字から想像する使い方とずれていることが問題だったんでしょうね。
オープンマインドとかも使い方要注意ですね。
【追記】
埼玉県のオープンデータは制約を大幅に減らしたようです。