Evidence Vol.003 /データ市場を活かす国家的戦略を

2017.09.27

Evidence Vol.003 /データ市場を活かす国家的戦略を

データ市場を活かす国家的戦略を
東京大学大学院工学系研究科 システム創成学専攻 教授 大澤幸生 Yukio Ohsawa
東京大学大学院工学系研究科 システム創成学専攻 助教 早矢仕晃章 Teruaki Hayashi


産学官において、データ流通へのニーズは高まっている。しかし、「オープンデータ=無料のデータ」と考える人さえいる日本流のオープンデータ社会では、わずかなデータが提供されるだけの狭いデータ交換会やアイデアソンに終始しがちだ。また、データ取引自体で利益を追求するビジネスからは、期待したような収益は得にくい。むしろデータを提供する条件を交渉することを通じてイノベーションを打ち出し続ける社会システムとしてデータ市場を設計することが、データの利用価値を高める有力な方法となる。私たちは、円滑なデータ取引を活かして異業種のコラボレーションを実現するため、コンピュータではなく人が読むためにデータ概要や変数名の一部だけを記載した「データジャケット」を導入する方法でデータ市場を構築してきた。データ利用者、提供者、分析者らがこの市場に参加し、データジャケットを出し合うことによって、データの内容の秘匿性を保持したままデータの価値や利用者や利用目的を決めてゆく。このデータ市場で、誰が誰と何のためにデータを取引きし、AIを含む分析技術をどう用いればデータを価値化できるかというデータ利活用シナリオが参加者の交渉から生まれてきた。単なるデータ取引の場を超え、イノベーションを生むデータ流通社会の仕組みとしてデータ市場を再設計してゆくことが、我が国の新しい生命線となるだろう。


「価値あるデータ流通」慶應義塾大学総合政策学部 教授 國領 二郎

停滞する日本の「ビッグデータ」

近年、さまざまな分野で蓄積された膨大なデータを利用し、適切な分析手法を用いて発見した価値を意思決定に役立てようとする動きが活発になっている。「ビッグデータ」という言葉も一時は流行語になった。この背景にはさまざまな現象がある。2000年以降、ブログやfacebook、twitter等のSNS(ソーシャルネットワーキング・サービス)による個人の情報発信が盛んに行われ、そのデータがマーケティング分野で利用されるようになった。スマートフォン等のパーソナル情報端末の普及により、これまで取得困難であった個人の購買行動履歴等も取得可能となり、「大衆」に向けたマスマーケティングから、「個」のマーケティングへ進展してきたともいわれる。呼応してIoT(Internet of Things)やAIの流行も発生し、これらが相乗効果をもたらして多様なトレンドを生み出している。
日本でも、行政においてはオープンガバメント(行政のデータを一般的にアクセス可能にすることで透明性を高め、市民の行政への参加を促す運動)が盛り上がりを見せ始めていた。実際、米国のDATA.GOV、英国のDATA.GOV.UKと並んで、日本のDATA.GO.JPでは、行政のデータがさまざまな形式で公開されている。他の自治体を先導してオープンデータへの取り組みを始めた福井県鯖江市では、RDFという再利用可能なデータ記述方法を導入し、データ公開とアプリケーションの提供を行っている。さらに製造の現場では、今まで蓄積されてきた膨大なデータに加え、センサーや計器の高度化により製品、機械、人の動きを時々刻々とウェアラブルデバイス等で取得し、インターネットを介してさまざまな場所で活用しようとするIoTも使って、多様なデータ利活用ビジネスが創出された。これらは健康関連事業や労働環境の改善等への応用も期待されている。また、交通における移動体のIoTといえるテレマティクスも自動車産業などで推進されている。
さらに経済産業省は、データ駆動型イノベーション創出戦略協議会を創設した。その一方、民間でも企業間のデータ交換による新事業創出のための場としてデータエクスチェンジ・コンソーシアム(後に日本データ取引所へ発展)、オープン/ビッグデータ利用推進フォーラム、Open Fog Consortium等のデータ利活用及びマネジメントを目的とした団体が設立されている。
しかし、日本は海外に比べてデータのビジネス活用の多様性に欠けるというのが実態である。地図上に犯罪の発生地点と種類を表示し危険エリアを可視化するspotcrime.com(米国)のスマホアプリや、河川配置、土壌透水性、洪水リスク等、多様な環境関連データをWebGIS機能もあわせて企業に一括提供するEnviroFIND(英国)等、創造性に満ちた展開と比べると大きく後れを取っている。欧州でもデータの市場規模は拡大し(図1)、2016年には英、独、仏3カ国の合計市場規模が約337億ユーロとなった。なぜこれほどの格差が生まれたのだろうか?
データを利活用するとき、プライバシー、セキュリティ、知財、信頼性等について慎重に扱うのは世界共通であるが、日本ではこれがデータの流通と共有を停滞させる結果を招いてきた。実際、Google Trendによれば"big data"は依然としてグローバルに関心が高いのに対し、日本語の「ビッグデータ」は2010年頃のレベルにまで下がってしまっている。データ分析に関わる様々な国際会議に20年来参加し、100余社の企業と直接対話してきた経験からすると、この差は、次の問いに答える速さや詳しさ、力強さと関係があるように思える。

図1 ヨーロッパの国別データ市場価値
(色の濃さはデータの市場規模の大きさを表す。出典 http://www.datalandscape.eu/)

「どのデータを、何のために、誰から、どうやって入手するのか?」

データを入手する上での障壁は確かに高い。特に個人データについては、個人情報を隠したデータさえ組合せによってプライバシー侵害を引き起こす危険性が明らかとなったため、利用目的が不明確な相手に安易にデータを渡すわけにはいかない。しかし逆に言えば、データ利活用の目的、メリット、リスクを明らかにすることにより、進めるべきデータ交換とコラボレーションは進め、止めるべきは止める。守りに徹するより「君のデータを私が目的に沿って・・・という方法で分析すれば、君は得をし、なおかつプライバシーは漏れない」と説明する方法と文化を普及させることがデータ流通を促す。このような説明をデータ利活用シナリオと呼ぶ。わが国で産官学の連携により効果検証が進んできた実験的なデータ市場は、データ利活用シナリオを生み出す仕掛けであり、以下の顔ぶれで構成される。

  • 保有者:データを持つ人、あるいは知る人
  • 分析者:データやその分析手法について知識を有する人
  • 考案者:データや分析手法の組合せや分析手法を考える人
  • 利用者:データの恩恵にあずかり、要求を出すこともある人

たとえば、自身の検査データを医師が診断のために用いることに違和感を持つ患者は少ないだろう。なぜなら、データ分析の恩恵として、適切な診療が可能になると期待できるからである。一方、自分のデータが医師以外の人に渡る場合には不安が生じるが、金銭の授受があれば提供してもよいと考える人は相当数いる。このようなデータの所有者、分析者、利用者の要求を踏まえて、データ利活用シナリオを共に創るコミュニケーションによって交換する。こうしてデータの利用価値を評価し、その一部の手続きとしてデータを取引するというシナリオ生成プラットフォームがデータ市場である(図2)。

図2 データ市場の概念図

機械ではなく人が読めるメタデータを出し合う

ボイド(D. Boyd)は、さまざまな分野に蓄積された大小さまざまな規模のデータの価値を理解することの意義を指摘した。個々のデータの価値は、他のデータとの組合せを考えるデータ利活用シナリオによって決まることが多いが、異種データのすべての組合せを検討することは困難である。
2013年私たちは、データ自体は秘匿にしたまま、データに関する概要情報のみ流通させる技術として「データジャケット(Data Jacket:DJ)」を提唱した。DJとは、人が読めるメタデータ(データがどのような情報を有しているのかという概要情報)である。CDやDVDは購入しないと中身の音楽や映像は閲覧することはできないが、ジャケットには作曲者や映画の出演者等のコンテンツに関する説明文が記述されている。人はこの説明文を読むことにより、コンテンツの価値を検討する。DJも、中身を見ずにデータの価値を検討するための情報である。従来のメタデータのように検索エンジン等の計算機が読むための情報ではなく、人が読んでデータ利活用シナリオを考えるためのデータ概要である。
さらに、DJに記載されたデータの概要情報からデータの価値を策定し、異分野データ連携を促進させるワークショップ手法IMDJ(Innovators Marketplace on Data Jackets)も開発した。データ市場における利用者と考案者、分析者はIMDJにおいて、「データとデータ、さらに分析ツールを組合せることでどんな価値を実現できるか」という目標や、「どの変数(データの属性)で紐づけするか」を話し合う。利用者は実現性のある要求を出し、データ保有者、分析者及び考案者は要求に応えるデータ利活用シナリオを生み出していく。使途や価値が明確になったデータには価格が付され、参加者間でデータの取引が発生する。データを売る側の保有者が長所をアピールし、買う側は値下げやシナリオの改善を求める中で、多くのデータ利活用シナリオは洗練され分析や仮説検証という実施行動を生み出してきた。
DJの一つの特徴は、記述すべき項目の自由度である。機械に読ませる従来のメタデータの場合、何をどのような形式で書くか統一する「標準化」が必須だ。一方、DJの場合は人が読むので、人が理解できる内容であればよく、細かな標準化は不要である。データのタイトル、概要、主たる変数名という大枠を、読む人をイメージして書き込めばDJを市場に出すことができる。IMDJではDJの標準化よりも、参加の自由化とコミュニケーションが重要となる。すなわち、細かな標準化の議論によってデータ駆動型イノベーションの本来の目的と本質を見失うことなく、データを取引したい当事者たちがコミュニケーションできるプラットフォームがあれば、データ流通が一層活発になるのである。

有給休暇取得日数と株価上昇率には相関関係が

IMDJはデータを用いた企業の新ビジネス創成の他、2014年度以降は経済産業省や国土交通省等が主催する官民のデータ駆動型イノベーション創出事業(DDI)やビッグデータ活用のための調査研究等々に活用されてきた。図3は、IMDJの場で業界ごとの株価上昇率と有給休暇取得日数の間に正の相関があることを見出した例である。経営コンサルタントが有給休暇取得率に関するデータを示し、株価分析を日常的に行っていた人の知る株価データと組み合わせから「よく休めばよく働く」ことを科学的に示した。これは経営に欠かせない知見として今も利用されている。経済産業省におけるDDI創出事業でも、IMDJから得られたデータ利活用案9件のうち、4件が実際にコラボレーションを実現した。このDDI創出事業では、IMDJを適用したデータ市場型ワークショップに54の企業・団体が参加している。ワークショップは以下の3回に分けて実施された。

  1. IMDJによるデータ利活用アイデアの考案
  2. データ利活用アイデアの詳細を詰めるシナリオ化
  3. 2で創出されたシナリオの評価

この3回のアンケート結果(図4)から、組織・業界を超えてデータ共有への関心が高まったことが分かる。

図3 IMDJから得られたデータ分析事例

図4 参加者アンケート結果([1]を改訂:「不明」「未回答」を除く)

コミュニケーション環境をつくることが有効

図5は、ワークショップにおいてDJの提出者がデータを他者に提供できるとした割合の内訳である。約半数はデータを共有できない、あるいは共有に条件を付けている。しかし、IMDJ実施後には、データに関する情報の追加提供、さらにはデータ交換が行われた事例が報告されている。すなわち、データ交換に躊躇する人も、データ市場のようなコミュニケーションの場が実現されれば、データ交換に積極的となり得ることを示している。さらに、データ共有条件についての交渉次第であるいは相手を限定すればデータを出せる人は23%おり、交渉を促すことがデータ流通社会の発達を促すことになる。異分野に渡るデータ流通環境整備のためには、データ共有を強要せず、まずデータ概要情報であるDJを共有し、データの保有者、潜在的利用者とその目的について話し合うコミュニケーション環境を作ることが有効である。逆に、このようにデータ利活用方法を共に考えるコミュニケーションを稼働させなければ、メタデータの記述形を標準化し機械的なデータ流通システムを作っても十分に活用できないことになる。

図5 DJ提出者のデータ共有ポリシー(n=838)([2] 第4章)

実験的なデータ市場における活発なコミュニケーションは、さまざまなイノベーションの元となるデータ利活用シナリオを生み出した。この数歩を万歩に伸ばすには、データ市場の目的がデータ取引による利益ではなく、取引をきっかけとするイノベーションであるという意識改革を推進すべきである。一方、DJさえ提出できない企業も少数だが存在する。個人情報保護法を過度に警戒する以前に、まずデータに関するマインドセットを変えることに力点をおく必要がある。実際、DJには個人を識別することが可能な情報が一切含まれないにも関わらず、個人情報保護法を理由にDJが出せないと主張するデータ保有者もいる。ところが、そのように主張する人の上司はDJを出すべきだ考えていることも少なくない。このように一貫性の欠如が見られる以上、法整備のみならず国民の法律に対する意識(法意識)にも問題がある。国は膨大な資金を分析技術開発に投資する前に、データの価値を掘り起こすコミュケーションを日々高めるよう国民に促し、それが国民自身の利益となることについて啓発を急ぐべきであろう。その先にあるものこそが、創造的で持続的なデータ流通社会である。


参考文献
[1] データ駆動型イノベーション創出に関する調査事業報告(2015) http://www.meti.go.jp/meti_lib/report/2015fy/001102.pdf
[2] 大澤他「データ市場」近代科学社(2017)



価値あるデータ流通

慶應義塾大学総合政策学部 教授 國領 二郎

データを流通させることの価値は高い。経済や社会活動に付随して発生するデータが、自らでは意味がなくても、他者にとっては大きな価値を生み出すことがある。また、提供するために大きな社会インフラが必要なデータをベンチャーなどが活用することによって、多様な経済活動を生み出すことができることは、GPSなどの例が実証している。
このように大きな価値があると思われるデータ流通が、一方でなかなか進まない。データは作成に大きな費用がかかることが多い一方で、複製が簡単なので、いったん流出してしまうと価値を守り切れなくなるからだ。公共データであれば、税金で費用が賄われているために、無償で提供してしまうという手があるが、民間ではそうはいかない。話をさらに複雑にしているのがプライバシー保護で、安易に流せないデータも多い。
大澤・早矢仕提言はそのような袋小路から突破するための、具体的方策を実践的な取り組みの成果報告とともに行っている。具体的内容は読んでいただきたいが、基本はメタデータと呼ばれる、データの内容を記述した説明のデータを公開して流通させるというものである。メタデータ公開流通の考え方そのものは必ずしも新しいものではないが、メタデータだけで、その情報の価値が判断できて、有償での取引を促すような記述の仕方をすることには一工夫必要だ。それをあえて人が読める(機械が読める、に対して)形で行い、取引したい当事者たちのコミュニケーション環境構築とともに行うことを推奨しているところがユニークだ。
ここに掲げられた方式が決定版になるかどうかはまだ見えないが、データ取引市場を、諸権利を守りながら、活性化させることの意義は大きい。「データ市場を活かす国家戦略」を、具体性をもって構想することが重要であることは間違いない。



Evidence Vol.003をダウンロードする [A4 4ページ / PDF]

PAGE TOP