国立情報学研究所情報社会相関研究系研究主幹・教授 曽根原登先生インタビュー「ユビキタス情報社会における高度サービスとプライバシーの両立を実現する新たな匿名化手法と漏えい防止手法の確立」
(第1回)

 社会における情報の発達過程を見てみると、口コミから本、テレビ、インターネットと段階を経るごとに、より広範囲かつスピーディに進化を重ねてきました。そして、インターネット時代の現在、カーナビ、SNS、スマートフォンなどで扱われる情報量は、膨大化の一途をたどっています。SNSの代表格であるフェイスブックには世界中から10 億人を超える人々がアクセスしており、そこでは、1日に10テラバイトもの情報が、やりとりされているのです。世界の先進国では、こうした膨大な情報を国の政策決定や防災などに役立てていこうという試みが進んでいますが、日本ではどのような状況なのでしょうか。様々な情報を利活用した社会のあり方を研究していらっしゃる曽根原登先生にお話を伺ってきました。

「助成研究者個人ページへ」

1978年、信州大学大学院修了。同年、日本電信電話公社(現、NTT) 入社。以後、ファクシミリの研究実用化、神経回路網システム、手書き文字認識システム、気象予測システムの研究実用化、コンテンツID標準、コンテンツ流通システム等の研究実用化に従事。1988年~1992年、国際電気通信基礎研究所(ATR) 視聴覚研究所出向。2004年より、国立情報学研究所 情報流通基盤研究部門 教授。情報流通システム、認証システムの研究開発に従事。国立大学法人 総合研究大学院大学 複合科学研究科 情報学専攻 教授兼務。2006年~現在 国立情報学研究所 情報社会相関研究系 研究主幹・教授。2012年~2014年、総合研究大学院大学 複合科学研究科 研究科長、1999年~2003年、東京工業大学連携講座 客員教授。工学博士、 電子通信学会、映像情報メディア学会、画像電子学会など会員。


まず先生の専門分野について教えていただけますか?

  私は、国立情報学研究所に属しており、これからどういう社会になって、どういった情報を提供すると新しい産業が興り、安心安全かつ便利な生活ができるだろうかということを研究しています。今、先進諸国はどこも、ビッグデータをどう活用するかという方向に向かっています。その中で、私は特に人間・社会データという部分を中心に研究していますが、ここには、プライバシー情報や個人や法人情報などもからんできます。こういった情報の取扱いが難しいデータの収集と共有化の仕組みやルールを作るのが私の研究です。

ビックデータという言葉を最近よく耳にするようになりましたが、詳しく説明をお願いします。

  実は、ビッグデータに関する明確な定義はまだありませんが、世界中でIT技術や通信環境が進歩したことにより、膨大な量のデータが取り扱われるようになってきました。ビッグデータで扱われている情報量は、従来の比ではありません。一説には、数十テラバイトから数ペタバイト(1ペタバイト=1000テラバイト)もの容量を持つと言われています。しかし、ただ容量の大きなデータをビッグデータと呼ぶわけではありません。ビッグデータは、容量の大きさはもちろんのこと、データの多様性や内容の更新速度が速いという特長も併せ持っているのです。
  スマートフォンのデータを例に説明すると、持ち主の年齢や性別などの個人データを始め、電波による位置情報など様々な種類のデータが存在します。また、位置情報については、持ち主が移動するのに従い、刻々と変化をします。スマートフォン以外にもSNSやツイッターへの投稿、カーナビなど、私たちの日常生活の軌跡が実に多種多様なデータとなりネット上に蓄積され続けていますが、こうした多様なデータを積み重ねることで、情報はさらなる価値を生み出すのです。

いろいろなデータを積み重ねることで、どのように利用価値が高まるのでしょうか?

  ビッグデータは、国の政策決定や経済予測、医療や健康管理、自然災害など実に様々な事象の分析や予測などに役立てることが可能です。具体例を挙げて説明しましょう。NHKが今年放送した「震災BIG DATA」という番組があります。この中で、東日本大震災の当日に、東京都内を走行していた車に搭載されていたカーナビの走行記録を一台ずつ重ね合わせることで、平常時では考えられない渋滞が発生していたことが分ったのです。もしも、渋滞情報をリアルタイムで緊急車両に伝えることができていたら、救助活動がもっとスムーズに行えていたはずです。また、あの日、個人が持っていた携帯電話の位置情報を集めて解析することで、主要な駅の周辺は、250メートル四方に3万人以上もの人が密集しており、一歩間違えば、パニックが起こっていたかもしれないということが分っています。さらにそのデータと、ツイッターに投稿されたコメントの内容を照らし合わせたところ、震災発生当初は、電車の運行についての情報のやりとりが主だったのに対して、時間の経過と共に、人の多さやパニックへの不安へと群集心理が移り変わっていく様子が克明にわかるのです。

なるほど、様々なデータを積み重ね解析することで、これまで見えていなかったことが見えるようになるのですね。

  その通りです。しかも情報が数値化されるので、例えばどこに何人の怪我人がいるからそれに対して救急車を何台配備すればいいのかといった具体的な対策をたてることができます。東日本大震災の時に得られた膨大なデータ類は、近い将来発生するとも言われている首都圏直下型地震への防災対策に活かされるべきだと思うのです。

従来より、わが国の政策決定に使われるデータとしては、国勢調査など人手による社会調査という手法がとられてきました。しかしこれまでのように調査員が一軒一軒の家を訪ねて、書類に記載するようなアナログな方法では、限界があるようにも感じられるのですが。

  そうですね、現代のように意思決定にスピードが要求される世の中においてふさわしい方法だとは思えません。また、サンプル調査という方法ですので、調査結果に隔たりが出ることや、人件費として多額の経費がかかっていることもデメリットです。さらに個人情報保護法のあおりを受けて、調査に応じない世帯が増えてきているということも聞いています。
  実は、私自身は、わざわざ手間のかかる調査を実施しなくても、ネット上で公開されているデータを利用することで、おおよそのことが分かると思っているんです。