東京大学大学院工学系研究科 教授 浅見泰司先生インタビュー「空間関係・統計的性質を保持しつつ空間的個体特定化危険を回避するための空間情報安全化処理方法の開発」(第2回)
データサイズが大きく、計算処理も多いとなると、サーバへの負荷が大きくなります。
そこで共同研究者の岩村恵市先生が行ったのが、秘密分散法により分散されるデータの軽量化と、安全性を保持しつつ準同型暗号の計算量を削減した、新たな秘密分散法の開発です。
通常、秘密分散法で情報をn個に分けたときは、各分散データを格納するn台のサーバが必要になります。そして復号に必要な分散情報数をk個とした場合、秘匿演算方式で何らかの統計結果を求める際には、k台のサーバに格納された分散情報に対して演算が行われるため、処理が膨大になってしまいます。
そこで、ひとつの「鍵」から分散情報を生成するシステムを作りました。k台のサーバは分散情報を格納するのではなく「鍵」を管理し、必要に応じて分散情報を生成することで、秘匿計算を実現します。
この研究はサイズが小さな多量の秘密情報をクラウドシステムに分散させることを想定したもので、スマートフォンアプリとして実装を目指しています。
通常、秘密分散法で情報をn個に分けたときは、各分散データを格納するn台のサーバが必要になります。そして復号に必要な分散情報数をk個とした場合、秘匿演算方式で何らかの統計結果を求める際には、k台のサーバに格納された分散情報に対して演算が行われるため、処理が膨大になってしまいます。
そこで、ひとつの「鍵」から分散情報を生成するシステムを作りました。k台のサーバは分散情報を格納するのではなく「鍵」を管理し、必要に応じて分散情報を生成することで、秘匿計算を実現します。
この研究はサイズが小さな多量の秘密情報をクラウドシステムに分散させることを想定したもので、スマートフォンアプリとして実装を目指しています。
そのスマートフォンアプリでは、具体的にどのようなことができるのですか。
たとえばスマートフォンでネットショッピングをしたとき「いつ、何を、いくらで購入した」という個人情報が生成されます。このとき、ユーザはアプリを使って秘匿したい情報を選び、自分で暗号化できるのです。具体的にはその個人情報を2つの分散情報に分けて、片方をクラウドシステムにアップロードし、もうひとつはユーザのスマートフォンに保管しておきます。
クラウドシステムにアップロードした情報は、単体では元データを復元することができないため、万が一、第三者に盗まれてもプライバシーは守られます。そしてこのクラウド内の分散データは、ユーザからの要求があったときのみ、ユーザのスマートフォンに送信され、スマートフォン内のもう1つの分散情報と合わせて、初めてデータの複号が可能になります。つまり自分の購買履歴などを確認したいときは、自分の端末内でのみ、データを復号することができるのです。
またユーザの同意があれば、情報収集者はクラウド上の分散情報を用いて、秘匿計算により暗号化されたまま統計結果を手に入れることができます。
クラウドシステムにアップロードした情報は、単体では元データを復元することができないため、万が一、第三者に盗まれてもプライバシーは守られます。そしてこのクラウド内の分散データは、ユーザからの要求があったときのみ、ユーザのスマートフォンに送信され、スマートフォン内のもう1つの分散情報と合わせて、初めてデータの複号が可能になります。つまり自分の購買履歴などを確認したいときは、自分の端末内でのみ、データを復号することができるのです。
またユーザの同意があれば、情報収集者はクラウド上の分散情報を用いて、秘匿計算により暗号化されたまま統計結果を手に入れることができます。

スマートフォンのような小さな端末で、こうしたシステムが実装されるというのは、すごいことだと思います。
この研究では「センシングした情報の秘匿方法」「個票を提供する際の秘匿方法」「暗号化されたデータから、目的の分析結果を入手する方法」の3つを開発し、実装化しました。それぞれ違うものに見えるかもしれませんが、数学的モデルとして考えると本質は似ています。
これらのアイデア自体は、とてもシンプルなものでした。シンプルなアイデアを上手く組み合わせて拡張させることで、今までにない新しいものを生み出すことができたのです。
これらのアイデア自体は、とてもシンプルなものでした。シンプルなアイデアを上手く組み合わせて拡張させることで、今までにない新しいものを生み出すことができたのです。
そのアイデアや、アイデアの組み合わせ方は、共同研究者とのディスカッションなどから生まれたのでしょうか。
そうです。今回の研究のキッカケとなった『シンプルなアイデア』は、その分野の専門家にしか出せないようなものではありません。他分野の研究者が別の視点から見ることで生まれた、素朴で新しい発想でした。複数人数の研究者が専門分野を超えて議論するという機会が今までなかったので、このようなチームを作れたことが本当に嬉しかったです。
逆に、今回の研究で一番苦労されたことは何ですか。
本来、このような研究で最も苦労するのは、資金面です。
たとえばネットワークを作って実証研究を行うためには、システムを開発する費用がかかります。また、データベースを作る際には、元になるデータの購入費と、必要なデータを作成するための人件費が必要です。さらに研究が進めば、海外で発表するための渡航費が発生します。
補助金の多くは“お金の使い道”にさまざまな制限がありますが、セコムさんの助成金は使用用途に関する自由度が高かったため、本当に助かりました。
たとえばネットワークを作って実証研究を行うためには、システムを開発する費用がかかります。また、データベースを作る際には、元になるデータの購入費と、必要なデータを作成するための人件費が必要です。さらに研究が進めば、海外で発表するための渡航費が発生します。
補助金の多くは“お金の使い道”にさまざまな制限がありますが、セコムさんの助成金は使用用途に関する自由度が高かったため、本当に助かりました。
この研究は、もう完了しているのでしょうか。
平成24年で一度終了していますが、説明変数のノイズの入れ方など、確証すべきことはまだまだあります。情報提供者のプライバシーが確実に保護され、かつ空間データの質と種類の向上に貢献できるよう、共同研究者の皆さんと一緒に今後もシステム開発や理論の実証を続けていきます。