豊かな未来を切り拓いていくうえで、データの利活用が重要なカギを握ることに異論をはさむ人はいないだろう。しかし一方で、こんな不安を抱いている人も多いにちがいない。「私たちのプライバシーはしっかり守られるのだろうか」と――。
データ社会において最も大切なことの1つは、プライバシー保護に対する<トラスト(信頼)>である。「私たちのプライバシーはしっかり守られている」というトラストなくして、真に豊かなデータ社会は到来しない。
連載「<サイバーセキュリティ戦記>NTTグループのプロフェッショナルたち」の第2回に登場するのは、NTTドコモの寺田雅之。いかにしてビッグデータへプライバシー保護技術を確実かつリアルタイムに適用するかという難問に挑戦した。
解決策が閃いたのは、新千歳空港から羽田空港へ向かう飛行機の中だった。NTTドコモの寺田雅之は当時、時間を見つけては札幌訪問を繰り返していた。北海道科学大学の教授に転身していた元上司に相談するためだ。
寺田の頭を悩ませていたのは、ウェーブレット変換に関する問題だった。ウェーブレット変換とは、信号処理や画像処理などに使われている周波数解析手法である。寺田は全くの専門外だったが、避けて通れない理由があった。それで周波数解析手法に詳しい札幌の元上司のもとに通っていたのだ。
寺田にとって飛行機の機内は、誰にも邪魔されることなく、集中して思索やプログラミングが行える大切な時間だ。飛行機を降り、ビッグデータへ安全にアクセス可能な環境にたどり着くと、早速Pythonで書いたプログラムを走らせた。
「すごく速い。これならリアルタイムに処理できる」
モバイル空間統計のリアルタイム化の道が拓けた瞬間だった。
モバイル空間統計による人口マップ。今どこに何人いるのかが、マップ上に色で可視化される
(https://mobakumap.jp/)
匿名化処理だけでは不十分なプライバシー保護寺田は、モバイル空間統計の開発で中心的役割を果たした人物だ。
モバイル空間統計とは、NTTドコモの携帯電話ネットワークの運用データを活用した人口統計情報である。携帯電話の位置情報等を用いて、「いつ・どんな人が・どこから・どこへ・何人移動したのか」を推計。日本全国の人の動きを把握できる。
2013年に提供を開始して以来、観光客分析や商圏分析、交通計画、防災計画など、様々な用途に活用されているが、モバイル空間統計にとって最重要といえるのがプライバシー保護である。
モバイル空間統計では、電話番号や生年月日といった個人を識別可能な情報は利用しない。生年月日を年齢層に変換してメッシュごとに人数を集計するなどの統計化を行っている。
現在、どのくらいの訪日外国人がその地域にいるのか、国別に把握することもできる
(https://mobaku.jp/)
だが実は、統計化だけでは、プライバシーの安全性を100%保証することはできない。
例えば、ある地域に80代の男性は1人しか住んでいなかったとしよう。この情報を知っている人が、モバイル空間統計のリアルタイムデータを利用すれば、その男性の行動を把握できてしまう可能性がある。
別の統計データと組み合わせることで、個人を識別できるようになる可能性は、統計化するだけでは完全にはゼロにできないのである。
寺田らは次のステップとして、日本全国24時間365日の人の動きをリアルタイムで提供することを目指していた。
リアルタイム提供するとなると、そうした僅かなリスクがないかを提供前に事前チェックすることは難しい。しかし、個人のプライバシーを侵害することは、絶対にあってはならない。
寺田らは解決策を探した。
プライバシーの安全性を数学的に保証できる「差分プライバシー」とは?有力候補は比較的すぐ見つかった。「差分プライバシー」という技術である。
簡単に説明すると、差分プライバシーとは、統計データに少量のノイズを加えて、個人に関する情報を推定できなくする技術である。前述の例では、その地域の80代の人物を1人ではなく、0人あるいは複数人に加工し、個人を特定できないようにする。