富士通研究所は7月19日、パーソナルデータに関するプライバシーリスクの自動評価技術を開発したと発表した。2017年中に施行予定の改正個人情報保護法では本人の同意がなくとも匿名加工によってパーソナルデータの第三者提供が可能になり、新技術で情報活用を支援するのが狙い。
匿名化したパーソナルデータは、医療分野などを中心に新しいサービス・製品の品質向上につながると期待される。改正法に基づくガイドラインが策定されれば、医療機関で保有する健診データなどを匿名にするなど加工して、研究機関や製薬会社などで活用することなどが想定されている。
ただし、匿名加工されたデータを提供するには、提供元が事前にガイドラインとの適合や個人特定リスク評価を行う必要があり、専門家による審査に多くの日数を要するなどの課題があった。海外では、医療機関のデータを匿名化して医療研究に利用するために、半年以上掛かったという例もあるという。
富士通研究所が今回開発した技術は、データの分布に基づいて、最も個人を特定しやすい属性の組み合わせとその特定のしやすさを、現実的な時間内で自動的に探索するもの。
匿名加工データから個人が特定されるリスクの評価と対策をスピーディーに実行するためには、個人を最も特定しやすい属性を探索し、その上で適切な匿名化手法を適用することが重要になる。しかし、性別、電話番号、住所など最も特定しやすい属性の組み合わせの計算量は膨大で、現実的な時間での探索が困難だった。
新技術では、14の属性と1万人のデータに対しても3分以内で自動的にリスクを評価する。データ分布に基づいたリスク評価を行うため、属性値の価値の重さを定義した辞書などは不要だという。
同技術の根幹となるのは、「個人特定可能な属性の組み合わせを効率的に探索する技術」と「個人データの特定しやすさを定量化する技術」の2つ。個人特定可能な属性の組み合わせを効率的に探索する技術では、特定しやすい属性の組み合わせを探索する際の無駄な探索を省略する。例えば、年齢と職業だけで特定できるレコードは、年齢と職業と本籍でも特定できることから、本籍についての探索は省く。
また、個人データの特定のしやすさを定量化する技術では、データの中で最も個人を特定しやすい属性の組み合わせを分析し、その容易度を定量化する。定量化には、日本ネットワークセキュリティ協会の情報価値算定モデルに基づいて算定。これにより、優先的に匿名化すべき属性がすぐに分かり、加工も迅速化するという。
富士通研究所では、今回開発技術以外にデータが漏えいした際の想定損害賠償額の算出や、各種匿名化ガイドラインへの適合性を判定する技術も開発している。今後は実環境での効果を検証し、2017年度をめどに実用化していく予定だ。
今回開発された技術が実用化されれば、これまでプライバシーの問題から、複数機関で自由に共有できなかった膨大なビッグデータを分析し、新薬開発や予防医療などにさらに生かせる可能性が広がる。また、今後他の分野での活用も期待される。
Copyright© 2016 ITmedia, Inc. All Rights Reserved.