機械学習モデル(AI)の開発では学習データが重要だ。より多くのデータを用いて精度の良い学習を行うには、様々な組織が保有するデータを安全に結合して学習させることが望ましい。

 しかし組織間でデータを流通させると、個人のプライバシーを侵害する恐れや営業秘密が漏洩する危険性がある。このようなリスクを軽減し、複数の組織が持つデータを活用して機械学習を行うため、機械学習の分野では「秘密計算」の研究や実用化への取り組みが活発に進んでいる。秘密計算を使ってプライバシーを保護しつつ機械学習を行う巧みな仕組みを紹介しよう。

金融機関の不正送金防止やローン審査にも秘密計算

 情報通信研究機構(NICT)や神戸大学、エルテスは2019年2月に金融機関が不正送金の検知精度を向上させるために、機械学習の処理に準同型暗号を用いた秘密計算を適用する実証実験を行うと発表した。

 NICTなどは実証実験に先立って、複数の組織内で学習した結果を暗号化して中央サーバーに集め、中央サーバーで暗号化したまま学習結果を更新できるプライバシー保護の深層学習技術「DeepProtect」を開発した。

 この例では各銀行が持つ不正送金のデータを基に学習処理を行い、その学習結果の情報を中央サーバーに暗号化して送信して暗号化したまま中央サーバーで計算を行う。この結果、各銀行は顧客データなどを開示することなく連携させて、より多くのデータを基にした機械学習が可能になる。このように多数の組織で学習処理をしてデータを統合する機械学習は「連合学習(Federated Learning)」と呼ばれる。

秘密計算を用いた機械学習の実証実験の事例
(出所:情報通信研究機構(NICT)や神戸大学、エルテスの資料を基に筆者作成)
[画像のクリックで拡大表示]

 機械学習に秘密計算を適用する事例は今後さらに増えそうだ。秘密計算の機械学習への適用には大きく分けて、学習処理への適用、予測処理への適用、学習処理と予測処理の両方への適用の3パターンがある。学習処理に秘密計算を適用する場合、主に学習データを用いる機械学習(教師あり機械学習)に対して行う。

 金融機関での応用例をもう1つ説明しよう。金融機関にローンを申し込んだ顧客のデータに機械学習モデルを適用して与信審査をする際には、予測処理に秘密計算を適用する方法が有用だ。予測処理とは機械学習モデルに予測用データを入力し予測結果を得ることである。

 これまでは年齢や年収などの一部の個人情報を基に与信審査をするのが一般的だった。より精度の高い与信審査をするために、個人の過去の購買履歴や行動履歴など様々なデータを活用することが検討されている。

学習処理への秘密計算の適用
[画像のクリックで拡大表示]

 機械学習モデルを用いて与信の判定をするには顧客の購買履歴や行動履歴といった予測用データを集める必要がある。しかし顧客にとって、このようなデータを全て提供すると、プライバシーが守られるのかどうか不安になるだろう。

 一方、金融機関にとって与信の判定条件は営業秘密に当たる。与信の判定をする機械学習モデルの項目や値といった情報は他社に開示したくないだろう。

この先は有料会員の登録が必要です。今なら有料会員(月額プラン)が2020年1月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら