ビッグデータとプライバシーについて

DISCLAIMER: 私はプライバシー分野はもちろん一応の勉強はしていますが、必ずしもコアな専門領域というわけではないのでBest Effortベースで書いています。もっと詳しい方からのコメントを期待します。

IBMの「ビッグデータ」担当の人が日経ITProのインタビュー記事で「ビッグデータ」の応用として通話履歴(CDR)を使ってソーシャルグラフを作るというような事例を挙げたのに対して「それは通信の秘密に反する違法行為ではないか」ということで、twitter界隈を中心にプチ炎上的な状況になっています(参考togetter)。

そもそも、「ビッグデータ」と言う言葉が出る前から通話履歴情報の分析はデータウェアハウスの重要応用分野でした。通話履歴の分析がいっさいできないということであれば容量計画もできないですし料金の設定もできません。

過去にこの手のデータウェアハウス・アプリケーションについてベンダーや通信事業者(欧米)の人の話を聞いた時にプライバシー面での話を聞いたことも何回かありますが、その時の回答は、「個人とのひも付けがされない分析であれば問題ない」というものでした。

CDRとソーシャルグラフとの関係で言えば、ソーシャルグラフのノードに個人識別情報(電話番号、名前等)が入ってると問題ですが、そうではなくて、全体的な分析、たとえばソーシャルグラフの次数(ノードにつながってる辺の数)を分析するなどであれば問題ないということだと思います。あくまでも例ですが、たとえば平均次数が5であれば「3名までならかけ放題のプランを提供しても実際にはそれ以上の通話先にかける人がxx万人はいるので十分儲かるはず」みたいな分析をすることになるでしょう(当然、現実にはもっと複雑な分析をすることになります)。ただし、ここで次数が高い人にしぼって料金プランを提案するみたいないわゆるターゲティングになってくるとちょっと微妙な線ではないかと思います(たぶん、オプトインがないとまずい気がします)。

日本の規制ということでは、総務省による「電気通信事業における個人情報保護に関するガイドライン」の平成23年度版(PDF)によれば、通話履歴については

第23条 電気通信事業者は、通信履歴(利用者が電気通信を利用した日時、当該通信の相手方その他の利用者の通信に係る情報であって通信内容以外のものをいう。以下同じ。)については、課金、料金請求、苦情対応、不正利用の防止その他の業務の遂行上必要な場合に限り、記録することができる。(以下略)

となっています。そして、解説部分で、「通信履歴は、通信の構成要素であり、電気通信事業法第4条第1項の通信の秘密として保護される」としています。その一方で、「いったん記録した通信履歴は、第10条の規定に従い、記録目的に必要な範囲で保存期間を設定することを原則とし、保存期間が経過したときは速やかに通信履歴を消去(個人情報の本人が識別できなくすることを含む。)する必要がある」とも書いてある(太字強調は栗原による)ので、本人識別ができないようにすれば、通信履歴の消去と同等に扱われるようにも読めます。

ITProの記事では

また、だれがだれに電話したというデータなので、それをグラフ化すればソーシャルグラフが描ける。そうすると、ある人が基点になって周囲に頻繁に電話している、といったこともわかる。その人を中心にしたコミュニティの存在を把握できる。周囲への影響を考えると、その人が電話会社を変えないことは重要である、といった事柄が察知できるわけだ。

こうしたことから携帯電話会社は、3カ月で通話履歴を捨てていたのは間違いだったととらえている。5年でも10年でも保存しておいて、ソーシャルグラフを活用してビジネスに活用すべきだ、と認識を改めている。通話履歴が単なる「課金用のデータ」から、「行動履歴、ソーシャルグラフ用のより重要なデータ」に変質したわけだ。

と匿名での分析かどうかが明らかになっていないので、誤解を招いてもしょうがないと言えます。また、「海外における事例を紹介するものであり、日本においても実施が可能であることを意図するものではない」と注が入っているのですが、そもそも、通話履歴からノードに個人識別情報が入っているソーシャルグラフを作ると海外(特に欧州)でも問題だと思うのですが(この辺、現在調査中です、詳しい方いたら教えてください)。

ところで、この分野での自分の知識の確認のために本をちゃんと読んでおこうかなと言うことでAmazon USで探したらそのものずばりの”Privacy and Big Data”という本(洋書)(O’Reillyです)を見つけました。Kindle版で9.9ドルです。評価を見ると「ちょっと薄いけど入門用には良い」みたいな感じだったので買いました。読み終わったら書評を書くと思います。

追加:(12/02/18 13:56)

早速、高木浩光先生からtwitterで突っ込みが入ってしまいました。「なぜ日本法で違法となるのか、ぜんぜんわかってないな。」だそうです。この分野では高木先生には教えを請いたいくらいなので批判は喜んで受けますし、私に間違いがあれば即訂正します。

「米国は日本のような「通信の秘密」の概念がない代わりに、通信についてのプライバシーという立て付けの法で保護しているが、日本法の「通信の秘密」は、プライバシーとは無関係。たとえ分析結果がプライバシーを何ら侵害しないものであっても、通信の秘密を侵してデータを使用した時点で違法。」だそうですが、さすがにそこは私もわかっております。ポイントは日本では「個人情報を抜いた通話履歴」の分析も違法なのかということです。上にも書いたように、法務省のガイドラインでは通話履歴から本人識別情報を削除すれば通話履歴自体を削除したのと同じとみなしているようなのでそこの解釈がポイントです。これについては、本当に誰か教えてください。

また、ITProの記事について「誤解を招く」と言ったのはせいいっぱい好意的に解釈しての婉曲表現です。

関連記事:

This entry was posted in IT and tagged . Bookmark the permalink.

4 Responses to ビッグデータとプライバシーについて

  1. Buriki_Gadget says:

    「通信の秘密」は個人情報保護と切り離して考えたほうがよいと思います。
    電気通信番号(電話番号など)を含む通信記録を流用するのは電気通信事業法に触れるためNGです。
    ではご指摘の、統計情報として扱えないのか?そのためにはどうすれば良いのだ?という部分は、いわゆるトラヒック分析として実際にやられていると思います。
    設備投資計画や、マーケティングの両面で重要なデータになると思います。

    ここからは根拠を調べておらず推測になりますが、通信履歴の「電気通信番号」を無意味な記号に置き換えて統計データとして分析することは通信の秘密を侵害しないのではないかと考えます。
    通信記録を「03-1111-2222→A」「03-1111-3333→B」などに置き換えた上で、統計データとして分析する部門に渡すことで、通信の秘密は守っていると主張できるような気もします。が、実際のオペレーションとして、どのような取り扱い(部門間の受け渡しなど)をすれば、「実は電気通信番号を使ってるんでないの?」という疑念に対して説明責任を果たせるかは不明です。

  2. kurikiyo says:

    ということは(個人情報を抜いた)通話履歴を分析して「当社の加入者の平均通話時間はx分であるが週末にはy分になる」ことを知るのも違法ということでしょうか?

  3. Buriki_Gadget says:

    あ、URL貼り付けただけでpostしちゃいました。すみません。書きたかったのは以下です。

    上記URLの文書のなかで『ここで禁止行為とされている「秘密を侵す」とは、上に述べた通信の秘密の保障が及ぶ事項の秘密を侵す行為、すなわち、通信当事者以外の第三者がこれらの事実をことさら知ったり、自己又は他人のために利用したり、第三者に漏えいすることをすべて含むものです。』
    ですので、(いわゆる)電話番号から個人を特定することができるかどうかに関わらず、番号Aから番号Bへの通話履歴をデータマイニングの対象とすることは違法になるのではないかと思います。

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <img localsrc="" alt="">