piyolog

piyokangoの備忘録です。セキュリティの出来事を中心にまとめています。このサイトはGoogle Analyticsを利用しています。

Baidu IMEとSimejiの情報送信問題についてまとめてみた。

Baiduの提供するIMEWindows向けの「Baidu IME」とAndroid OS向けの「Simeji」を通じて端末に入力した情報が同社のサーバーへ送信されていると報じられました。ここではBaidu社の日本語入力ソフトの情報送信問題についてまとめます。

まず読んでおきたい

この件についてまず読んでおくべき情報(記事)を列挙します。
今回騒ぎとなる発端はIIJ-SECTのオンライン機能を利用するIMEについて注意喚起する投稿から。

Baidu社のアプリを解析しその結果を公開したNetAgent社の記事。

報道を受け公式見解を発表したBaidu社のプレスリリース。

次に読みたい

Simejiが送信を行っていたことは今回初めて報告されたのですが、Baidu IMEの予測変換機能「クラウド入力」は2011年11月(2年前!)にこの機能が追加された直後からデータの送信を行っていることについて問題が指摘されており、黒翼猫さんも記事を書いています。

他にもBaidu IME周りで色々調べられていたようです。

あとNetAgent社の分析記事へのコメントもしていますね。

さらに今回の件を受けて再度検証記事を公開されています。主にNHKの記事に対してBaidu IMEの挙動が実際どうなのかについての検証内容です。NHKの報道ではSimejiだけでなくBaiduIMEも機能をオフにしても入力情報が送信されるかのような記載がありますが、少なくともBaiduIMEは機能をオフにしておけばBaidu社へ送信は行われないようです。

Baidu IME・Simejiの問題が指摘されている機能

「端末で入力した情報をBaidu社へ送信している」として問題が指摘されている機能は次の2つです。そして公式、非公式含め、現在確認されている情報ではこの機能以外で外部へ入力情報を送信する機能はないようです。ただし、Simejiについては「ユーザー行為の情報」と「クラッシュログ」を送信していると発表しています。*1

ログ送信機能
  • 「ログセッション」とBaiduが呼称するアプリケーションログを送信する機能
  • 実装時期
    • Baidu IME:2009年12月16日
    • Simeji:不明
  • 問題発覚以前の既定設定
  • 送信される情報(Simejiの場合)
  • その他
    • 送信したアプリケーションログの情報は一定期間保存された後、廃棄される。
    • Baidu IME(当時Baidu Type)において2009年12月18日以降当該機能は既定で無効となっている。

クラウド入力機能
  • クラウド変換」とBaiduが呼称する入力情報を外部のサーバーへ送信し、変換候補を取得する機能
  • 実装時期
    • Baidu IME:2011年11月24日
    • Simeji:2012年5月14日
  • 問題発覚以前の既定設定
  • 送信される情報
    • 入力情報
    • 入力を行っているアプリケーション実行パス
  • その他
    • 送信した入力情報は「保存されない」とBaiduから発表されていたが、Simejiは「保管している(60日以内に破棄)」と発表。
    • 通信はHTTPSで行われる。
      ただしBaidu IMEではHTTPSで送信に失敗するとHTTP(平文)で再度送信を行う実装を確認したとの情報がある。
    • Baidu IME 3.4まではチェックを外しただけでは当該機能は無効にならず送信を続ける実装だった。(要再起動)
    • Simeji 6.6まではチェックを外しても無効化されずに送信が行われた。
    • Simejiには「英語予測変換機能」という別の機能が存在する。この機能が半角文字を送信しているとの指摘がある。
    • Simejiで、パスワード入力フィールドで入力した情報は送信されない。
この他の情報送信をする機能

Simejiでは次の情報が「クラウド変換機能」、「ログ情報の送信」の設定に関らず送信されると発表しています。

  • ユーザー行為の情報(基本情報)
    • Android OSのバージョン情報
    • Simejiバージョン情報
    • 使用しているキーボードタイプ(例 フリック入力かケータイ入力)
    • 履歴情報(詳細不明)
  • クラッシュログ

今回の経緯

今回の経緯をタイムラインで整理します。

  • 2013/12/17
    • IIJのCSIRT、IIJ-SECTが製品名をぼかした内容で注意喚起を掲載した。
  • 2013/12/19
    • 内閣官房情報セキュリティセンターが省庁へ注意喚起を行った。*2 *3 *4
  • 2013/12/20
    • 文部科学省が約120(日経は約180と報道)の大学、教育、研究機関へ注意喚起を行った。*5
      (文科省から各組織へ行われたと思われる注意喚起の内容:*6 )
  • 2013/12/25
    • BaiduがBaidu IMEの修正版3.5.2を公開した。*7
    • 愛知県豊田市の14台の端末でBaidu IMEを利用していたことが判明した。
  • 2013/12/26
    • 読売新聞、NHKがBaidu社製IMEの情報送信問題を報じた。*8 *9
    • 他メディア各社が一斉にBaidu社の日本語入力ソフトに問題があることを報じた。
    • 外務省の5台の端末でBaidu IMEを利用していたと報じられた。*10
    • 文部科学省の2台の端末でBaidu IMEを利用していたと報じられた。*11 *12
    • 東京大学等の12大学の一部PCでBaidu IMEが導入されていたと報じられた。*13
    • 官房長官が「機密性を有する情報を外部に送信することは統一管理基準上禁止されている」と記者会見で発言した。*14
    • NetAgent社が解析結果をBlogに掲載した。
    • BaiduがBaidu IME/Simejiの情報送信問題について見解とSimejiの情報送信がバグであることを発表した。*15
    • BaiduがSimejiの修正版6.6.2を公開した。*16
    • Baidu中国本社がブルームバーグの報道を受け新浪微博に声明を発表した。*17
      ブルームバーグの記事は直接引用をされていないが、この記事*18と思われる。*19
    • 総務省が全国自治体に対して注意喚起を行うことを明らかにしたと報じられた。*20
    • 国立教育政策研究所の2台の端末でBaidu IMEを利用していたと報じられた。
  • 2013/12/27
    • Baiduが一連の報道に対して誤った認識であるとして見解を発表した。*21
    • BaiduがSimejiについてFAQを公開した。*22
    • 福島県で10台の端末でBaiduIMEが利用されており、個人情報が流出した可能性が報じられた。*23
    • Baidu IMEがプレインストールされているPC等に対する緊急対応(インストールの有無確認)を行うとPC DEPOTが発表した。*24 *25
    • 官房副長官事務次官連絡会議で重要情報が漏えいしないよう配慮してほしいと注意喚起を行った。*26
  • 2013/12/28
    • BaiduがSimejiで取得しているデータについて発表した。
    • 静岡県下田市の4台の端末でBaidu IMEが導入されていたと報じられた。*27
    • 香川県や同県の企業でBaidu IMEが導入されていたと報じられた。*28

ここからの経緯は推測ですが、IIJ社が例の発表後に読売新聞の取材を受けており、読売新聞が内閣官房情報セキュリティセンターへ情報送信についての照会をしたのかもしれません。そこから関係組織への注意喚起とメディア各社へ広まったのであれば、NHK側からNetAgent社に対して調査依頼があったこともつじつまが合うように思います。また並行してBaidu社も照会を受けていたと考えられ、報道が出る前にこの問題を認識し、修正版を25日に公開出来たのだろうと思います。Simejiが後手に回った(関係者には報道が出る以前に伝達はされていなかった)のはBaidu IMEの問題しか情報が伝わっていなかったからかもしれません。読売新聞26日の朝刊ではSimejiについて取り上げていません。

Baidu IMEをインストールしていた組織

12/26の報道以降、Baidu IMEをインストールしていたと報告・報道された組織は次の通りです。

組織名 確認された台数 情報漏えいの可能性 発覚の経緯 インストールした理由
外務省 5部署公用PC5台 重大な機密は扱っていない
詳細は非公開
NISCからの注意喚起を受けてと思われる  
文部科学省 2台 重大な機密は扱っていない NISCからの注意喚起を受けてと思われる  
筑波大学 不明 不明 文科省からの注意喚起を受けてと思われる  
東京大学 通信発生は確認したがPC特定不可 不明 文科省からの注意喚起を受けてと思われる  
お茶の水女子大学 不明 不明 文科省からの注意喚起を受けてと思われる  
東京工業大学 事務系PC16台 不明 文科省からの注意喚起を受けてと思われる  
信州大学 不明 不明 文科省からの注意喚起を受けてと思われる  
名古屋大学 不明 不明 文科省からの注意喚起を受けてと思われる  
滋賀医科大学 不明 不明 文科省からの注意喚起を受けてと思われる  
京都大学 不明 不明 文科省からの注意喚起を受けてと思われる  
大阪大学 不明 不明 文科省からの注意喚起を受けてと思われる  
奈良女子大学 不明 不明 文科省からの注意喚起を受けてと思われる  
九州大学 不明 不明 文科省からの注意喚起を受けてと思われる  
宮崎大学 不明 不明 文科省からの注意喚起を受けてと思われる  
国立教育政策研究所 2台 不明 文科省からの注意喚起を受けてと思われる  
愛知県豊田市 市民福祉部、企画制作部等8部局の14台 調査中と報道 不明(総務省注意喚起は26日以降と思われるため)  
福島県 職員貸与PC10台 4台のPCから個人情報が漏えいした可能性*29 総務省からの注意喚起を受けてと思われる  
静岡県下田市 業務PC4台 漏えいはない 12/26報道を受けて 別ソフトにバンドルされていたため
香川県 出先機関PC 9台 漏えいは確認されていない 不明 別ソフトにバンドルされていた可能性
大倉工業 9台 業務には使用していない 不明 不明

Baidu IMEの機能変遷

いつから何がどのように変わっていったのかが分かっていなかったので、Baidu社やメディアの記事を元に機能の変遷を把握できた範囲で整理してみました。

製品名 主な変更点 リリース日 バージョン ログ送信機能 クラウド入力機能
Baidu Type ベータ版公開 2009/12/16 ベータ 1.0 既定で有効
 ↓ ログ送信機能 既定で無効化 2009/12/18 ベータ 既定で無効に変更
 ↓ WindowsVista/7に対応 2011/07/28 ベータ (既定で無効)↓
 ↓ カナ英語変換に対応 2010/02/05 ベータ (既定で無効)
 ↓ ユーザー辞書機能、更新機能が追加 2010/03/26 ベータ (既定で無効)
 ↓ オプション辞書機能が追加 2010/04/21 ベータ(1.0.2.64) (既定で無効)
 ↓ 正式版リリース 2010/05/10 1.0 (既定で無効)
 ↓ ツールバーにヘルプ機能が追加 2010/06/09 1.0 (既定で無効)
 ↓ 辞書インポート機能が追加 2010/07/22 1.0 (既定で無効)
 ↓ 手書き機能が追加 2010/08/25 1.0 (既定で無効)
Baidu Type 2011 スクリーンショット機能を追加 2011/01/31 ベータ (既定で無効)
Baidu IME Baidu Type 2011β版をBaidu IMEとしてリリース 2011/03/10 2.0 (既定で無効)
 ↓ ユーザー辞書登録文字数の増加 2011/04/12 2.0.0.8 (既定で無効)
 ↓ 変換候補の英訳をポップアップ表示
(レビュープラス機能追加)
2011/07/28 2.1.0.22 (既定で無効)
 ↓ 記号変換候補に読み方・説明表示 2011/09/15 2.2.0.7 (既定で無効)
 ↓ クラウド入力機能の搭載 2011/11/24 2.3.0.17 (既定で無効) クラウド入力機能が搭載される
 ↓ かな入力に対応 2012/01/13 2.4.0.14 (既定で無効) 既定で有効
入力情報がSSLで暗号化される
 ↓ 基本機能の改善 2012/04/05 2.5.0.15 (既定で無効) 既定で有効
 ↓ クラウド入力機能精度向上、クラウド辞書単語拡充 2012/05/21 2.6.0.8 (既定で無効) 既定で有効
 ↓ アスキーアート入力機能の追加 2012/08/28 2.8.0.11 (既定で無効) 既定で有効
 ↓ Firefoxとの互換性改善 2012/09/25 3.0.0 (既定で無効) 既定で有効
 ↓ 学習能力やAA入力機能の強化 2012/11/13 3.1.0.9 (既定で無効) 既定で有効
 ↓ オンラインゲーム対応、顔文字拡充 2012/12/05 3.2.0.7 (既定で無効) 既定で有効
 ↓ スキン作成(マイスキン)機能が追加 2013/10/10 3.5.1.4 (既定で無効) 既定で有効
 ↓ 入力情報送信の指摘を受け修正したと思われる 2013/12/25 3.5.2.0 (既定で無効) 既定で無効に変更

Baidu IME v3.6はベータ版リリースのみのため上の表からは割愛しています。クラウド入力機能はv2.3で実装されてから既定で有効であり、黒翼猫さんの情報によればv3.4以前を利用している場合、クラウド入力機能を無効化するには設定画面のチェックを外した後にさらに再起動が必要だそうです。(v3.5以降はチェックを外すのみでクラウド入力機能は無効化される。)

Baidu IMEの通信先

Baidu IMEが通信するアクセス先は次のものが存在するようです。

URL IPアドレス 用途(推測)
cloud.ime.baidu.jp 119.63.198.161 ログセッション(ログ情報)、クラウド変換情報の送信先。辞書情報を取得する。
URL末尾がpyの場合は入力途中の文字が、logの場合は入力確定の文字の情報が送られる。
尚、Simejiも同じサーバーへ送信している。
sync.ime.baidu.jp 119.63.197.171 設定情報を送信していると思われる接続先。
update.ime.baidu.jp 119.63.197.130 更新確認をするために送信していると思われる接続先。

/.によれば他にも次のURLがBaidu IMEと関係があるとコメント

asciiart1.baiduime.jp
ime.baidu.jp
businessplatform.ime.baidu.jp
statistic.ime.baidu.jp
popup.ime.baidu.jp

黒翼猫さんの検証によれば接続先しているURLは他にもあるようです。(2011年5月当時の情報)

type.baidu.jp

Simeji方面

今回の件を受けて、Simejiについて調査・検証されている方が何人かいらっしゃるようです。

Simejiの場合、クラウド変換を無効にしても、英語予測変換機能が有効となっている場合は、半角英数字であっても送信されるようです。

まとめ

バージョン、製品ごとの送信有無を整理しました。尚、表には含めていませんがSimejiは上述の通り半角英数字が送られているとの指摘もあります。

製品名 バージョン 期間 ログ送信 クラウド入力(変換) 既定で送信される入力文字
Baidu IME 2.0〜2.2 2011/03/10〜2011/11/23 既定で無効 実装無し 無し
  2.3〜3.5.1 2011/11/24〜2013/12/25 既定無効 既定で有効 全角入力文字(入力中含む)
  3.5.2 2013/12/25〜 既定で無効 既定で無効 無し
Simeji 4.11〜5.5 2012/05/14〜2013/03/12 既定で無効 既定で有効 入力中の全角文字
  5.6〜6.6 2013/03/13〜2013/12/26 既定で無効 既定で有効
無効にしても送信されるバグ有り
入力中の全角文字
  6.6.2 2013/12/26〜 既定で無効 既定で無効
6.6のバグ修正済
無し

尚、Baidu社のプレスではSimejiの送信バグは「ログセッション」が対象であったと説明されていますが、12/26に緊急リリースされた6.6.2の説明では次のように「クラウド入力(変換)」に問題があったことが説明されています。実装で確認されていた問題も「クラウド入力(変換)」であり、Baidu社がクラウド入力ではなくログセッションをバグとして発表した理由は不明です。(ログ送信機能にもバグがあったのかもしれません。)

緊急リリース版について
一部のバージョンで発生した、クラウド変換がオフ時でもクラウドサービスにアクセスするバグを修正しました。
また、はじめてSimejiをお使いになる場合、初期設定でクラウド変換機能はオフになるよう修正いたしました。すでにSimejiをお使いのかたの場合でも、アップデートすることでクラウド変換機能がオフになります。

https://play.google.com/store/apps/details?id=com.adamrocker.android.input.simeji&hl=ja

Baidu社もクラウド入力機能にバグがあったことを12/27付のプレスリリースで説明しました。

Simejiについては、インストール時にご案内する利用規約へ同意をいただいておりますが、クラウド変換がOFFに設定した状態でも、クラウドサービスにアクセスする不具合があり、昨日時点で修正バージョンをリリース済みです。

http://www.baidu.jp/info/press/jp/131227-2.html

まとめるとBaidu IME、Simejiで意図的に機能を有効にしていた以外で、入力情報が送信された可能性のある人は次の通り。

  • 2011年11月24日以降、2013年12月25日までの最新版のBaidu IMEを設定変更せずに利用していた人。
  • 2012年5月14日以降、2013年3月12日までの最新版のSimejiを設定変更せずに利用していた人。
  • 2013年3月12日以降、2013年12月26日までの最新版のSimejiを利用していた人。

また当前ですが、Baidu IME、Simeji共にクラウド入力(変換)機能を有効にすれば(仕組み上必須のため)最新版でも送信されます。

(参考)他IMEの実装状況

MS標準のIME以外について比較してみます。Baidu製のIMEは今回の件を受けて修正された最新版の情報を掲載しました。

製造元 製品名 費用 クラウド変換
(入力文字送信)機能
入力文字の保存 辞書同期機能 クラッシュログ送信 その他送信している情報
Baidu Baidu IME 3.5.2 無料 有り
既定で無効
(2013/12/25以降)
保存していない 無し 不明 アプリケーションログ
(詳細不明)
Baidu Simeji 6.6.2 無料 有り
既定で無効
(2013/12/26以降)
保存している
(60日以内に破棄)
無し 有り
無効不可
Androidバージョン情報
・Simejiバージョン情報
・Simejiの設定情報
無効不可
・よみと候補情報
既定で無効
Google Google日本語入力 無料 無し 無し
(開発版で搭載されていたが廃止)
有り
既定で無効
・OS情報
・カスタマイズ情報
・打鍵数等の統計情報
既定で無効
JustSystem ATOK Passport 有料 有り
有料サービス(要設定)
不明 有り
既定で無効
不明 不明
奥野陽氏 Social IME beta22 無料 有り
無効不可
保存している 無し 無し

更新履歴

*1:Simejiが取得しているデータについて,Baidu,2013/12/28アクセス:魚拓

*2:中国製情報送信のソフト 使用控えて,NHK,2013/12/28アクセス:魚拓

*3:入力情報、無断で外部送信=中国社ソフト、注意呼び掛け−政府,時事通信,2013/12/28アクセス

*4:中国製ソフト、文字入力情報を収集 スマホからも送信,朝日新聞,2013/12/28アクセス:魚拓

*5:ネットエージェント、Baidu IMEが入力内容を無断送信との調査結果を公表,ITpro,2013/12/28アクセス:魚拓

*6:<注意喚起>IIC-NEWS No.013-20131220 日本語文字入力補助ソフトによる情報漏えいの危険性について2013年12月20日,信州大学,2013/12/27アクセス:魚拓

*7:百度ソフト、情報外部送信停止…初期設定を変更,読売新聞,2013/12/28アクセス:魚拓

*8:入力の日本語 無断送信 外務省や大学で使用 国が注意喚起,読売新聞,2013/12/26朝刊1面

*9:中国製の日本語入力ソフト 入力情報を無断送信,NHK、2013/12/28アクセス:魚拓

*10:中国「百度」製ソフト、入力の日本語を無断送信,読売新聞,2013/12/28アクセス:魚拓

*11:一部「日本語入力ソフト」に機密情報漏洩のおそれ、政府が注意喚起,SecurityNEXT,2013/12/28アクセス:魚拓

*12:中国・百度、ネット入力情報を無断送信 漏洩の恐れ 日本語入力ソフト,日本経済新聞,2013/12/28アクセス:魚拓

*13:百度ソフト、便利で人気だが「まるでウイルス」,読売新聞,2013/12/28アクセス:魚拓

*14:官房長官、外務省の百度ソフト利用「極めて遺憾」 情報漏洩懸念,日本経済新聞,2013/12/28アクセス:魚拓

*15:一部の報道に対する弊社の見解,Baidu,2013/12/28アクセス:魚拓

*16:Simeji新バージョン6.6.2をリリース,Baidu,2013/12/28アクセス:魚拓

*17:百度公司声明,百度,2013/12/28アクセス:魚拓

*18:Japan Warns of Security Risk in Software for Language Input,Bloomberg,2013/12/28アクセス:魚拓

*19:百度反論「IMEによる違法なデータ送信・漏洩はない」,CRI Online,2013/12/28アクセス:魚拓

*20:百度ソフト、スマホ用も入力した全文を無断送信,読売新聞,2013/12/28アクセス:魚拓

*21:一連の報道に対する弊社の見解,Baidu,2013/12/28アクセス:魚拓

*22:一連の報道によるSimejiへのお問い合わせについて,Baidu,2013/12/27アクセス:魚拓

*23:中国・百度:無償入力ソフト 福島県の個人情報流出か,毎日新聞,2013/12/28アクセス:魚拓

*24:(PDF)NEWS RELEASE 緊急対応について,ピーシーデポコーポレーション,2013/12/28アクセス

*25:Baidu IMEの入力情報送信報道を受け、緊急対応開始した量販店も,Internet Watch,2013/12/28アクセス:魚拓

*26:百度ソフト、次官連絡会議で漏えい注意呼びかけ,読売新聞,2013/12/28アクセス:魚拓

*27:百度ソフト、気づかぬうちに組み込まれた下田市,読売新聞,2013/12/29アクセス:魚拓

*28:香川県PC9台に中国製ソフト/情報漏えいなし,四国新聞社,2013/12/29アクセス:魚拓

*29:福島県庁PCデータ、百度サーバーに自動送信,読売新聞,2013/12/28アクセス:魚拓