ブログトップ 記事一覧 ログイン 無料ブログ開設

piyolog RSSフィード

2013-12-26

Baidu IMEとSimejiの情報送信問題についてまとめてみた。

| 02:09 | Baidu IMEとSimejiの情報送信問題についてまとめてみた。を含むブックマーク

Baiduの提供するIMEWindows向けの「Baidu IME」とAndroid OS向けの「Simeji」を通じて端末に入力した情報が同社のサーバーへ送信されていると報じられました。ここではBaidu社の日本語入力ソフトの情報送信問題についてまとめます。

まず読んでおきたい

この件についてまず読んでおくべき情報(記事)を列挙します。

今回騒ぎとなる発端はIIJ-SECTのオンライン機能を利用するIMEについて注意喚起する投稿から。

Baidu社のアプリを解析しその結果を公開したNetAgent社の記事。

報道を受け公式見解を発表したBaidu社のプレスリリース

次に読みたい

Simejiが送信を行っていたことは今回初めて報告されたのですが、Baidu IMEの予測変換機能「クラウド入力」は2011年11月(2年前!)にこの機能が追加された直後からデータの送信を行っていることについて問題が指摘されており、黒翼猫さんも記事を書いています。

他にもBaidu IME周りで色々調べられていたようです。

あとNetAgent社の分析記事へのコメントもしていますね。

さらに今回の件を受けて再度検証記事を公開されています。主にNHKの記事に対してBaidu IMEの挙動が実際どうなのかについての検証内容です。NHK報道ではSimejiだけでなくBaiduIMEも機能をオフにしても入力情報が送信されるかのような記載がありますが、少なくともBaiduIMEは機能をオフにしておけばBaidu社へ送信は行われないようです。

Baidu IMESimejiの問題が指摘されている機能

「端末で入力した情報をBaidu社へ送信している」として問題が指摘されている機能は次の2つです。そして公式、非公式含め、現在確認されている情報ではこの機能以外で外部へ入力情報を送信する機能はないようです。ただし、Simejiについては「ユーザー行為の情報」と「クラッシュログ」を送信していると発表しています。*1

ログ送信機能

クラウド入力機能
  • クラウド変換」とBaiduが呼称する入力情報を外部のサーバーへ送信し、変換候補を取得する機能
  • 実装時期
  • 問題発覚以前の既定設定
  • 送信される情報
  • その他
    • 送信した入力情報は「保存されない」とBaiduから発表されていたが、Simejiは「保管している(60日以内に破棄)」と発表。
    • 通信はHTTPSで行われる。
      ただしBaidu IMEではHTTPSで送信に失敗するとHTTP(平文)で再度送信を行う実装を確認したとの情報がある。
    • Baidu IME 3.4まではチェックを外しただけでは当該機能は無効にならず送信を続ける実装だった。(要再起動)
    • Simeji 6.6まではチェックを外しても無効化されずに送信が行われた。
    • Simejiには「英語予測変換機能」という別の機能が存在する。この機能が半角文字を送信しているとの指摘がある。
    • Simejiで、パスワード入力フィールドで入力した情報は送信されない。
この他の情報送信をする機能

Simejiでは次の情報が「クラウド変換機能」、「ログ情報の送信」の設定に関らず送信されると発表しています。

  • ユーザー行為の情報(基本情報)
    • Android OSのバージョン情報
    • Simejiバージョン情報
    • 使用しているキーボードタイプ(例 フリック入力かケータイ入力)
    • 履歴情報(詳細不明)
  • クラッシュログ

今回の経緯

今回の経緯をタイムラインで整理します。

ここからの経緯は推測ですが、IIJ社が例の発表後に読売新聞の取材を受けており読売新聞内閣官房情報セキュリティセンターへ情報送信についての照会をしたのかもしれません。そこから関係組織への注意喚起とメディア各社へ広まったのであれば、NHK側からNetAgent社に対して調査依頼があったこともつじつまが合うように思います。また並行してBaidu社も照会を受けていたと考えられ、報道が出る前にこの問題を認識し、修正版を25日に公開出来たのだろうと思います。Simejiが後手に回った(関係者には報道が出る以前に伝達はされていなかった)のはBaidu IMEの問題しか情報が伝わっていなかったからかもしれません。読売新聞26日の朝刊ではSimejiについて取り上げていません。

Baidu IMEインストールしていた組織

12/26の報道以降、Baidu IMEインストールしていたと報告・報道された組織は次の通りです。

組織名確認された台数情報漏えいの可能性発覚の経緯インストールした理由
外務省5部署公用PC5台重大な機密は扱っていない
詳細は非公開
NISCからの注意喚起を受けてと思われる 
文部科学省2台重大な機密は扱っていないNISCからの注意喚起を受けてと思われる 
筑波大学不明不明文科省からの注意喚起を受けてと思われる 
東京大学通信発生は確認したがPC特定不可不明文科省からの注意喚起を受けてと思われる 
お茶の水女子大学不明不明文科省からの注意喚起を受けてと思われる 
東京工業大学事務系PC16台不明文科省からの注意喚起を受けてと思われる 
信州大学不明不明文科省からの注意喚起を受けてと思われる 
名古屋大学不明不明文科省からの注意喚起を受けてと思われる 
滋賀医科大学不明不明文科省からの注意喚起を受けてと思われる 
京都大学不明不明文科省からの注意喚起を受けてと思われる 
大阪大学不明不明文科省からの注意喚起を受けてと思われる 
奈良女子大学不明不明文科省からの注意喚起を受けてと思われる 
九州大学不明不明文科省からの注意喚起を受けてと思われる 
宮崎大学不明不明文科省からの注意喚起を受けてと思われる 
国立教育政策研究所2台不明文科省からの注意喚起を受けてと思われる 
愛知県豊田市市民福祉部、企画制作部等8部局の14台調査中と報道不明(総務省注意喚起は26日以降と思われるため) 
福島県職員貸与PC10台4台のPCから個人情報が漏えいした可能性*29総務省からの注意喚起を受けてと思われる 
静岡県下田市業務PC4台漏えいはない12/26報道を受けて別ソフトにバンドルされていたため
香川県出先機関PC 9台漏えいは確認されていない不明別ソフトにバンドルされていた可能性
大倉工業9台業務には使用していない不明不明

Baidu IMEの機能変遷

いつから何がどのように変わっていったのかが分かっていなかったので、Baidu社やメディアの記事を元に機能の変遷を把握できた範囲で整理してみました。

製品名主な変更点リリース日バージョンログ送信機能クラウド入力機能
Baidu Typeベータ版公開2009/12/16ベータ 1.0既定で有効
 ↓ログ送信機能 既定で無効化2009/12/18ベータ既定で無効に変更
 ↓WindowsVista/7に対応2011/07/28ベータ(既定で無効)↓
 ↓カナ英語変換に対応2010/02/05ベータ(既定で無効)
 ↓ユーザー辞書機能、更新機能が追加2010/03/26ベータ(既定で無効)
 ↓オプション辞書機能が追加2010/04/21ベータ(1.0.2.64)(既定で無効)
 ↓正式版リリース2010/05/101.0(既定で無効)
 ↓ツールバーにヘルプ機能が追加2010/06/091.0(既定で無効)
 ↓辞書インポート機能が追加2010/07/221.0(既定で無効)
 ↓手書き機能が追加2010/08/251.0(既定で無効)
Baidu Type 2011スクリーンショット機能を追加2011/01/31ベータ(既定で無効)
Baidu IMEBaidu Type 2011β版をBaidu IMEとしてリリース2011/03/102.0(既定で無効)
 ↓ユーザー辞書登録文字数の増加2011/04/122.0.0.8(既定で無効)
 ↓変換候補の英訳をポップアップ表示
(レビュープラス機能追加)
2011/07/282.1.0.22(既定で無効)
 ↓記号変換候補に読み方・説明表示2011/09/152.2.0.7(既定で無効)
 ↓クラウド入力機能の搭載2011/11/242.3.0.17(既定で無効)クラウド入力機能が搭載される
 ↓かな入力に対応2012/01/132.4.0.14(既定で無効)既定で有効
入力情報がSSL暗号化される
 ↓基本機能の改善2012/04/052.5.0.15(既定で無効)既定で有効
 ↓クラウド入力機能精度向上、クラウド辞書単語拡充2012/05/212.6.0.8(既定で無効)既定で有効
 ↓アスキーアート入力機能の追加2012/08/282.8.0.11(既定で無効)既定で有効
 ↓Firefoxとの互換性改善2012/09/253.0.0(既定で無効)既定で有効
 ↓学習能力やAA入力機能の強化2012/11/133.1.0.9(既定で無効)既定で有効
 ↓オンラインゲーム対応、顔文字拡充2012/12/053.2.0.7(既定で無効)既定で有効
 ↓スキン作成(マイスキン)機能が追加2013/10/103.5.1.4(既定で無効)既定で有効
 ↓入力情報送信の指摘を受け修正したと思われる2013/12/253.5.2.0(既定で無効)既定で無効に変更

Baidu IME v3.6はベータ版リリースのみのため上の表からは割愛しています。クラウド入力機能はv2.3で実装されてから既定で有効であり、黒翼猫さんの情報によればv3.4以前を利用している場合、クラウド入力機能を無効化するには設定画面のチェックを外した後にさらに再起動が必要だそうです。(v3.5以降はチェックを外すのみでクラウド入力機能は無効化される。)

Baidu IMEの通信先

Baidu IMEが通信するアクセス先は次のものが存在するようです。

URLIPアドレス用途(推測)
cloud.ime.baidu.jp119.63.198.161ログセッション(ログ情報)、クラウド変換情報の送信先。辞書情報を取得する。
URL末尾がpyの場合は入力途中の文字が、logの場合は入力確定の文字の情報が送られる。
尚、Simejiも同じサーバーへ送信している。
sync.ime.baidu.jp119.63.197.171設定情報を送信していると思われる接続先。
update.ime.baidu.jp119.63.197.130更新確認をするために送信していると思われる接続先。

/.によれば他にも次のURLがBaidu IMEと関係があるとコメント

asciiart1.baiduime.jp

ime.baidu.jp

businessplatform.ime.baidu.jp

statistic.ime.baidu.jp

popup.ime.baidu.jp

黒翼猫さんの検証によれば接続先しているURLは他にもあるようです。(2011年5月当時の情報)

type.baidu.jp

Simeji方面

今回の件を受けて、Simejiについて調査・検証されている方が何人かいらっしゃるようです。

Simejiの場合、クラウド変換を無効にしても、英語予測変換機能が有効となっている場合は、半角英数字であっても送信されるようです。

まとめ

バージョン、製品ごとの送信有無を整理しました。尚、表には含めていませんがSimejiは上述の通り半角英数字が送られているとの指摘もあります。

製品名バージョン期間ログ送信クラウド入力(変換)既定で送信される入力文字
Baidu IME2.0〜2.22011/03/10〜2011/11/23既定で無効実装無し無し
 2.3〜3.5.12011/11/24〜2013/12/25既定無効既定で有効全角入力文字(入力中含む)
 3.5.22013/12/25〜既定で無効既定で無効無し
Simeji4.11〜5.52012/05/14〜2013/03/12既定で無効既定で有効入力中の全角文字
 5.6〜6.62013/03/13〜2013/12/26既定で無効既定で有効
無効にしても送信されるバグ有り
入力中の全角文字
 6.6.22013/12/26〜既定で無効既定で無効
6.6のバグ修正済
無し

尚、Baidu社のプレスではSimejiの送信バグは「ログセッション」が対象であったと説明されていますが、12/26に緊急リリースされた6.6.2の説明では次のように「クラウド入力(変換)」に問題があったことが説明されています。実装で確認されていた問題も「クラウド入力(変換)」であり、Baidu社がクラウド入力ではなくログセッションバグとして発表した理由は不明です。(ログ送信機能にもバグがあったのかもしれません。)

緊急リリース版について

一部のバージョンで発生した、クラウド変換がオフ時でもクラウドサービスにアクセスするバグを修正しました。

また、はじめてSimejiをお使いになる場合、初期設定でクラウド変換機能はオフになるよう修正いたしました。すでにSimejiをお使いのかたの場合でも、アップデートすることでクラウド変換機能がオフになります。

https://play.google.com/store/apps/details?id=com.adamrocker.android.input.simeji&hl=ja

Baidu社もクラウド入力機能にバグがあったことを12/27付のプレスリリースで説明しました。

Simejiについては、インストール時にご案内する利用規約へ同意をいただいておりますが、クラウド変換がOFFに設定した状態でも、クラウドサービスにアクセスする不具合があり、昨日時点で修正バージョンをリリース済みです。

http://www.baidu.jp/info/press/jp/131227-2.html

まとめるとBaidu IMESimejiで意図的に機能を有効にしていた以外で、入力情報が送信された可能性のある人は次の通り。

  • 2011年11月24日以降、2013年12月25日までの最新版のBaidu IMEを設定変更せずに利用していた人。
  • 2012年5月14日以降、2013年3月12日までの最新版のSimejiを設定変更せずに利用していた人。
  • 2013年3月12日以降、2013年12月26日までの最新版のSimejiを利用していた人。

また当前ですが、Baidu IMESimeji共にクラウド入力(変換)機能を有効にすれば(仕組み上必須のため)最新版でも送信されます。

(参考)他IMEの実装状況

MS標準のIME以外について比較してみます。Baidu製のIMEは今回の件を受けて修正された最新版の情報を掲載しました。

製造元製品名費用クラウド変換
(入力文字送信)機能
入力文字の保存辞書同期機能クラッシュログ送信その他送信している情報
BaiduBaidu IME 3.5.2無料有り
既定で無効
(2013/12/25以降)
保存していない無し不明アプリケーションログ
(詳細不明)
BaiduSimeji 6.6.2無料有り
既定で無効
(2013/12/26以降)
保存している
(60日以内に破棄)
無し有り
無効不可
Androidバージョン情報
Simejiバージョン情報
Simejiの設定情報
無効不可
・よみと候補情報
既定で無効
GoogleGoogle日本語入力無料無し無し
(開発版で搭載されていたが廃止)
有り
既定で無効
OS情報
・カスタマイズ情報
・打鍵数等の統計情報
既定で無効
JustSystemATOK Passport有料有り
有料サービス(要設定)
不明有り
既定で無効
不明不明
奥野陽氏Social IME beta22無料有り
無効不可
保存している無し無し

参考情報・まとめ記事・考察記事

更新履歴

*1Simejiが取得しているデータについて,Baidu,2013/12/28アクセス:魚拓

*2中国製情報送信のソフト 使用控えて,NHK,2013/12/28アクセス:魚拓

*3入力情報、無断で外部送信=中国社ソフト、注意呼び掛け−政府,時事通信,2013/12/28アクセス

*4中国製ソフト、文字入力情報を収集 スマホからも送信,朝日新聞,2013/12/28アクセス:魚拓

*5ネットエージェント、Baidu IMEが入力内容を無断送信との調査結果を公表,ITpro,2013/12/28アクセス:魚拓

*6<注意喚起>IIC-NEWS No.013-20131220 日本語文字入力補助ソフトによる情報漏えいの危険性について2013年12月20日,信州大学,2013/12/27アクセス:魚拓

*7百度ソフト、情報外部送信停止…初期設定を変更,読売新聞,2013/12/28アクセス:魚拓

*8:入力の日本語 無断送信 外務省や大学で使用 国が注意喚起,読売新聞,2013/12/26朝刊1面

*9中国製の日本語入力ソフト 入力情報を無断送信,NHK、2013/12/28アクセス:魚拓

*10中国「百度」製ソフト、入力の日本語を無断送信,読売新聞,2013/12/28アクセス:魚拓

*11一部「日本語入力ソフト」に機密情報漏洩のおそれ、政府が注意喚起,SecurityNEXT,2013/12/28アクセス:魚拓

*12中国・百度、ネット入力情報を無断送信 漏洩の恐れ 日本語入力ソフト,日本経済新聞,2013/12/28アクセス:魚拓

*13百度ソフト、便利で人気だが「まるでウイルス」,読売新聞,2013/12/28アクセス:魚拓

*14官房長官、外務省の百度ソフト利用「極めて遺憾」 情報漏洩懸念,日本経済新聞,2013/12/28アクセス:魚拓

*15一部の報道に対する弊社の見解,Baidu,2013/12/28アクセス:魚拓

*16Simeji新バージョン6.6.2をリリース,Baidu,2013/12/28アクセス:魚拓

*17百度公司声明,百度,2013/12/28アクセス:魚拓

*18Japan Warns of Security Risk in Software for Language Input,Bloomberg,2013/12/28アクセス:魚拓

*19百度反論「IMEによる違法なデータ送信・漏洩はない」,CRI Online,2013/12/28アクセス:魚拓

*20百度ソフト、スマホ用も入力した全文を無断送信,読売新聞,2013/12/28アクセス:魚拓

*21一連の報道に対する弊社の見解,Baidu,2013/12/28アクセス:魚拓

*22一連の報道によるSimejiへのお問い合わせについて,Baidu,2013/12/27アクセス:魚拓

*23中国・百度:無償入力ソフト 福島県の個人情報流出か,毎日新聞,2013/12/28アクセス:魚拓

*24(PDF)NEWS RELEASE 緊急対応について,ピーシーデポコーポレーション,2013/12/28アクセス

*25Baidu IMEの入力情報送信報道を受け、緊急対応開始した量販店も,Internet Watch,2013/12/28アクセス:魚拓

*26百度ソフト、次官連絡会議で漏えい注意呼びかけ,読売新聞,2013/12/28アクセス:魚拓

*27百度ソフト、気づかぬうちに組み込まれた下田市,読売新聞,2013/12/29アクセス:魚拓

*28香川県PC9台に中国製ソフト/情報漏えいなし,四国新聞社,2013/12/29アクセス:魚拓

*29福島県庁PCデータ、百度サーバーに自動送信,読売新聞,2013/12/28アクセス:魚拓