Baiduの提供するIME、Windows向けの「Baidu IME」とAndroid OS向けの「Simeji」を通じて端末に入力した情報が同社のサーバーへ送信されていると報じられました。ここではBaidu社の日本語入力ソフトの情報送信問題についてまとめます。
まず読んでおきたい
この件についてまず読んでおくべき情報(記事)を列挙します。
今回騒ぎとなる発端はIIJ-SECTのオンライン機能を利用するIMEについて注意喚起する投稿から。
- IMEのオンライン機能利用における注意について,IIJ-SECT,2013/12/26アクセス
Baidu社のアプリを解析しその結果を公開したNetAgent社の記事。
- 入力情報を送信するIME,NetAgent,2013/12/26アクセス
報道を受け公式見解を発表したBaidu社のプレスリリース。
- 一部の報道に対する弊社の見解,Baidu,2013/12/26アクセス
次に読みたい
Simejiが送信を行っていたことは今回初めて報告されたのですが、Baidu IMEの予測変換機能「クラウド入力」は2011年11月(2年前!)にこの機能が追加された直後からデータの送信を行っていることについて問題が指摘されており、黒翼猫さんも記事を書いています。
- Baidu IME への中傷が酷い件(2011/05/25)
- Baidu IME のクラウド入力の仕様がひどすぎる件(2011/12/16)
他にもBaidu IME周りで色々調べられていたようです。
- Baidu IME 最新版でインストールされるファイルとレジストリの徹底調査(2013/06/04)
- Baidu IME 最新版の徹底調査 その2 (2013/06/04)
あとNetAgent社の分析記事へのコメントもしていますね。
さらに今回の件を受けて再度検証記事を公開されています。主にNHKの記事に対してBaidu IMEの挙動が実際どうなのかについての検証内容です。NHKの報道ではSimejiだけでなくBaiduIMEも機能をオフにしても入力情報が送信されるかのような記載がありますが、少なくともBaiduIMEは機能をオフにしておけばBaidu社へ送信は行われないようです。
Baidu IME・Simejiの問題が指摘されている機能
「端末で入力した情報をBaidu社へ送信している」として問題が指摘されている機能は次の2つです。そして公式、非公式含め、現在確認されている情報ではこの機能以外で外部へ入力情報を送信する機能はないようです。ただし、Simejiについては「ユーザー行為の情報」と「クラッシュログ」を送信していると発表しています。*1
ログ送信機能
- 「ログセッション」とBaiduが呼称するアプリケーションログを送信する機能
- 実装時期
- Baidu IME:2009年12月16日
- Simeji:不明
- 問題発覚以前の既定設定
- Baidu IME:無効
- Simeji:無効
- 送信される情報(Simejiの場合)
- 「よみ」と呼ばれる情報(入力確定後の変換する前の文字列と思われる)
- 「候補」と呼ばれる情報
- 入力を行っているアプリケーション実行パス
- IMEのバージョン情報
- 個別ID
SimejiはAndroid端末のIDとは別。インストール毎にランダムな文字列を生成している。(malaさんもSimejiは単なる乱数と指摘している) - Simejiの場合はデバイス名も送信される
- その他
- 送信したアプリケーションログの情報は一定期間保存された後、廃棄される。
- Baidu IME(当時Baidu Type)において2009年12月18日以降当該機能は既定で無効となっている。
クラウド入力機能
- 「クラウド変換」とBaiduが呼称する入力情報を外部のサーバーへ送信し、変換候補を取得する機能
- 実装時期
- Baidu IME:2011年11月24日
- Simeji:2012年5月14日
- 問題発覚以前の既定設定
- Baidu IME:有効
- Simeji:有効
- 送信される情報
- 入力情報
- 入力を行っているアプリケーション実行パス
- その他
- 送信した入力情報は「保存されない」とBaiduから発表されていたが、Simejiは「保管している(60日以内に破棄)」と発表。
- 通信はHTTPSで行われる。
ただしBaidu IMEではHTTPSで送信に失敗するとHTTP(平文)で再度送信を行う実装を確認したとの情報がある。 - Baidu IME 3.4まではチェックを外しただけでは当該機能は無効にならず送信を続ける実装だった。(要再起動)
- Simeji 6.6まではチェックを外しても無効化されずに送信が行われた。
- Simejiには「英語予測変換機能」という別の機能が存在する。この機能が半角文字を送信しているとの指摘がある。
- Simejiで、パスワード入力フィールドで入力した情報は送信されない。
今回の経緯
今回の経緯をタイムラインで整理します。
- 2013/12/17
- 2013/12/19
- 2013/12/20
- 2013/12/25
- 2013/12/26
- 読売新聞、NHKがBaidu社製IMEの情報送信問題を報じた。*8 *9
- 他メディア各社が一斉にBaidu社の日本語入力ソフトに問題があることを報じた。
- 外務省の5台の端末でBaidu IMEを利用していたと報じられた。*10
- 文部科学省の2台の端末でBaidu IMEを利用していたと報じられた。*11 *12
- 東京大学等の12大学の一部PCでBaidu IMEが導入されていたと報じられた。*13
- 官房長官が「機密性を有する情報を外部に送信することは統一管理基準上禁止されている」と記者会見で発言した。*14
- NetAgent社が解析結果をBlogに掲載した。
- BaiduがBaidu IME/Simejiの情報送信問題について見解とSimejiの情報送信がバグであることを発表した。*15
- BaiduがSimejiの修正版6.6.2を公開した。*16
- Baidu中国本社がブルームバーグの報道を受け新浪微博に声明を発表した。*17
ブルームバーグの記事は直接引用をされていないが、この記事*18と思われる。*19 - 総務省が全国自治体に対して注意喚起を行うことを明らかにしたと報じられた。*20
- 国立教育政策研究所の2台の端末でBaidu IMEを利用していたと報じられた。
- 2013/12/27
- 2013/12/28
ここからの経緯は推測ですが、IIJ社が例の発表後に読売新聞の取材を受けており、読売新聞が内閣官房情報セキュリティセンターへ情報送信についての照会をしたのかもしれません。そこから関係組織への注意喚起とメディア各社へ広まったのであれば、NHK側からNetAgent社に対して調査依頼があったこともつじつまが合うように思います。また並行してBaidu社も照会を受けていたと考えられ、報道が出る前にこの問題を認識し、修正版を25日に公開出来たのだろうと思います。Simejiが後手に回った(関係者には報道が出る以前に伝達はされていなかった)のはBaidu IMEの問題しか情報が伝わっていなかったからかもしれません。読売新聞26日の朝刊ではSimejiについて取り上げていません。
Baidu IMEをインストールしていた組織
12/26の報道以降、Baidu IMEをインストールしていたと報告・報道された組織は次の通りです。
組織名 | 確認された台数 | 情報漏えいの可能性 | 発覚の経緯 | インストールした理由 |
---|---|---|---|---|
外務省 | 5部署公用PC5台 | 重大な機密は扱っていない 詳細は非公開 |
NISCからの注意喚起を受けてと思われる | |
文部科学省 | 2台 | 重大な機密は扱っていない | NISCからの注意喚起を受けてと思われる | |
筑波大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
東京大学 | 通信発生は確認したがPC特定不可 | 不明 | 文科省からの注意喚起を受けてと思われる | |
お茶の水女子大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
東京工業大学 | 事務系PC16台 | 不明 | 文科省からの注意喚起を受けてと思われる | |
信州大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
名古屋大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
滋賀医科大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
京都大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
大阪大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
奈良女子大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
九州大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
宮崎大学 | 不明 | 不明 | 文科省からの注意喚起を受けてと思われる | |
国立教育政策研究所 | 2台 | 不明 | 文科省からの注意喚起を受けてと思われる | |
愛知県豊田市 | 市民福祉部、企画制作部等8部局の14台 | 調査中と報道 | 不明(総務省注意喚起は26日以降と思われるため) | |
福島県 | 職員貸与PC10台 | 4台のPCから個人情報が漏えいした可能性*29 | 総務省からの注意喚起を受けてと思われる | |
静岡県下田市 | 業務PC4台 | 漏えいはない | 12/26報道を受けて | 別ソフトにバンドルされていたため |
香川県 | 出先機関PC 9台 | 漏えいは確認されていない | 不明 | 別ソフトにバンドルされていた可能性 |
大倉工業 | 9台 | 業務には使用していない | 不明 | 不明 |
Baidu IMEの機能変遷
いつから何がどのように変わっていったのかが分かっていなかったので、Baidu社やメディアの記事を元に機能の変遷を把握できた範囲で整理してみました。
製品名 | 主な変更点 | リリース日 | バージョン | ログ送信機能 | クラウド入力機能 |
---|---|---|---|---|---|
Baidu Type | ベータ版公開 | 2009/12/16 | ベータ 1.0 | 既定で有効 | − |
↓ | ログ送信機能 既定で無効化 | 2009/12/18 | ベータ | 既定で無効に変更 | − |
↓ | WindowsVista/7に対応 | 2011/07/28 | ベータ | (既定で無効)↓ | − |
↓ | カナ英語変換に対応 | 2010/02/05 | ベータ | (既定で無効) | − |
↓ | ユーザー辞書機能、更新機能が追加 | 2010/03/26 | ベータ | (既定で無効) | − |
↓ | オプション辞書機能が追加 | 2010/04/21 | ベータ(1.0.2.64) | (既定で無効) | − |
↓ | 正式版リリース | 2010/05/10 | 1.0 | (既定で無効) | − |
↓ | ツールバーにヘルプ機能が追加 | 2010/06/09 | 1.0 | (既定で無効) | − |
↓ | 辞書インポート機能が追加 | 2010/07/22 | 1.0 | (既定で無効) | − |
↓ | 手書き機能が追加 | 2010/08/25 | 1.0 | (既定で無効) | − |
Baidu Type 2011 | スクリーンショット機能を追加 | 2011/01/31 | ベータ | (既定で無効) | − |
Baidu IME | Baidu Type 2011β版をBaidu IMEとしてリリース | 2011/03/10 | 2.0 | (既定で無効) | − |
↓ | ユーザー辞書登録文字数の増加 | 2011/04/12 | 2.0.0.8 | (既定で無効) | − |
↓ | 変換候補の英訳をポップアップ表示 (レビュープラス機能追加) |
2011/07/28 | 2.1.0.22 | (既定で無効) | − |
↓ | 記号変換候補に読み方・説明表示 | 2011/09/15 | 2.2.0.7 | (既定で無効) | − |
↓ | クラウド入力機能の搭載 | 2011/11/24 | 2.3.0.17 | (既定で無効) | クラウド入力機能が搭載される |
↓ | かな入力に対応 | 2012/01/13 | 2.4.0.14 | (既定で無効) | 既定で有効 入力情報がSSLで暗号化される |
↓ | 基本機能の改善 | 2012/04/05 | 2.5.0.15 | (既定で無効) | 既定で有効 |
↓ | クラウド入力機能精度向上、クラウド辞書単語拡充 | 2012/05/21 | 2.6.0.8 | (既定で無効) | 既定で有効 |
↓ | アスキーアート入力機能の追加 | 2012/08/28 | 2.8.0.11 | (既定で無効) | 既定で有効 |
↓ | Firefoxとの互換性改善 | 2012/09/25 | 3.0.0 | (既定で無効) | 既定で有効 |
↓ | 学習能力やAA入力機能の強化 | 2012/11/13 | 3.1.0.9 | (既定で無効) | 既定で有効 |
↓ | オンラインゲーム対応、顔文字拡充 | 2012/12/05 | 3.2.0.7 | (既定で無効) | 既定で有効 |
↓ | スキン作成(マイスキン)機能が追加 | 2013/10/10 | 3.5.1.4 | (既定で無効) | 既定で有効 |
↓ | 入力情報送信の指摘を受け修正したと思われる | 2013/12/25 | 3.5.2.0 | (既定で無効) | 既定で無効に変更 |
Baidu IME v3.6はベータ版リリースのみのため上の表からは割愛しています。クラウド入力機能はv2.3で実装されてから既定で有効であり、黒翼猫さんの情報によればv3.4以前を利用している場合、クラウド入力機能を無効化するには設定画面のチェックを外した後にさらに再起動が必要だそうです。(v3.5以降はチェックを外すのみでクラウド入力機能は無効化される。)
Baidu IMEの通信先
Baidu IMEが通信するアクセス先は次のものが存在するようです。
URL | IPアドレス | 用途(推測) |
---|---|---|
cloud.ime.baidu.jp | 119.63.198.161 | ログセッション(ログ情報)、クラウド変換情報の送信先。辞書情報を取得する。 URL末尾がpyの場合は入力途中の文字が、logの場合は入力確定の文字の情報が送られる。 尚、Simejiも同じサーバーへ送信している。 |
sync.ime.baidu.jp | 119.63.197.171 | 設定情報を送信していると思われる接続先。 |
update.ime.baidu.jp | 119.63.197.130 | 更新確認をするために送信していると思われる接続先。 |
/.によれば他にも次のURLがBaidu IMEと関係があるとコメント。
asciiart1.baiduime.jp
ime.baidu.jp
businessplatform.ime.baidu.jp
statistic.ime.baidu.jp
popup.ime.baidu.jp
黒翼猫さんの検証によれば接続先しているURLは他にもあるようです。(2011年5月当時の情報)
type.baidu.jp
Simeji方面
今回の件を受けて、Simejiについて調査・検証されている方が何人かいらっしゃるようです。
Simejiの場合、クラウド変換を無効にしても、英語予測変換機能が有効となっている場合は、半角英数字であっても送信されるようです。
まとめ
バージョン、製品ごとの送信有無を整理しました。尚、表には含めていませんがSimejiは上述の通り半角英数字が送られているとの指摘もあります。
製品名 | バージョン | 期間 | ログ送信 | クラウド入力(変換) | 既定で送信される入力文字 |
---|---|---|---|---|---|
Baidu IME | 2.0〜2.2 | 2011/03/10〜2011/11/23 | 既定で無効 | 実装無し | 無し |
2.3〜3.5.1 | 2011/11/24〜2013/12/25 | 既定無効 | 既定で有効 | 全角入力文字(入力中含む) | |
3.5.2 | 2013/12/25〜 | 既定で無効 | 既定で無効 | 無し | |
Simeji | 4.11〜5.5 | 2012/05/14〜2013/03/12 | 既定で無効 | 既定で有効 | 入力中の全角文字 |
5.6〜6.6 | 2013/03/13〜2013/12/26 | 既定で無効 | 既定で有効 無効にしても送信されるバグ有り |
入力中の全角文字 | |
6.6.2 | 2013/12/26〜 | 既定で無効 | 既定で無効 6.6のバグ修正済 |
無し |
尚、Baidu社のプレスではSimejiの送信バグは「ログセッション」が対象であったと説明されていますが、12/26に緊急リリースされた6.6.2の説明では次のように「クラウド入力(変換)」に問題があったことが説明されています。実装で確認されていた問題も「クラウド入力(変換)」であり、Baidu社がクラウド入力ではなくログセッションをバグとして発表した理由は不明です。(ログ送信機能にもバグがあったのかもしれません。)
緊急リリース版について
https://play.google.com/store/apps/details?id=com.adamrocker.android.input.simeji&hl=ja
一部のバージョンで発生した、クラウド変換がオフ時でもクラウドサービスにアクセスするバグを修正しました。
また、はじめてSimejiをお使いになる場合、初期設定でクラウド変換機能はオフになるよう修正いたしました。すでにSimejiをお使いのかたの場合でも、アップデートすることでクラウド変換機能がオフになります。
Baidu社もクラウド入力機能にバグがあったことを12/27付のプレスリリースで説明しました。
Simejiについては、インストール時にご案内する利用規約へ同意をいただいておりますが、クラウド変換がOFFに設定した状態でも、クラウドサービスにアクセスする不具合があり、昨日時点で修正バージョンをリリース済みです。
http://www.baidu.jp/info/press/jp/131227-2.html
まとめるとBaidu IME、Simejiで意図的に機能を有効にしていた以外で、入力情報が送信された可能性のある人は次の通り。
- 2011年11月24日以降、2013年12月25日までの最新版のBaidu IMEを設定変更せずに利用していた人。
- 2012年5月14日以降、2013年3月12日までの最新版のSimejiを設定変更せずに利用していた人。
- 2013年3月12日以降、2013年12月26日までの最新版のSimejiを利用していた人。
また当前ですが、Baidu IME、Simeji共にクラウド入力(変換)機能を有効にすれば(仕組み上必須のため)最新版でも送信されます。
(参考)他IMEの実装状況
MS標準のIME以外について比較してみます。Baidu製のIMEは今回の件を受けて修正された最新版の情報を掲載しました。
製造元 | 製品名 | 費用 | クラウド変換 (入力文字送信)機能 |
入力文字の保存 | 辞書同期機能 | クラッシュログ送信 | その他送信している情報 |
---|---|---|---|---|---|---|---|
Baidu | Baidu IME 3.5.2 | 無料 | 有り 既定で無効 (2013/12/25以降) |
保存していない | 無し | 不明 | アプリケーションログ (詳細不明) |
Baidu | Simeji 6.6.2 | 無料 | 有り 既定で無効 (2013/12/26以降) |
保存している (60日以内に破棄) |
無し | 有り 無効不可 |
・Androidバージョン情報 ・Simejiバージョン情報 ・Simejiの設定情報 無効不可 ・よみと候補情報 既定で無効 |
Google日本語入力 | 無料 | 無し | − | 無し (開発版で搭載されていたが廃止) |
有り 既定で無効 |
・OS情報 ・カスタマイズ情報 ・打鍵数等の統計情報 既定で無効 |
|
JustSystem | ATOK Passport | 有料 | 有り 有料サービス(要設定) |
不明 | 有り 既定で無効 |
不明 | 不明 |
奥野陽氏 | Social IME beta22 | 無料 | 有り 無効不可 |
保存している | 無し | 無し | − |
参考情報・まとめ記事・考察記事
- また百度(baidu)が日本語入力ソフトの件でやってくれたようです,やまもといちろう,2013/12/26アクセス:魚拓
- Baidu IMEがクレカ番号など入力情報を勝手に外部送信=超アグレッシブ企業・百度の伝説,KINBRICKS NOW,2013/12/27アクセス:魚拓
- 中国製の日本語入力ソフト 入力情報を無断送信についてのまとめ,togetter,2013/12/27アクセス
- 中国の百度・Baidu、日本語変換をネット送信,読売新聞,2013/12/28アクセス:魚拓
- 入力した文字列をすべて無断でサーバに送信していた「Baidu IME」削除方法,GIGAZINE,2013/12/28アクセス
- 百度(バイドゥ)の日本語入力ソフトの一件で、中国のウェブ関連を無視するのはやめて欲しい。,BLOGOS,2013/12/28アクセス:魚拓
- 窮地に立つ中国IT界の巨人 百度・李彦宏,WEDGE Infinity,2013/12/28アクセス:魚拓(1) (2)
- 備忘録 - 仏の秘密も百度まで,404 Blog Not Found,2013/12/28アクセス:魚拓
- 「百度(バイドゥ)」にはウイルス罪の適用はないのか?,園田寿,2013/12/28アクセス:魚拓
更新履歴
- 2013/12/27 AM 新規公開。
- 2013/12/27 AM 誤字・脱字の修正。
- 2013/12/27 AM 経緯(NISC、文科省の注意喚起)を修正。(北河さんからの情報)
- 2013/12/27 AM 文科省の注意喚起情報を追加。(根岸さんからの情報)
- 2013/12/27 PM 他IMEとの比較を追加。Baidu社からの発表を追加。
- 2013/12/27 PM Baidu社からのSimejiに関するFAQ発表を受けて修正。
- 2013/12/28 AM 報道情報、インストール状況の追加、一部加筆。
- 2013/12/28 PM インストール状況を修正、経緯に追記。(北河さんからの情報)
- 2013/12/29 PM ログとクラウド入力で送信されるデータの解釈が誤っていたため修正。またインストール状況を追加。
*1:Simejiが取得しているデータについて,Baidu,2013/12/28アクセス:魚拓
*2:中国製情報送信のソフト 使用控えて,NHK,2013/12/28アクセス:魚拓
*3:入力情報、無断で外部送信=中国社ソフト、注意呼び掛け−政府,時事通信,2013/12/28アクセス
*4:中国製ソフト、文字入力情報を収集 スマホからも送信,朝日新聞,2013/12/28アクセス:魚拓
*5:ネットエージェント、Baidu IMEが入力内容を無断送信との調査結果を公表,ITpro,2013/12/28アクセス:魚拓
*6:<注意喚起>IIC-NEWS No.013-20131220 日本語文字入力補助ソフトによる情報漏えいの危険性について2013年12月20日,信州大学,2013/12/27アクセス:魚拓
*7:百度ソフト、情報外部送信停止…初期設定を変更,読売新聞,2013/12/28アクセス:魚拓
*8:入力の日本語 無断送信 外務省や大学で使用 国が注意喚起,読売新聞,2013/12/26朝刊1面
*9:中国製の日本語入力ソフト 入力情報を無断送信,NHK、2013/12/28アクセス:魚拓
*10:中国「百度」製ソフト、入力の日本語を無断送信,読売新聞,2013/12/28アクセス:魚拓
*11:一部「日本語入力ソフト」に機密情報漏洩のおそれ、政府が注意喚起,SecurityNEXT,2013/12/28アクセス:魚拓
*12:中国・百度、ネット入力情報を無断送信 漏洩の恐れ 日本語入力ソフト,日本経済新聞,2013/12/28アクセス:魚拓
*13:百度ソフト、便利で人気だが「まるでウイルス」,読売新聞,2013/12/28アクセス:魚拓
*14:官房長官、外務省の百度ソフト利用「極めて遺憾」 情報漏洩懸念,日本経済新聞,2013/12/28アクセス:魚拓
*15:一部の報道に対する弊社の見解,Baidu,2013/12/28アクセス:魚拓
*16:Simeji新バージョン6.6.2をリリース,Baidu,2013/12/28アクセス:魚拓
*17:百度公司声明,百度,2013/12/28アクセス:魚拓
*18:Japan Warns of Security Risk in Software for Language Input,Bloomberg,2013/12/28アクセス:魚拓
*19:百度反論「IMEによる違法なデータ送信・漏洩はない」,CRI Online,2013/12/28アクセス:魚拓
*20:百度ソフト、スマホ用も入力した全文を無断送信,読売新聞,2013/12/28アクセス:魚拓
*21:一連の報道に対する弊社の見解,Baidu,2013/12/28アクセス:魚拓
*22:一連の報道によるSimejiへのお問い合わせについて,Baidu,2013/12/27アクセス:魚拓
*23:中国・百度:無償入力ソフト 福島県の個人情報流出か,毎日新聞,2013/12/28アクセス:魚拓
*24:(PDF)NEWS RELEASE 緊急対応について,ピーシーデポコーポレーション,2013/12/28アクセス
*25:Baidu IMEの入力情報送信報道を受け、緊急対応開始した量販店も,Internet Watch,2013/12/28アクセス:魚拓
*26:百度ソフト、次官連絡会議で漏えい注意呼びかけ,読売新聞,2013/12/28アクセス:魚拓
*27:百度ソフト、気づかぬうちに組み込まれた下田市,読売新聞,2013/12/29アクセス:魚拓
*28:香川県PC9台に中国製ソフト/情報漏えいなし,四国新聞社,2013/12/29アクセス:魚拓
*29:福島県庁PCデータ、百度サーバーに自動送信,読売新聞,2013/12/28アクセス:魚拓