2009年12月3日、グーグルは突如「Google日本語入力」を公開した。
昨日発表されたGoogle日本語入力。すでに各所で話題になっている |
対応OSは現在のところ、Mac OS X以降ならびにWindows XP以降(64bit版には未対応)で、同社サイトからダウンロードし、無料で利用できる。Google Japan Blogによれば、Google日本語入力は、有名な20%プロジェクトから生まれたという。筆者は長くATOKを愛用している一人だが、早速、Google日本語入力で執筆しながら考えていこう。
従来の変換エンジンとは異なる発想から生まれたIME
Google Japan Blogによると、この日本語入力システムが、従来の発想とは異なるものであると表明されている。
Web から機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成しています。現在の Webのありのままを反映したインプットメソッドと言えます
つまり、ネットからグーグルが集約した膨大なインデックスデータを使い、同時に生成された辞書を利用するわけだ。
ローカルディスク上に辞書をファイルを持つ従来のIMEとは異なる発想である。これまでもネット上で辞書を共有する「Social IME」のアプローチがあった。これと同様に、ネット上のデータや不特定多数のユーザーの利用履歴を収集し、変換候補を引き出してくる点が面白い。
今風に言えば「クラウド型」の日本語入力システムと言えるだろう。なお、ブログエントリーの補足にもあるように、ウェブ上のデータを参照しながら変換していく仕組みではあるが、オフラインの状態でも問題なく利用することができた。
単語や文節単位では軽快──しかし、文脈の中ではどうか?
ここまでGoogle日本語入力を利用して原稿を書いてきた。
数文字入力すると、変換候補が下にリスト表示される。タブキーを押すと選択が可能だ |
特段、変換精度を意識することはない。意識せず使えるというのは、IMEにとって非常に重要な意味を持つ。スペースで変換する点は従来のIMEと変わらないが、数文字打ち込むと下に入力候補が表示される。タブキーを押すことで推測変換やサジェスチョンの機能が利用でき、少ないタイプ数で効率よく文字を打てる。
ATOK同様に「今日」や「今年」という単語から、「2009年12月3日」や「平成21年」といった変換結果を得ることもできる。
タスクマネージャで確認したところ、メモリーの占有率も比較的低いようだ。レスポンスに関しては(すでに色々言われているが)遅くはない。「サクサク動いている」という感覚もある程度実感できる。
ただし、既存のIMEに比べ劣る点がないわけではない。
例えば連文節変換の精度。ATOKには前後の文脈を参照して、検索候補の優先順位を変える機能が備わっているが、現在のところGoogle日本語入力には、明示的にそのような機能はない。また、文章の誤用を指摘して修正候補を挙げる校正機能もないため、それらの機能を重宝していた編集者などのユーザーがすぐに移行するのは難しい面もありそうだ。
逆に言えば、そういった機能が割愛されている分、軽快に動作しているとも言える。強みは単語の鮮度と、サジェストの精度にあると言えるだろう。バージョンアップで辞書が強化されてきた従来のIMEとは基本的に異なる。