敏感の彼方に

|虹が何色か分かったら連絡します|

[中国語の自動翻訳]搜狗(Sogou)はGoogle翻訳を超えるかも

 

仕事やプライベートで中国語の文章を読む機会が増えてきました。

 

この国の英語義務教育のおかげで英語ならまだ何とか想像できる程度に読めるのですが、中国語はまともに勉強したことがないため、チンプンカンプンです。

 

ですので、Google(グーグル)翻訳などの機械翻訳(自動翻訳)のお世話になるのですが、まだ 100%完全な自動翻訳というのはなく、少しでも正確で流暢でストレスの掛からない翻訳結果を提示してくれる翻訳システムを探し求める日々です。

 

そんな中、「中国の検索大手・搜狗(Sogou)が中日(中国語 ⇔ 日本語)と中韓(中国語 ⇔ 韓国語)の翻訳機能を搭載した中国語入力システムを発表」というニュースを目にしたので、早速その人工知能(AI:Artificial Intelligence)の実力を軽く試してみることにしました。

 

ちなみに、搜狗の翻訳システムは、こちらで利用できます。

fanyi.sogou.com

 

上の検索リンク中の中国語がよく分からないため、早速、搜狗の翻訳システムに放り込んでみると、このような日本語が出力されました。

インターネットはインターネットでインターネットから始まります。

中国、英、フランス、日本など50以上の言語間の相互翻訳機能をサポートしており、ワード、フレーズ、テキスト翻訳サービスを無料で提供します。

 

後半部分はすんなりと頭に入ってくるのですが、前半の「インターネットは・・・」の部分は明らかにおかしいですね。この部分は、

搜狗(Sogou)翻訳 - 搜狗からインターネットを始めよう

というような訳になると思うのですが、何故それが「人民の人民による人民のための政治 by リンカーン」のような翻訳結果になっているのかは分かりません。

 

 

この搜狗の翻訳システムは、中国語、英語、韓国語、日本語の基本4言語について、相互翻訳が可能です(その他の言語も一応は対応しています)。

 

たとえば中国語を日本語に変換したい場合は、上記リンク先の画面の左側のプルダウンメニューで「中文(中国語)」を選択し、右側のプルダウンメニューで「日语(日本語)」を選択し、下の枠内に翻訳したい中国語をコピペして、あとは「翻译(翻訳)」ボタンを押すだけです。簡単ですね。

※ ちなみに、左側のプルダウンメニューにデフォルトで表示されている「自动检测」というのは、「自動検出」という意味で、翻訳の元言語を自動的に識別してくれますので、このままでも大丈夫です。この点は、Google 翻訳と同じですね。

 

早速、中国語のニュースを適当に拾って、搜狗(Sogou)vs. Google の自動翻訳の実力を比較してみることにしました。

 

まずは、こちらのニュース。

2018年2月1日,日本东京,游客参观旅日熊猫宝宝“香香”。据悉,1日早晨5点,就有大批游客在动物园门外等候,到8点30分,已有超过300人排起长队。

 

各翻訳システムによる翻訳結果は、以下の通りです。

 搜狗(Sogou)による翻訳結果 2008年2月1日、日本の东京で、観光客がパンダの赤ちゃんの「香り」を见学した。 1日朝5时には、大势の観光客が动物园の外で待ち合わせて、8时30分までに300人以上が列に並んでいるという。

 

 Google(グーグル)による翻訳結果 2018年2月1日、東京、日本、観光客は日本のパンダの赤ちゃんを訪問 "甘い。 1日の5時には、動物園の外で待っている観光客が多数いることが報告されています。8時30分、300人以上が長い列を持っています。

 

搜狗の翻訳結果は、漢字が正しく変換されていないものの、明らかに Google の翻訳結果よりも流暢で、ストレスなく読むことができます。

 

 

続きまして、こちらのニュース。

时间2018年2月1日,挪威奥斯陆,怀孕的凯特王妃和威廉王子访问挪威期间,参观了一个科技初创公司MESH。凯特王妃孕肚微凸,被黑科技吓到表情都变了,威廉王子则用左手写字,俩人对视大笑,狂撒狗粮。

 

各翻訳システムによる翻訳結果は、以下の通りです。

 搜狗(Sogou)による翻訳結果 2008年2月1日、ノルウェーのオスロで妊娠したケイト王妃とウィリアム王子がノルウェーを訪問している間、科学技術創設会社のメッシュを訪れた。 ケイト王妃の腹は微凸で、黒科技に驚かされて表情が変わり、ウィリアム王子は左手で文字を書き、2人の人々は大笑いをし、犬の食糧を狂わせました。

 

 Google(グーグル)による翻訳結果 時間2018年2月1日、ノルウェーを訪問している間、ノルウェーのオスロ、妊娠したケイトとウィリアム王子がテクノロジー起業家MESHを訪問しました。 ケイトプリンセス妊娠した腹の凸、黒の技術の表現に怖がって、ウィリアム王子は彼の左手で書いている間、2人がお互いに笑い声をあげる。

 

・・・どちらもよく分かりませんね。

 

 

最後に、こちらのニュース。

2018年2月1日,法国尼斯,当地海滩上形成2米深、5米宽的深坑。

 

各翻訳システムによる翻訳結果は、以下の通りです。

 搜狗(Sogou)による翻訳結果 2018年2月1日、フランスのニズワール地方の浜辺には、2メートル幅5メートルの深さの穴ができました。

 

 Google(グーグル)による翻訳結果 2018年2月1日、フランス、ニース、地元のビーチに深さ2m、深さ5mのピットが形成されています。

 

搜狗の翻訳結果は、「ニース」と訳すべき単語を「ニズワール」と訳してしまっていますが、それ以外は Google の翻訳結果よりも正確なのではないでしょうか(何にしろ、中国語がよく分からないので、正誤を判断しようがありません)。

 

* * *

 

新たに利用可能となった搜狗の中日翻訳システムと、Google の中日翻訳システムを簡単に比較してみた結果、単語の翻訳は Google の方が優れている印象です(そもそも、搜狗のシステムでは、漢字が中国語(簡体字・繁体字)のまま出力される場合が少なからずあり、長い文章では読むのが苦しくなるかもしれません)。

 

一方、正確さや流暢さでは、搜狗の方が若干優れているような印象を受けます。

 

当面はケースバイケースで両者を利用することになりそうですが、単語や漢字の翻訳などはすぐに追いつくでしょうから、その辺に違いがなくなると、流暢さで優る搜狗の方が、使い勝手が良くなりそうな気もします(人工知能の機械学習はデータ量に左右されますので、利用者が増えるかどうかですね)。

 

リリース時点でこれだけ流暢なわけですから、さらに学習を重ねれば、よほど複雑で難しい構文でもない限り、より完全な自動翻訳へと近づいていくことでしょう。

 

いずれにしろ、検索大手が翻訳サービスを無料で提供する目的は、翻訳時に入力される様々な情報を収集し、人工知能の学習に利用したり、その他様々なサービスに紐づけたりすることですから、くれぐれも重要な情報は、安易に翻訳しないようにしましょうね。

 

f:id:nezujiro:20180203070455j:plain