2008-09-09
■[英語][翻訳][機械翻訳] 米Microsoft、自社開発の機械翻訳サービスを試してみたが……
はてブのトップページ経由、Internet Watchさん記事、「米Microsoft、自社開発の機械翻訳サービスを公開」:
米Microsoftは8日、自社開発の機械翻訳サービスを開始したと発表した。……
これまでにもMicrosoftは機械翻訳サービスを提供していたが、基盤となる技術はサードパーティによるものだった。今回、 Microsoftの研究機関であるMicrosoft Researchが開発した機械翻訳技術が利用されることになり、数カ国に関しては、これまでよりも高品質な翻訳ができるとしている。
対応言語は、日本語……
http://internet.watch.impress.co.jp/cda/news/2008/09/09/20797.html
日本語あるんっすね、と確認したところですぐにやってみた。
Windows Live Translator:
http://www.windowslivetranslator.com/Default.aspx
サンプル文は、たまたまBBC UK Newsのトップページに来ていた「科学」分野の記事の出だしの1文にしよう。(「科学」分野なら社会的・政治的文脈がわかっていなくても比較的正確な翻訳が期待できるので。)
Vitamin linked to brain shrinking
http://news.bbc.co.uk/2/hi/health/7595423.stm
A vitamin found in meat, fish and milk may help stave off memory loss in old age, a study has suggested.
MSの翻訳エンジンの返してきた結果:
ビタミンある肉、魚と牛乳役立つ古い時代に、メモリの損失をしのぐ、研究が提示されます。
いやぁ……これは…… (^^;) "A vitamin found" を「ビタミンある」って返してんだよね。っていうかこういうことだよね。
訳語レベルの問題点もいろいろあるけれど(「メモリ」とか「古い時代」とか)、何よりも、文構造見てないじゃん。でなければ、どうして "a study has suggested"*1が受動態(「研究が提示されます」)になりえるのだろう。
Internet Watchさん記事にある「数カ国【注:数ヶ国語、の意味か】に関しては、これまでよりも高品質な翻訳ができる」というのは、日本語は対象外らしいです。
ほかの翻訳エンジンの結果をあとで追記しますが(→しました)、とりあえずお約束のお遊びでGoogle大先生@http://translate.google.co.jp/:
ビタミン発見さ肉、魚や牛乳記憶喪失を食い止めようと5月のヘルプ老後は、研究にはお勧めします。
まあ確かに、これに比べたらMSの翻訳エンジンのほうがまだまし……何この「研究には」の「には」は。may helpが「5月のヘルプ」ってのは、ほぼunthinkableの域。もう笑う気にもなれない。
追記:
「翻訳くらべ」さんで一気に複数のエンジンに投げてみましたよ。以下、結果。結論からいえば、既存の翻訳エンジンはどれも、MSの新エンジンとGoogle翻訳よりずっとずっと優れています。
AMIKAIさん(@nifty翻訳など)→文法的にミスがなく、文意の理解にはまったく問題ない結果:
肉、魚およびミルクで見つかったビタミンは、老年の記憶喪失を避けるのを支援するかもしれません、研究は示唆しました。
BizLingoさん(excite翻訳など)→文法的にミスがなく、文意の理解にはまったく問題ない結果:
肉、魚、およびミルクの中に見つけられたビタミンは、老年における記憶喪失を避けるのを助けるかもしれません、と研究は示しました。
Cross Languageさん(Yahoo!翻訳など)→ほぼ完璧。日本語としてもかなり自然で、高校生が授業で教科書を直訳するレベル:
肉、魚とミルクで見つかるビタミンは老年期に記憶喪失を食い止めるのを助けるかもしれないと、研究が示唆しました。
Free Translationさん→人間が過剰な訳をしているときのような過剰さと、機械っぽいぎこちなさが同居しているが、文意の理解にはあまり問題ない:
肉、魚、及びミルクで見つかったビタミンが老年に記憶喪失をかろうじて免れるのを手伝うかもしれない 研究が暗示した。
Fresh Eyeさん→文法的にミスがなく、文意の理解にはまったく問題ない結果:
肉、魚およびミルクで見つかったビタミンは、老年の記憶喪失を避けることを支援するかもしれません、研究は示唆しました。
KODENSHAさん(OCN翻訳など)→やけに文学的文体だが、「何が書かれているのか」はわかるでしょう:
肉においてビタミンが見つけて、魚とミルクは、老齢に物忘れを食い止めるのに役立つかもしれず、研究は示唆しました。
World Lingoさん→古典的な、機械翻訳っぽい結果で、意味が取れるかどうかは機械翻訳文に慣れているかどうかによるかな:
肉、魚およびミルクで見つけられるビタミンは調査提案したold ageのメモリ損失の回避を助けるかもしれない。
もうひとつ、大御所でBabel Fishちゃん。
http://babelfish.yahoo.com/translate_txt
ビタミンは肉、魚およびミルクで老齢期のメモリ損失の回避を助けるかもしれない調査提案した見つけた。
最後のところが、『ガリア戦記』の "I came, I saw, I conquered" みたいでステキすぎる。全体的には、ここまでのものに比べて話にならないのだけど、GoogleとMSよりはずっとまし。
このようなことを書いているからといって、機械翻訳の研究開発を否定したり、それを冷笑的に見たりしているわけではない、ということはご理解ください。これらのツールが一般人に「使える」ものとはいえない段階にある、というのが前提です。どこかで「Google翻訳は便利だよ」と書かれていれば、譬えそれがGoogleという私企業のセールストークであったとしても、それで「翻訳」された結果は「正しい」と思ってそのまま使ってしまう人がいても当然で、そういう技術が簡単に利用できるようになっていれば(APIなども含めて)人々がそれを利用するのも当然で、実際にそういう「(実は意味不明の)翻訳文」が、(スパムなどではなく)真面目にコミュニケーションしようという意図のもとで用いられているのを見ては、「ああ、それはだめ」と思うこともあり(そしてわけのわからない反撃にあって粘着されたりしたこともありますが)……。私が言いたいのは、研究開発が悪いとかいうことではありません。ただし、エンドユーザーにとって「使える」かどうかは、それとはまったく別のことです。
*1:能動態の現在完了。「ある研究が(そのように)提示した」ということ←訳語はMSが吐き出してきたものを使っています。
- 8 http://reader.livedoor.com/reader/
- 7 http://nofrills.seesaa.net/
- 6 http://a.hatena.ne.jp/pikao/
- 6 http://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&rlz=1T4GTKR_jaJP281JP281&q=International+Herald+Tribune
- 5 http://peer2peer.blog79.fc2.com/blog-entry-1007.html
- 4 http://b.hatena.ne.jp/entry/http://d.hatena.ne.jp/nofrills/20080904/p1
- 4 http://nofrills.seesaa.net/article/106200427.html
- 3 http://b.hatena.ne.jp/entrylist?sort=hot&of=200&threshold=5
- 3 http://d.hatena.ne.jp/keyword/THE SLIP?kid=234768
- 3 http://d.hatena.ne.jp/mamoruk/20080909/p1