Hatena::Diary

I have got some news from ... RSSフィード

... another side of today's_news_from_uk+ whatsoever ...
備忘録:ETV特集再放送予定で、金子光晴を確認。
「クラシック音楽系しりとり」既出語一覧
「藝術系しりとり」既出語一覧
「ロックしりとり」既出語一覧前半(〜た行)と、同後半(な行〜)、
およびその更新履歴と「ロックしりとり」ローカルルール説明
「世界史しりとり」既出語一覧(未ソート)

2008-09-08

[][][] 英→日、「使える」無料翻訳はどれか〜2008年9月版

4日のエントリで補足を書いたときに気付いたのだが、前回のが1月なので、そろそろ。


今回のサンプル文は下記。サッカーのイングランド代表の試合についてのBBC記事の一部である。

Mr Greer, 50, has travelled to Barcelona from Lancashire with his younger brother Andy.

Like many England fans, they are both disappointed. Again.


'A bunch of overpaid muppets', http://news.bbc.co.uk/2/hi/uk_news/england/7602503.stm

英文としては何も複雑なところはない。むしろこれ以上にシンプルな文章はないだろう、というくらいにシンプルだ。入れ子構造の文(複文)ではなく、文型もSVとSVCだ。ただし同格の表現が複数あるのと、"Like many ..." の文が一種の倒置であること(副詞節が先行しており、主語が文の途中、コンマの直後にあること)、最後の "Again." が「文」ではないことは、厄介なところかもしれない。私が人力で逐語訳でやると→*1


例によって複数の翻訳エンジンで一括して翻訳してくれる「翻訳くらべ」さんを利用し、翻訳結果文を比較してみよう。以下、翻訳エンジン名、サービス名を記載したあと、引用タグで囲って翻訳結果文を示し、結果文のなかで気になるところに下線を補う。


■Cross Language (YAHOO!翻訳などで使われている翻訳エンジン):

グリーア氏(50)は、彼の弟アンディとランカシアからバルセロナ旅立ちました。多くのイングランドファンのに、彼ら両方は失望します。再び。

訳語の選択はちょっと変なところがあるが、この日本語を読めば「文の意味」は完全にわかるだろう。欠点を指摘するとすれば、has travelledの現在完了の訳し方(これは〈完了〉の意味ではない)、「〜のように」の日本語表記(「〜の様に」という表記は一般的ではない)、〈状態〉を表す are dissapointed の処理がうまくいっていないこと。


■BizLingo (excite翻訳で使われている翻訳エンジン):

グリアさん(50)は彼の弟と共にランカシャーからのバルセロナに旅行しました。アンディ。多くのイギリスのファンのように、彼らはともに失望しています。 再び。

これはお見事といってよいだろう。"his younger brother Andy" の同格部分の処理がおかしいが、これは元の英文の表記に起因する問題だ("his younger brother, Andy" とコンマを使って書いたものを投げると、「彼の弟、アンディ」と返してくれる)。has travelledの現在完了も、are disappointedも完璧に処理されている。訳語の問題点は、Englandを「イギリスの」としていることだが、これは人間の翻訳者でも予備知識がなければ間違える人がいるのだから(サッカーの文脈の文章でこれを間違えているようでは、一般常識の面でちょっと、といわれても仕方がないが)、機械には期待しづらいところ。


■AMIKAI (Livedoor翻訳などで使われている翻訳エンジン):

グリーア氏(50)はランカシャー州からバルセロナへより若い兄弟アンディーと旅行しました。多くの英国のファンのように、それらは両方とも失望します。再び。

非常に古典的な機械翻訳文らしさを感じさせる面もあるが、「文の意味」を伝えることには失敗していない。「より若い兄弟アンディー」は "his younger brother Andy" を逐語的に処理していることの証。「若い兄弟」なら「弟」だというところまではやってくれないらしい。Englandを「英国の」としているのは、BizLingoと同様の「誤訳(訳語選択ミス)」。といっても、最近はEnglishで「英国の、イギリスの」を表すことは激減しているので(その場合はBritishを使う)、そろそろ機械翻訳さんにも対応してもらいたいものだけど。Theyを「それら」で返すのは古典的(これが最も無難な選択、ということになっている)。「失望します」はCross Languageと同じ。


■FreshEye (FreshEye翻訳で使用):

グリーア氏(50)はランカシャー州からバルセロナへ彼のより若い兄弟アンディーと旅行しました。多くの英国のファンのように、それらは両方とも失望します。再び。

AMIKAIさんとほとんど同じ。


■KODENSHA (OCN翻訳などで使用):

グリーアさん〈50〉は彼の弟アンディとランカシャー州からバルセロナに旅行しました。 多くのイギリスファンのように、それら両方はがっかりします。 また。

このくらいシンプルな文だと、KODENSHAさんのエンジンも戸惑わないらしい。Englandの処理、Theyの処理、are disappointedの処理については、上の2つのエンジンと同じ。


Altavista Babel Fish (Yahoo.comなどで使用):

Greer、50氏は彼の弟アンディーとのLancashireからのバルセロナに、旅した。 イギリス多くのファンのように、それらは両方失望する。 再度。

うーん、上に列挙したものの後にこれを見ると、10年前にタイムワープしたような感じがする。あと、日本語の助詞って難しいのだなあと思う。「AはBとCからDに旅した」と、「AはBとのCからのDに旅した」の違いは何か、を理路整然と説明できる日本語ネイティヴは多くはないだろうけれども、後者が「変な文」であることは、日本語ネイティヴなら誰でも同意するだろう。また、この場合は「イギリス」(これと「イングランド」の違いは措いておくとして)に「の」をつけないと変なのはなぜかも同様。「イングランド・ファン」も「イングランドのファン」もOK、「イングランドの多くのファン」もOKなのに、「イングランド多くのファン」がダメなのはなぜだろう、とか。


さて、それでは毎度おなじみ、Google先生指定席です。証拠となるキャプチャ画像つきで。

f:id:nofrills:20080908080737p:image

mrグリーア、 50 、バルセロナの旅をよりlancashire 、彼の弟アンディ。

イングランドのような多くのファン、彼らはいずれも失望した。再び。

日本語でおk、としか言いようがないのだが。orz


……少し真面目に解説をしておこう。基本的に、これは単に文頭から順番に「英→日」で語レベルで置き換えを行なっているだけだ。しかも前置詞をてきとーに処理しながら。下図参照。

f:id:nofrills:20080908080853p:image


単に語の置き換えが必要なら(つまり、機械に辞書引きをやってほしいのなら)、Google toolbarでハイライト辞書を使うなり、http://www.rikai.com を利用するなり、FirefoxのアドオンのDictionary Tooltipを使うなりしたほうが、Google翻訳よりは全然よい。というのは、例えばfreeのように文脈に応じていくつもの訳語からひとつを選択しないと意味が取れないことが、英語→日本語では少なくないからだ。あるいは、Googleの訳語選択よりもずっと精度の高いYahoo!翻訳には「対訳ハイライト」があるから、それを使うほうがずっとよい。下図参照。

f:id:nofrills:20080908080913p:image

*1:「グリーアさん(50歳)は弟のアンディさんと一緒に、ランカシャーからバルセロナまで出かけていった。多くのイングランド・ファンと同様、彼らは2人とも失望している。今度もまた、だ。」なお、私はイングランド代表サポが試合のたびにがっかりしているということを予備知識として知っている。機械はそれを知らないし、単に言語的に処理するだけである。

トラックバック - http://d.hatena.ne.jp/nofrills/20080908/p2
Profile

nofrills

無料機械翻訳じゃなくて辞書使おうぜ

Calendar
<< 2008/09 >>
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

    
Comment
    
リンク集