機械翻訳が「機械的な」翻訳しかできない具体例

※ 2023/07/03: わんど (h.hosono)さんによるGPT-4の正確な訳や解説文、それでも難しい例を追記

以前翻訳には「機械的」面と「創作的」面があり「機械翻訳」は「機械的」な翻訳しかできない(から著作権的問題は起きない)と書きましたが、統計を出せるほどでは無いですがいくつか例を。

Google翻訳より精度が高いと言われるDeepL翻訳で試してみましょう。

掛け言葉

Blueskyでフォローしている人のポストから(許可は取っています)。

Switching to a new computer has become a lot easier thanks to cloud services. When there were no clouds in the sky, we had to spend so much time transferring data from one computer to another.

What I want to say is setting up my M2 MacBook Air was easy. Thank you iCloud!

Bluesky

DeepL翻訳をかけると、

クラウドサービスのおかげで、新しいコンピューターへの乗り換えがとても簡単になった。がなかった頃は、コンピューター間のデータ転送に多くの時間を費やさなければならなかった。

私が言いたいのは、M2 MacBook Airのセットアップは簡単だったということだ。ありがとう、iCloud!

文中の「雲」は当然クラウド(cloud)と掛けてる訳ですが、この翻訳では「空に雲がなかった頃は」という節が意味不明になってしまいます。『ハリー・ポッター』でNight(夜)とKnight(騎士)をかけた言葉が「夜の騎士バス」と訳されてましたが、「空(Sky)に雲(cloud)が無かった頃は」のようにしてクラウドAirに繋がってることがわかるような訳にするべきでしょう。

なお、GPT-4では「翻訳してください」ではなく「文意を解説してください」と指示を与えれば「翻訳文」は出てこなくても比喩はちゃんと説明してくれます。
https://chat.openai.com/share/be1669e8-d979-4817-b207-a62aad966ccc

固有名詞の訳と不適切な「補完」

今後言及する予定の呪術的科学批判を行なっているロバート・L・パークの本ですが、邦訳されてないので紹介文だけ訳してみましょう。

画像

ロバート・L・パーク (著)
4.6 5つ星のうち 4.6 39件の評価
すべてのフォーマットおよびエディションを見る
(中略)
彼は全体を通して、人々の盲目的な信仰や、疑わしい現象や治療法に対する信頼が、いかに政治的目的のために操作されているかを示している。パークは、人々が自分自身を欺くことを止めたとき、科学が勝利することを示す。

説得力があり的確な『迷信』は、挑発するために人質を取ることはない。非常にデリケートな--そして氏は科学的に疑わしいと言うだろう--問題に光を当てることで、本書は議論と論争を巻き起こすに違いない。

訳は基本的に正確だと思いますが、最後部分に氏と出てきます。韓国姓の「朴」は英語で「Park」なのでこう訳してしまったのだと思いますが、最初のところなどでは「ロバート・L・パーク」とちゃんと音訳できています。最後部分の「Park」は最初の「Park」と同一人物ではないかと推論するシステムは現在の技術でも作れそうですが、まだできていないようです。
なお、これのレビューにある

Regardless of where it appears on Amazon, reasoned, calm, intellectually honest criticism of books should not only be permitted, it should be encouraged. But this willfully mendacious rant doesn't qualify.
Park and his book deserve better.

A great read that deserved better from Publishers Weekly

の最後の文だけ訳させると「朴と彼の本にはもっといいものがある」と出ます。しかしその前の一文を含ませて「But this willfully mendacious rant doesn't qualify. Park and his book deserve better」を訳させると「しかし、この故意に繕った暴言はその資格がない。朴大統領と彼の著書は、もっとふさわしい」と「大統領」が補完されます。「高度な推論」を行ないより「適切な訳」にしようとしたのかもしれませんが、結果的にさらに不正確な訳になっています。

GPT-4では正確な音訳で不適切な「補完」もしません。
https://chat.openai.com/share/97decd8f-1642-4b71-a053-afee54349aa2

上級編

これはプロの翻訳家でも難しいと思うので仕方ないですが、映画『ザ・コア』で素数(prime number)が鍵であることを"you're primed for"(あなたのために準備された)という言葉で秘密裏に伝えるシーンがあります。

Rat: Hey, here's the EM field data that you're primed for.
Josh: Digging that, Rat. Primed for… Primed for… Prime numbers…

Amazon.com: The Core

DeepL翻訳だと当然まったく意味不明になります。

ラット: EMフィールドのデータだ。
ジョシュ:了解だ、ラット。...プライムナンバー...

テレビ放送版の翻訳は以下の通り

ラット: 電磁場のデータがどうも割り切れなくてさ。解いてみて。
ジョシュ: よし、わかった。 割り切れない…… 割り切れない…… 素数か。

BD/DVDでは日本語字幕と吹き替えでさらに異なります。

ラット: 送ったデータの総数を見て。
ジョシュ: わかった。 データの総数…… 総数…… 素数のことか。

日本語字幕

ラット: あの電磁場のデータを送るから……もとを見て。
ジョシュ: よし、わかった。 もとを見ろ…… もと……もと……もと……素数か。

吹き替え音声

「素」は一応「味の素」のように「もと」とも読みますがどちらもかなり苦しいです。とはいえ一応素数が出る流れにはなっています。

GPT-4は翻訳に留まらない言語解析を行なった結果か、細かく指示を与えればそれを勘案した訳にしてくれますが、やはり上記よりもさらに不自然な訳や「積数」という別の言葉や造語にしてしまいます。
https://chat.openai.com/share/b8e0070a-355c-435f-8b9b-4f121c482ddf

https://chat.openai.com/share/25923f46-12c4-4997-a78b-292ecc2a5fbd


いいなと思ったら応援しよう!

Lamron サポートいただけると記事を書く時間や質問に回答できる時間が増えます。

この記事が参加している募集

コメント

4
わんど (h.hosono)
わんど (h.hosono)

> こうした翻訳をAIが行なえるのはかなり先になるでしょう。
現在民間人が利用できる最高性能の翻訳機である、GPT-4で試してみました。

① 掛け言葉
https://chat.openai.com/share/1294b8b3-dac4-47ca-9241-7c6856109b27
GPT-3で「翻訳して」とだけ言うと直訳(空に雲)が返ってきました。

GPT-4で「このメッセージの文意を解説してください」と説明すると、

> 文章は、昔の状況(「空に雲がなかったとき」すなわち、クラウドサービスが存在しなかった時代)と比較して、一台のコンピュータから別のコンピュータへデータを移行するのにかかった時間が大幅に短縮されたことを指摘しています。
https://chat.openai.com/share/be1669e8-d979-4817-b207-a62aad966ccc

と、比喩を説明してくれます。
翻訳を求めると頑なに「空に雲」と訳すのは、
日本語の雲にクラウドの意味がないことを理解していないからかもしれません。

わんど (h.hosono)
わんど (h.hosono)

② 固有名詞の訳

こちらも、数千文字程度で一貫性を取ることはGPT-4なら可能です。
https://chat.openai.com/share/97decd8f-1642-4b71-a053-afee54349aa2

③ 上級編
https://chat.openai.com/share/25923f46-12c4-4997-a78b-292ecc2a5fbd
こちらは
prime forとprimeの掛け言葉は説明してくれて、
求めると一応掛け言葉をに注意した翻訳を行なってくれますが、
面白い翻訳を出すことはできませんでした。
https://chat.openai.com/share/b8e0070a-355c-435f-8b9b-4f121c482ddf

連想ゲーム程度の掛け言葉は作れていますが、
基本的に文章を前から後ろへと生成するため、「素数」に似た単語を作ることが難しい可能性があります。
また、ダジャレ的な日本語の言葉遊びを苦手としている可能性もあります。

わんど (h.hosono)
わんど (h.hosono)

文脈を考慮した翻訳はDeeplの頃は部分的にしかできなかったが、
GPT-3,4の登場によってある程度可能になったとする主張ができそうです。

GPTが翻訳機かという点については、

GPTもDeeplもTransformerをベースにしており、
https://www.deepl.com/ja/blog/how-does-deepl-work

著作権処理の差というよりも
・翻訳の性能を高めた結果、言語処理の能力が高まった
・言語処理の性能を高めた結果、従来の機械的翻訳を超える性能を身につけた
といった、性能の差と解釈することができるのではないでしょうか。

もちろん、GPTは単体の翻訳機に留まらない広範な能力を持っていますが、
高度な翻訳を行うためには、「翻訳に留まらない高度な自然言語処理の能力を獲得する必要があった」と考えると、noteの文脈とも一致し、しっくりくるように見えます。

Lamron
Lamron

コメントありがとうございます。反映させて頂きました。将棋や「ゲーム」全般に関わらないAIについても造詣があるんですね。
GPTの基本的な仕組みならまだしも「翻訳はどうやってるか」はさすがにわからないですが(深層学習の性質上OpenAIの工学者ですらわからない可能性もありますが)、言語解析能力を高めたことで翻訳性能も上げることができたのは確かだと思います。

コメントするには、 ログイン または 会員登録 をお願いします。
買うたび 抽選 ※条件・上限あり \note クリエイター感謝祭ポイントバックキャンペーン/最大全額もどってくる! 12.1 月〜1.14 水 まで
機械翻訳が「機械的な」翻訳しかできない具体例|Lamron
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1