読者です 読者をやめる 読者になる 読者になる

ニュースな英語のホンヤクコンニャク

英語のニュースでお勉強。 知らない単語や表現を、こっそり調べてエラそうに説明してみるブログです。 元記事から数日遅れになったりもしますから、ニュースとしてはたいして役に立たないかも。IT系・技術系が主たる対象であります。

囲碁でコンピュータには勝ち目がない?グーグル人工知能の達人は「勝てる」と言ってる

人工知能・機械学習

‘Go’ Is the Game Machines Can’t Beat. Google’s Artificial Intelligence Whiz Hints That His Will.

https://recodetech.files.wordpress.com/2015/11/20151120-go-board-game-google-ai.jpg?quality=80&strip=info&w=640


ヒカルの囲碁入門
ヒカルの囲碁入門
posted with amazlet at 15.11.20
石倉 昇
集英社
売り上げランキング: 3,389

When the world’s smartest researchers train computers to become smarter, they like to use games. Go, the two-player board game born in China more than two millennia ago, remains the nut that machines still can’t crack.

世界で最も賢い研究者が、コンピューターをさらに賢くするために訓練するときには、ゲームを使うことを好みます。 「囲碁」、2人のプレイヤーのボードゲーム。2千年以上前に中国で生まれました。 これは、いまだに機械にはクラックできないものとして残っています。

Enter Google’s nerds. Demis Hassabis, the artificial intelligence savant behind Google DeepMind, hinted in a video interview that his secretive team has cracked Go.

グーグルのオタクたちのところへ行ってみると、グーグルDeepMindに関わる人工知能科学者 Demis Hassabis が、ビデオインタビューで、彼の秘密のチームが囲碁をクラックしたと教えてくれました。

  • nerds - ナードは、オタクか。ちょっと違和感あるけどGoogle先生がそう言ったから。マニアでも専門家でもないし、この業界で言う賛辞としての「変態」かもしれないけど、一般的には通じないかもだし、ムツカシイ。
  • savant - 科学者。フランス語らしい。サイエンティストとの違いは分かりません。
  • secretive - 秘密主義の

Since Google plopped down $400 million last year for the AI startup, DeepMind has remained frustratingly silent. It has put out a couple papers of its training algorithms beating Atari games — using a combination of deep learning methods that have earned considerable respect in the insular AI world. But it has released little else.

昨年グーグルが人工知能のスタートアップに4億ドルを投下して以来、DeepMindは、イライラするほど沈黙を守っていました。 アタリのゲームに勝った機械学習アルゴリズムの2つの論文を提出しました。それは、AIの世界の一部でかなり重要だとされている、深層学習理論の組み合わせを使っています。 しかし、同時に少し違ったものもリリースしました。

  • frustratingly - イライラするほど
  • insular - 一部の

In an interview with the Royal Society of London, Hassabis lets us look up its sleeve. “Maybe you will have a surprise about Go?” Hassabis’s interlocutor asked.

ロンドン王立協会のインタビューで、Hassabis は、その袖を見上げさせました。「もしかして囲碁についてのサプライズがありますか?」Hassabisと会話する人が尋ねました。

  • interlocutor - 対話者

Hassabis smiles. “I can’t talk about it yet, but in a few months I think there will be quite a big surprise,” he replies. (The full interview is here.)

Hassabisは笑顔で「まだ、それについては話せないのですが、数ヶ月の内に、非常に大きなサプライズがあると思う」と彼は答えています(インタビュー全体はここにあります)

youtu.be



Last year, Wired went long on the challenge Go poses to machines. Here’s the relevant part:

昨年、囲碁が機械へ構える挑戦を、Wiredが長くやりました:

Similarly inscrutable is the process of evaluating a particular board configuration. In chess, there are some obvious rules. If, ten moves down the line, one side is missing a knight and the other isn’t, generally it’s clear who’s ahead. Not so in Go, where there’s no easy way to prove why Black’s moyo is large but vulnerable, and White has bad aji. Such things may be obvious to an expert player, but without a good way to quantify them, they will be invisible to computers. And if there’s no good way to evaluate intermediate game positions, an alpha-beta algorithm that engages in global board searches has no way of deciding which move leads to the best outcome.

Not that it matters: Go’s impossibly high branching factor and state space (the number of possible board configurations) render full-board alpha-beta searches all but useless, even after implementing clever refinements. Factor in the average length of a game — chess is around 40 turns, Go is 200 — and computer Go starts to look like a fool’s errand.


同様に不可解なのは、特定の盤面の配置を評価するそのプロセスです。 チェスでは、明らかないくつかのルールがあります。 もし、ラインを10回下へ下がれば、片方はナイトを失っていて他方はそうではありません。 一般的にそれは誰が有利なのかが明白です。 しかし、囲碁はそうではありません。「黒が多くを占めるのに劣勢であり、白は味が悪い」などと認識するための簡単な方法がないのです。 このようなことは、熟練者にとっては明らかなのかもしれませんが、それらを定量化するすべはなく、それらはコンピューターには見えません。 そして、ゲームの中間のポジションを評価する良い方法がないのならば、盤面全体の探索に頼るアルファ-ベータアルゴリズムでは、どれが最善手であるかを決定する方法がないのです。

それは重要なことではありません:囲碁が極端に多く枝分かれするという原因と、巨大な状態空間(盤面の可能な配置最大数)は、盤面全体のアルファ-ベータ検索を全てレンダリングするが、使えない。 たとえ、巧みに改良を加えたとしても。一回のゲームの平均の長さが、チェスは40回ぐらいですが、囲碁は200回。コンピューターの囲碁が、無駄足のように見えてきました。

It’s a fool’s errand rich with visual patterns, good fodder for the type of machine intelligence that DeepMind practices.

それは無駄足です。豊富な視覚パターンが、このタイプの機械の知能にうまくエサを与えます。これはDeepMindが練習したものです。

  • errand - 使命、お使い
  • fodder - 飼料。飼料を与える

Google has given DeepMind, which is based in London, a singular mission: Solve intelligence. This month, the unit hired Drew Purves, a researcher who spent eight years doing ecological modeling at Microsoft. At a recent conference, Purves declined to say what he was doing at DeepMind.

Last month, Facebook said its team of nerds is also working on beating Go.

グーグルはロンドンに基盤を置くDeepMindへ、「知性を解け」という異例のミッションを与えました。 今月、そのユニットは、8年間マイクロソフト生態学モデリングを行って過ごした Drew Purves を雇い入れました。 先ごろのカンファレンスで、Purvesは DeepMindで彼が何をしているのかを多くは語りませんでした。

先月、Facebookはそのオタクのチームを囲碁に取り組ませてもいると語りました。


元記事は以下からどうぞ。

recode.net