アンチコンピュータ戦略(118)

ダビデは袋に手を入れて小石を取り出すと、石投げ紐を使って飛ばし、ペリシテ人の額を撃った。石はペリシテ人の額に食い込み、彼はうつ伏せに倒れた。ダビデは石投げ紐と石一つでこのペリシテ人に勝ち、彼を撃ち殺した。ダビデの手には剣もなかった。
(新共同訳聖書、サムエル記上)

まともに戦っては誰も勝てない巨人兵ゴリアテ(ペリシテ人)に対して、羊飼いダビデが勝つには、この戦略しかなかったと。

soft_196196図、金ポナは△3二銀と打ち、▲4二玉△6九龍▲5一玉と進められて終了。
詰みの過程だけではなくて、受けなしに持ち込む過程でもトライされてしまうのかな。


アンチコンピュータ戦略(117)

1975年刊、升田幸三『王手』より。

先年、日立製作所が、将棋をコンピューターでやろうとして、熱心に研究したことがあります。
しかし、将棋は変化のゲームで、しかもその変化ぶりが複雑きわまりないですから、いかにコンピューターといえども、世界中のものがタバになったって、とても高段者に対抗できる力が出せるはずがない。だから、「やるな、やってもムダだ」といったんですが、それでも一所懸命やったあげくに、とうとうサジを投げて、「わかった、もうかなわん」と言ったことがあります。
そりゃあ将棋だって、コンピューターに全然かからんわけじゃない。かかるけれども、非常に単純な――算術でいえば、一足す一とか、掛け算でも二二が四といった程度で、まあ、初段以下も以下、シロウト将棋の十級でもどうかな。二十級ぐらいが、いいところかもしれん。
というのが、先にも言ったように、手が進むにしたがって変化が無限大に複雑化してくる。機械が記憶しとるのとおなじ局面になってくれりゃあ、そりゃあコンピューターも指しがいがあるかもしれんけど、絶対といっていいくらい、同じにはなりませんからねぇ。そこが困るのだ。
世間じゃ――日立の研究を担当した技師なんぞは、”将棋みたいなもの”くらいに思ったかもしれんけど、駒組み一つにしたって、時代で変遷しています。ということは、人間の能力というものは、無限大のものを持っておるという証拠に違いない。

世間で「将棋みたいなもの」と、将棋を底の浅いゲームのように認識している人は、少数派ではないかと思う。
だからこそ、その勝者であるプロ棋士が尊敬されてきたわけで。

1975年当時に「将棋でプロに勝つコンピュータが登場した」と言えば、それは立派にエイプリルフールのネタだっただろう。
「チェスや将棋の必勝法は見つからない、と思っていた昔の人たちはいったい何を考えていたんだろうね」という未来は来るのだろうか。

四色定理の証明は、コンピュータを使って可能となったのですね。
チェスや将棋の一般的な必勝法が見つかるとすれば、証明ができるのは人間ではないのだろうが、人間が何らかの方向性を示すことができたから可能となった、ということはあるだろうか。

 


アンチコンピュータ戦略(116)

前回の第2回電王戦では、プロ棋士チームは1勝1分3敗とコンピュータ将棋チームに負け越す結果となりましたが、次回第3回はプロ棋士チームが巻き返すことが期待されています。ルールも前回に比べて明らかにプロ棋士側に有利になっています。特に事前練習の機会が保証されていますので、多数の練習対局を重ねてコンピュータ将棋に勝つ手順を見つけておいて、それを本番で忠実にリプレイすることができれば、今度はプロ棋士チームにも大いに勝機があるのではないでしょうか。
コンピュータ将棋協会blog

出場ソフト5つを公開して多くの人が指せるようにすればどうだろうか。
GPS100万円チャレンジでの香得定跡発見や、GoldPonaに対する入玉の仕方の発見のように、より確実に、必勝法に近いものが見つかるだろう。
そうしてコンピュータ敗れたり、人類の集合知の勝利、と喧伝すれば盛り上がる・・・のかどうかは知らない。


アンチコンピュータ戦略(115)

コンビを組むという点について、ですが。
さて、どうなのでしょうか。

コンピュータA(単体)
コンピュータA+プロ棋士B
コンピュータA+アマチュアC

の3チームがそれぞれ100回ぐらい戦ってみれば、ある程度有意な数字は出そうですが。
コンピュータA+アマチュアCは、ほぼコンピュータAに任せきり、入玉がらみなど明らかにコンピュータが苦手とする場面においてだけ手を出す、という戦略で。

soft_195195図、金ポナは▲6五飛と寄って詰みで勝ちのはずが、△5九玉のゴールで終了。詰みの過程だとまだ、簡単にトライを許してしまうのですね。人間が組んでいて手を出せるとしたら、棋力の低いアマチュアCでも、▲4九金と寄ることはできるだろう。


アンチコンピュータ戦略(114)

本当はずっと以前からそうなんでしょうね。
あとはどれだけ曖昧にしておけるか、という点が勝負なわけで。

いまGoldPonaの成績を見ると、

1283勝28敗 (.978) 45連勝中 (最高:184連勝)

たどれるだけのGoldPonaの負けを見てみた限りでは入玉がらみ、ほぼ同じパターンのようだ。

soft_193193図、人間玉には詰みがある。(1)△5二金打▲4一玉△4四龍▲同歩△3一金か、(2)△3一金▲5一玉△6一金寄まで。ただし(2)はトライルールありの設定では無効。しかしGoldPonaは(2)を選択。

soft_194Ponaの強さの本質とは関係ないところではあろうが、作者には早急に対策を立ててもらいたい。
そしてアンチコンピュータ戦略が通用しなくなったところで、さらに人外の強さのPonaを見てみたい。


アンチコンピュータ戦略(113)

羽生 昔はね、将棋っていうのは家元制だったんですよ。お茶でいうところの、表千家裏千家みたいなものですけど、「大橋家」と「伊藤家」っていう家元があって、そこから”名人”が選ばれてたんです。選ばれたら、もう生涯名人。

宮藤 じゃあ、その人が死ぬまで他の名人は出て来ないってことですか。

羽生 というか名人が対局して負けると、要するに家元が負けるってことですから、それはあってはいけないことなんですよ。本家が否定されちゃったら大変ですからね。だから名人になったらもう試合はしない。そのままずっと安泰です(笑)。

宮藤 ずっと戦わないって……ええ? すごい世界ですね、それは。

(宮藤官九郎『妄想中学ただいま放課後』)

既に権威の確立した側が、意気さかんな新興勢力に対して、いかに下克上のチャンスを与えずに戦いを避けるか、というのも将棋史四百年の一つの見どころで、その盤外のやりとりまで楽しめるようになったら、上級クラスの将棋オタク、というところだろうか。


アンチコンピュータ戦略(112)

今またGoldPonaの成績を見ると、1103勝19敗 (.983)。
この短い間に4回も負けるとはどういうことだろうと棋譜を見た。

soft_191稲庭風に待ち、1筋だけ争点を作って仕掛けさせ、その後で金を進め、香をからめとる手法が確立されたようだ。

soft_192最後はもちろん、入玉からトライを目指す、と。なるほど。


アンチコンピュータ戦略(111)

宮藤 あんなファミコンの将棋なんか、当然勝てますよね? コンピューターに。
羽生 勝ちますね、さすがに(笑)。全部駒取れます。
宮藤 俺コンピューターにも勝てなかったんだよなあ。
羽生 あれね、癖を覚えちゃえばどんな人でも勝てますよ。

自分の中のあまちゃん効果で、2003年に出版された宮藤官九郎『妄想中学 ただいま放課後』を読んでいる。
対談の書き起こしで、羽生さんが指すではなく打つと言っている点など、羽生さんならばそういう表現は絶対にしないであろう、という個所がいくつかあったのは残念だが、あとはとても面白い。

ファミコンソフトの将棋は、弱い指し手の象徴だった。
将棋が少しでも強い人間たちにとっては、短手数で終わらせるか、駒を全部取るか、駒落にしておもちゃにするか、程度のゲームだった。

いまGoldPonaの成績を見たら、1051勝15敗 (.985)だった。
トライルールを覚えたとなると、わずか1%の希望も絶たれたということか。
3切れという条件ながら、無理ゲー感もここに極まった感じがある。

将棋ソフトに対しては、他の多くのファミコンソフトと同様、攻略本も出版されていた。
将棋ソフトのレベルが人外の段階に至った現在、「対GPS必勝法-700台に組ませても勝つ」「GoldPonaを秒殺!」などの攻略本は、書き手を探すのが難しいし、読者がそれをまねるのも難しそうだ。

  


アンチコンピュータ戦略(110)

「1万時間の法則」で有名な近年のベストセラー、『天才! 成功する人々の法則』(マルコム・グラッドウェル著、勝間和代訳)より。

複雑な仕事をうまくこなすためには最低限の練習量が必要だという考えは、専門家の調査に繰り返し現れる。それどころか専門家たちは、世界に通用する人間に共通する”魔法の数字(マジックナンバー)”があるという意見で一致している。つまり一万時間である。
「調査から浮かびあがるのは、世界レベルの技術に達するにはどんな分野でも、一万時間の練習が必要だということだ」
そう述べるのは、神経学者のダニエル・レヴィティンである。
「作曲家、バスケットボール選手、小説家、アイススケート選手、コンサートピアニスト、チェスの名人、大犯罪者など、どの調査を見てもいつもこの数字が現れる。(後略)」

人間の学習とコンピュータの自動学習を単純に比較することはできないが、取り組む時間の絶対量という点ではもちろん、人間はコンピュータには勝てない。
コンピュータは1年=8760時間、休むことなく学習を続けられるわけで。

ところで、ビル・ジョイに関する同著の記述より。
最後の喩えは、わかりやすい。

1970年代はじめ、ジョイがプログラミングについて学んでいたころ、コンピュータの大きさは部屋ほどもあった。一基(いまの電子レンジほどの能力もメモリもなかっただろう)が、1970年代の価値で100万ドル以上することさえあった。コンピュータは珍しく、目にしたとしても、アクセスできなかった。たとえアクセスしても、莫大なレンタル料がかかった。
そのうえ、プログラム作りはひどく退屈なものだった。コンピュータのプログラム作成には、厚紙のパンチカードが使われた時代だ。(中略)コンピュータは一度にひとつのタスクしか処理できなかったし、大勢が順番を待っていれば、カードは数時間後、ときには翌日にならないと戻ってこない。(後略)

1960年代半ばには、その問題の解決法が明らかになった。コンピュータがようやく、同時に複数の”命令”を処理できるようになったのだ。コンピュータ科学者は気づいた。OS(基本ソフト)を改良すれば、タイムシェアリング(一基のコンピュータを共同で使用すること)が可能だ、と。数百ものタスクを同時に処理できるかもしれない。(後略)

「パンチカードとタイムシェアリングの違いは何だと思う?」。ジョイが訊ねる。
「郵送でチェスをするのと、高速で指しあうスピードチェスの違いだ」。プログラムづくりは苛立たしい作業ではなくなった。楽しいものになった。


アンチコンピュータ戦略(109)

Linux環境で動くのですね。

早速更新させてもらった。
対局者名は「GPSfish 0.2.1」から「GPSfish 0.2.1+r2837 gcc 4.6.3 osl wordsize 32 gcc 4.6.3」に変わった。
何局か指してみたが、強さはどれだけ変わったのかは、下手側からはわからない。

soft_190図は△5八角と△6五歩▲同歩△同桂を誘って、▲8八玉と▲7九玉を繰り返して待ち続けた局面。△6五歩以下だと桂得はできる。そこから最終的に勝ちに結びつけるのは、もちろん難しいけれど。