電王戦出場記念! | 書籍化されたで! | 監修したで!(`ω´) | 絶版なってしもた | 絶版プレミア価格 | 記事書いたで! | |
|
|
|
YaneuLabs / やねうら王公式 / やねうらおにメール / twitter / プロフィール |
やねうら王が将棋倶楽部24に参戦中です。
USIプロトコル(コンピューター将棋の思考エンジンの標準的なプロトコル)対応の思考エンジンを将棋倶楽部24に対応させるブリッジを書きました。実質的に8時間ほどでオートパイロットの対応ができました。(詳しいことは書けませんが、ボンクラーズが将棋倶楽部24に来ていたときと違って、かなりやりやすくなっています。)
ちなみに将棋倶楽部24に、オートパイロットのテスト用のサーバーがあるわけではないのでぶっつけ本番です。バグって落ちたときはご容赦を。
・2014/3/10 0:00
いま、動作テストのため一手5秒でやっています。負けが込むようでしたら、思考時間を増やします。
スマフォからしか挑戦が出来ないのは、久米さんの意向っぽいです。PCからの挑戦を受け付けると、再開局の処理とかがあって大変だからという配慮なのかも知れません。(よく知りません)
やねうら王はR2800スタートです。ここから落ちたら格好悪いので自ずとプレッシャーがかかります。
ちなみに初手から定跡は使ってません。局後学習させた定跡のみです。もうコンピューター将棋はそろそろ初手から自分の力で切り拓くべきだという考えのもとにそうしてます。(まだ時代が2,3年早過ぎるかも…)
・2014/3/10 0:35
いま1手5秒設定のままR3009の人に勝てたようです。やねうら王は序盤が独自の定跡のために、あまり見慣れない形になります。(というか、たいてい序盤で悪くするのですが) いまの将棋も序盤早々に横歩を取られたのに、ごりごりやっているうちに逆転したようです。
開発者的には、もっと普通に指して欲しいんですけど、初手から定跡がないとまあこんなもんなんでしょうね。それにしてもR3000台の人とやって勝てているのが凄いですね。
ちなみに、やねうら王はレーティング対局室に移動したあと誰の挑戦でも受ける設定になっています。(早指し設定での平手挑戦であれば)
・2014/3/10 1:05
相穴熊でR2968の人に負けました。(たぶん) さすがに1手5秒きついようですね。次から1手8秒に変更してみます。ちなみにponder(相手の手番で考える)は使っていません。(実装が大変そうだったので…) そして、投了の処理まわりがバグっていたので落ちました><
追記 → 間違えて、1手8秒+秒読み8秒の設定にしてたので16秒考えてました。うわー…。
あと、やねうら王、思考中の評価値が出たほうがいいという声が強いので、いまから対応します。10分ほどお待ちを..。
それからやねうら王は中断再開待ちに対応していません。(中断局スタートには対応しているはずなのですが…) 途中でやねうら王が落ちたような場合にはなんであれ判定勝ちにしてもらって構いません。ご迷惑おかけします。
・2014/3/10 1:30
評価値表示に対応させたのですが、対局中は全体チャットにはならないので対局相手にだけ見えるチャットになるようです。全体チャットのAPIはないようなので、これは駄目ですね…。他の仕組みを何か考えます。
・2014/3/10 1:40
1手8 16秒設定でもR2900は超えそうな感じです。思考時間を倍にするとR150ぐらいあがるのでR3200にギリギリ到達可能なのかなと思います。人間側は相手番で考えることが出来る&将棋倶楽部24でR3000付近の人は数少ないので、そう単純な話でもないですが。
・2014/3/10 1:50
人間側が手待ちして千日手っぽい局面に。この手の局面は打開するのにかなり先まで読まないといけないので8 16秒では打開不可能かと思っていたところ、やねうら王が無理やり打開。そして凄い損を…。おまけに人間側、そのまま入玉狙い。いきなりアンチコンピューター戦略で来る人がいるとは思いませんでした。将棋倶楽部24は一昔前とは全然事情が異なるようですね。
入玉対策は一朝一夕に出来るものでもないので、開発者的には大変です。やねうら王は入玉対策はほとんどやってないです。
ちなみにfloodgateでも入玉が比較的上手い組と下手な組と分かれていて、入玉対策を真面目にやらないと数局に1局ぐらい入玉絡みの将棋で負けてしまい勝率がぐんと落ちます。
・2014/3/10 2:15
対戦していただいた皆様、観戦いただきました皆様、本当にありがとうございました。
明日も22時ごろから参加します。明日、また続きをここに書きます。
明日は評価値のリアルタイム更新がやねうら王公式サイトのほうから確認できるようになってると思います。
Dropboxのpublicフォルダに評価値と読み筋を書いたhtmlファイルを突っ込んで、それを上記サイトのiframeのなかで表示しているだけという驚くべき手抜き実装です。
・2014/3/10 9:00 去年とは周囲の反応が違うという話
去年ponanzaが将棋倶楽部24に来たときは席主である久米さん公認でやっているのに、チャットでは「ソフト使って将棋倶楽部24で指していいの?久米さんに通報しなきゃ!」みたいなことを言い出す人が多かったので、やねうら王もそういうことを言われるんだろうなぁと思って覚悟して臨んだのですが、蓋を開けてみればそんなことはなく、「待ってました!」と多くの人に声をかけていただけたことは、開発者冥利に尽きると思います。
電王戦のおかげで、コンピューター将棋開発者にスポットが当たるようになりました。時代は着実に移り変わろうとしています。
・2014/3/10 9:15 やねうら王2014の開発コンセプト
今一度、今年のやねうら王2014の開発コンセプトを書いておきます。(現バージョンのことではなく、今年はこういうことをしたいという話です)
・局後学習により、定跡を自らの手で切り拓く
これは、すでにやっています。9手目ぐらいまでは3200M(32億)局面を調べて、最善手を3手DBに記録しています。後手の6二銀などかまいたち戦法のアマ強豪である鈴木英春さんを彷彿とさせる立ち上がりです。
コンピューターオセロのようにすでに人間の棋譜が参考にならないというところまでは、コンピューター将棋はまだ来ていませんが、しかし人間の(プロの)棋譜を大量に(100万局単位で)集めるのは不可能なので、どこかで人間の棋譜と決別しないといけない時代は確実にきます。そこで実験的に人間の棋譜を使うのはやめることにします。
・かきかけ
やねうら王公式サイト
やねうら王が将棋倶楽部24に参戦しているときは上記サイトの一番下のところでやねうら王の評価値と読み筋を見ることが出来ます。
・centipawn = 歩1枚を100とする評価値の単位。(一歩得であれば、相手の歩が1枚ない+自分の歩が1枚多い=+200)
・13手詰め = 王手ラッシュなどの攻防を含めた詰みまでの最長手数。詰将棋的な手数ではありません。
・評価値15000〜20000 = 優等局面(盤上の駒の配置は変わらず自分の手駒だけが増えているとき)の評価値
・pv = 最善応手列(≒読み筋)
例) 升 7b = 7二のこと。a〜iまでが一〜九の段に対応します。
例) 7g7f = 77にある駒を76へ移動。
・駒打ちの指し手は、PAWN=歩、LANCE=香、KNIGHT=桂、SILVER=銀、GOLD=金、BISHOP=角、ROOK=飛として、これらの頭文字を書き、"*"(アスタリスク)を書き、打つ升を書きます。
例) B*2a(2一角打)
例) 2d2c+(2四の地点の駒を2三に移動させて成り)
NaN
2014/03/10 02:29
思考5秒設定の時に約10秒、思考8秒設定の時約16秒使っていたように見えましたが、何かの設定ミスではないですか?
yaneurao
2014/03/10 02:34
↑設定ミスでした。(持ち時間8秒+秒読み8秒になってました) 修正しました。ご指摘感謝!