モンテカルロ将棋の試み

ブログをはじめとするコンピュータ将棋のWebサイトにて、モンテカルロアルゴリズムで先読みをする将棋プログラムを開発した、もしくは将来その予定、という報告が増えてきました。興味深い試みですので、メモを兼ねて各地のレポートを一度まとめてみます。

モンテカルロアルゴリズムについての解説は、YSSと彩のページの記事、モンテカルロ法で囲碁、将棋1.モンテカルロ法とは?がわかりやすいでしょう。ゲームへの応用については次章以降に書かれています。専門的な内容については、加藤英樹さんがコンピュータ囲碁の論文を和訳されていますので、こちらをお読みになることをお奨めいたします。以前「第12回コンピュータオリンピック・アムステルダム大会」「GPW-07第一報: ボナンザ学習とUCTが話題の中心に」でも紹介した、最近約3年の間にコンピュータ囲碁を革新的に強くしたモンテカルロ法の詳細は、ここに掲載されている論文で読むことができます。この技術をコンピュータ将棋にも使えないか、と考えるコンピュータ将棋開発者が増えてきたのです。

ブログや掲示板での発表は以下の通り。

研究発表については以下をどうぞ。

他にありましたらコメント欄にてご指摘をお願いいたします。

コンピュータ囲碁では、モンテカルロ法が、「はっきり今までのクラシックな作り方の囲碁プログラムは終焉を迎えました」「今までの10年はなんだったんでしょうねぇ」と山下さんを嘆かせるほど決定的な成果を挙げていますが、コンピュータ将棋でそこまで到達したものは今のところないようです。しかし、渡辺竜王vsBonanzaにてBonanzaが敗着を指した局面で渡辺竜王が心配していた手を指せた、との報告(「遠見」開発日記小宮日記)があり、また渡辺竜王の勝ちがはっきりした局面で敗勢の評価が正しく出せたそうです。モンテカルロアルゴリズムの性質からして、終盤の詰みが生じる直前の局面に強いということは充分に考えられるので、今後の研究次第ではBonanzaのように新たな強さを備えたコンピュータ将棋が生まれるかもしれませんね。

最初のコメントをどうぞ

トラックバックのリンク

トラックバック/ピンバック:1個

  1. トラックバック: コンピュータ将棋協会blogより - 2008/5/29(木)