【番外編】コンピュータ囲碁DeepZenGo、トッププロ棋士に挑戦

8ヶ月前の3月、当ブログにて、【番外編】あすからコンピュータ囲碁がトッププロ棋士に挑戦、という記事を掲載いたしました。このとき紹介したAlphaGoは、広く報じられた通りイ・セドル九段と5局対局し4勝1敗と勝ち越し、内容でも圧倒して新時代の到来を証明しました。この五番勝負の直前まで、世界最大のコンピュータ囲碁大会である第8回UEC杯コンピュータ囲碁大会優勝者/準優勝者がプロ棋士に3子〜4子置かせてもらっていい勝負、という状況だったため、互先(ハンディキャップなし)での完勝というあまりの急激な進歩には、プロ棋士や人工知能の専門家でさえも唖然とさせられました。

かつてのコンピュータチェスのディープブルーのように、コンピュータ囲碁においてAlphaGoが独走態勢を築いた、と多くの人がこのとき考えましたが、2016年を終える前にそれを追撃する勢力が現れました。先述の紹介記事でも触れたDeepZenGoが、第2回囲碁電王戦にて、趙治勲名誉名人・25世本因坊に互先で挑むことになり、すでに第1局第2局が行われ、ニコニコ生放送にて中継されました。本記事は今年2度目の【番外編】となりますが、当ブログにおいて未了であったAlphaGoの打った碁についての簡単な総括も兼ねて、コンピュータチェスやコンピュータ将棋とも異なる展開を見せているコンピュータ囲碁の人類への挑戦について、コンピュータ将棋と比較しつつ再度触れることとします。

イ・セドル九段-AlphaGo戦の内容

AlphaGoの強さは、イ・セドル九段との対局の直前に予想されていた水準を遥かに上回るものでした。AlphaGoの特長は、単に強いというだけでなく、コンピュータチェスやコンピュータ将棋のイメージとはまた異なるゲーム人工知能の姿です。多くの人々にとってコンピュータ将棋のイメージは、とにかく読みが深くて正確、特に中・終盤に強く、剛腕をもって人間を圧倒する、一方で人間の奇抜な序盤作戦(例: 電王戦FINAL第5局)に引っかかるなど大局観や構想力についてはさほどでもない、というものでしょう。

これに対し、囲碁のプロ棋士や高段者によるAlphaGoの評価は、特に布石(序盤)の感覚、大局観に優れる、というものです。碁盤の隅や辺の確定的な地(囲碁用語で実利と呼ばれる)よりも、終局時の地の大きさが未知数な碁盤中央の厚み(勢力)を人間よりも重視し、実際に優位に立って逃げ切ってしまう、という展開で多くの勝利をものにしていました。デジタル的な計算で求めにくい要素で人類を大きくリードしてしまったのです。唯一AlphaGoが敗れた第4局は、優勢になりながらイ・セドル九段の白78の勝負手に対して攻め合いの読みを誤る、という予想外の展開でした(現在のAlphaGoはこの不具合を起こさないように改良されているそうです)。

このような特長は、近年コンピュータ囲碁で成果を挙げてきたモンテカルロ木探索(PDF)ディープラーニングの技術をAlphaGoも採用していることからある程度事前に予想されてはいましたが、その水準の高さは革命的でした。コンピュータ将棋の黎明期、「コンピュータ将棋は駒の損得ばかり重視して大局的な判断ができない」などと言われていましたが、このような過去の人工知能のイメージは完全に捨て去られるべき時代に入った、といえるでしょう。

人間の評価と影響

囲碁棋士によるイ・セドル九段戦後のAlphaGoへの評価はこちらなどにまとめられています。コンピュータ囲碁がコンピュータ将棋以上に大きな影響をプロ棋士に与えていることが伺えます。実際、最近のプロ棋士の公式戦ではAlphaGoの影響を受けたと思われる手が多数打たれているようです。5番勝負の棋譜はディープマインド社のサイトで見られます。

AlphaGoの開発において、このような変化が意図もしくは予想されていたかどうかは定かではありませんが、DeepZenGoプロジェクトについては、日本棋院が開発に協力していることから、コンピュータ囲碁の成果を布石の研究などに取り入れて人間の技術の進歩にも役立てよう、という意欲を多くの関係者が持っているものと思われます。DeepZenGoプロジェクト自体はイ・セドル九段-AlphaGo戦の前に発表されていますが、日本の囲碁のプロ棋士は近年の国際戦で中国・韓国の棋士に対する成績が芳しくないことから、コンピュータ囲碁からのフィードバックを得る意欲が電聖戦の構想の時点ですでにあったようです。AlphaGoの成果を目の当たりにした後にその意欲が増したであろうことは想像に難くなく、その点においてもDeepZenGoには強い期待がかけられているものと思われます。

コンピュータ囲碁の主要技術

コンピュータ囲碁の根幹をなす技術については、先述の通りモンテカルロ木探索(PDF)ディープラーニングが2本柱です。今年の第9回UEC杯コンピュータ囲碁大会では上位チームが軒並みこの2本を擁していたようで、オープンイノベーションの時代を象徴しているともいえます。コンピュータ将棋でも近年、オープンソースの強豪ソフトの増加や有力チェスソフトの技術の進化などにより、有力な技術の共有化が深まる傾向にありますが、コンピュータ囲碁ではこの2つがあまりにも強く、必須技術となっているようです。特にディープラーニングは現代の人工知能における主力技術であり応用範囲も極めて広く、多くの企業や研究者も研究開発に参加しているため、チェス専用チップが組み込まれていたディープブルーのような、真似をする人がほとんどいなさそうな技術よりもはるかに多くの注目が集まっているはずです。

AlphaGoDeepZenGoもこの2本柱からなります。先日の記事でも紹介したAlphaGoの技術について少し補足すると、ディープラーニングの技術を応用し、主に過去の棋譜からの学習で作り上げたポリシーネットワークと、主にコンピュータ自身による実戦シミュレーションによる強化学習で作り上げたバリューネットワークの2つの多階層ニューラルネットワークが重要な役割を果たします。DeepZenGoの技術もおおむね同様のようですが、メインプログラマの尾島陽児氏によって独自性がかなり盛り込まれているようです。第2回囲碁電王戦の終了後、DeepZenGoの技術についてより詳しい情報が明らかになることが期待されます。

第2回囲碁電王戦

冒頭に述べた通り、第2回囲碁電王戦はすでに2局を終了しています。第1局趙治勲名誉名人・25世本因坊が勝利しましたが、第2局DeepZenGoが悲願の勝利を挙げ、最終第3局に三番勝負の勝ち越しをかける(2連勝もしくは2連敗でも第3局が行われることは決まっていましたが)という最高の展開になっています。この2局について、明らかに損な手を打つなど中・終盤には疑問手も見受けられるものの、布石については高い評価を得られているようです。第1局のニコ生解説の一力遼七段は「(布石について)僕より強い」、第2局のニコ生解説の高尾紳路名人は「布石はAlphaGo以上ではないか」といったような発言をしています。今回のDeepZenGoのマシンスペックはCPU44コア、GPU4基でクラスタなし、と、イ・セドル九段戦時のAlphaGoのCPU1202個/GPU176基を擁するクラスタに比べて慎ましい構成ですが、これでトッププロに勝利したということは、AlphaGo以上の快挙をすでに成し遂げているともいえます。

大一番となる最終第3局は、11月23日(祝)に行われ、ニコニコ生放送で生中継されます。井山裕太六冠王がニコ生解説を担当する必見の一局。視聴方法については第2回囲碁電王戦のページをご覧ください。AlphaGoのときとはまた異なる歴史的瞬間が見られるかもしれません。

Comments (0) | Trackbacks (0)

コンピュータで不正行為? コンピュータ将棋を使って将棋の対局に勝てるか

3日前の10月12日(水)、公益社団法人 日本将棋連盟(以下、将棋連盟)が、第29期竜王戦七番勝負の挑戦者が変更されたことを発表し、数多くの将棋ファンを驚かせました。ニュースは一般のマスコミにも取り上げられて広く知られることとなり、「コンピュータの助けを借りてプロ棋士が対局に勝つことができるのか?」という解説も各方面で行われたようです。当協会の関係者や学識経験者も取材を受けています。大変なことではありますが、コンピュータ将棋の技術について周知されるに適した機会ですので、当ブログで簡単な解説を試みます。

不正行為は可能?

20年以上前からサービスが行われているネットの将棋サイトの多くで「将棋コンピュータソフト使用禁止」とされていることをご存じの将棋ファンの皆さんにとっては、将棋ソフトの有効性は明らかでしょう。プロレベルでも通用するのか、という点が議論の焦点ですが、今年行われた第1期電王戦でも、その前の過去4回の電王戦でもコンピュータが好成績を収めていることから、コンピュータソフトに実戦の局面を入力してコンピュータの示した手をそのまま実際の対局でも採用する、ということを実行できれば、プロでもほとんどの対局で勝てるでしょう。

プロ棋士の対局でコンピュータソフトの助けを得る方法については、対局中に席を外してスマートフォンを使う、という説が各方面で示されています。強いコンピュータ将棋ソフトの多くはパソコン用に開発されたものですが、その一部はスマートフォン用に移植されているようで、スマフォアプリの実力はノートパソコンと同等以上、と言われているそうです。携帯電話の計算力はパソコンに引けをとる、と考えられることが多いのですが、最近のスマートフォンはメモリ容量も大きく、CPUの動作クロックも速いので、制約はパソコンよりは大きいものの、将棋が目に見えて弱くならざるを得ないほどのハンディキャップがあるとはいえません。 More comments…

Comments (1) | Trackbacks (0)

ゲームプログラミングワークショップ2016、今年は2年ぶりに箱根で

今年もゲームプログラミングワークショップの参加募集が始まっています。11月4日(金)、5日(土)、6日(日)の3日間に箱根セミナーハウスで行われる今年のゲームプログラミングワークショップ2016 (GPW-16) のプログラムによれば、将棋や囲碁に加え、6目並べや、カードゲームや麻雀などの不完全情報/多人数ゲーム、サッカーやカーリングのシミュレーション、シューティングゲームやポケモンなど、多彩なゲームが研究対象となっています。技術分野も、今や一般にも言葉が普及したディープニューラルネット(ディープラーニング)をはじめ多岐にわたっています。

恒例の2題の招待講演はそれぞれ、5年前にクイズ番組で人類に勝利したIBM社のWatsonと、今年いきなり人類を超越し世界を驚かせた囲碁AIがテーマです。

また、10年以上にわたって行われてきた、GPW杯の名を冠した多数のコンピュータ大会が、今年もナイトイベントにて開催されますので、プレイヤーの皆さんは上記リンク先をお読みの上、是非ご参加ください。なお、元祖GPW杯であるコンピュータ将棋大会については、今年の開催を見送りとさせていただく予定です。非公式のサーバ対局については受け付ける予定(フィッシャークロックルール)ですので、機運が高まれば大会という形に発展する可能性はありますが、今のところは他競技に場を譲る予定です。ご了承ください。

表題の通り、今年は2年ぶりに箱根で開催されますので、お間違えなきようご注意ください。また今年は昨年よりも早めの開催ですので、参加申込締切も10月24日(月)と少し早めですのでご注意ください。

Comments (0) | Trackbacks (0)

第4回将棋電王トーナメントはPonanzaが2連覇、電王戦に進出

東京・六本木のニコファーレで行われていた、第4回将棋電王トーナメントは本日、5位決定戦/準決勝/決勝等が行われ、決勝でPonanzaが3勝0敗で浮かむ瀬を降し、2年連続3度目の優勝を果たしました。Ponanzaチームの皆さん、おめでとうございます。

Ponanzaは、優勝賞金の300万円とともに、来春の開催が予定されている第2期電王戦二番勝負の出場権を得ました。現在本戦トーナメントが開催されているプロ棋士の棋戦、第2期叡王戦の優勝者との二番勝負に進出します。

ソースコードの公開・交流が進み、近年すっかりオープン・イノベーションの成功例として知られるようになったコンピュータ将棋は、ますます進化を加速させているとプロ筋でも高く評価されています。今年の第1期電王戦二番勝負に続いてコンピュータ将棋の勝利となるか、あるいは人類が巻き返すか。なお、来春の第2期電王戦は今年とは異なり1日制の対局二局が予定されています。

Comments (0) | Trackbacks (0)

あすから第4回将棋電王トーナメント

第4回将棋電王トーナメントが、あす10月8日(土)から10月10日(祝)までの3連休に、東京・六本木のニコファーレで行われます(前回と同様、観覧募集はありません)。

昨年の第3回と同様、賞金総額550万円、優勝賞金300万円のビッグトーナメント、かつ来春に予定されている第2期電王戦のコンピュータ側代表決定戦です。ハードウェアがCPUにCore i7-6700を搭載したPCに統一され、純粋にソフトウェアの強さで争われる点が世界コンピュータ将棋選手権との最大の相違点。トーナメントの模様はこれまでと同様、ニコニコ生放送で中継されます。視聴にはユーザー登録とログインが必要です。

なお、第2期電王戦の人類代表決定戦を兼ねる第2期叡王戦は、本戦トーナメントが先月始まったところ。第2期電王戦は、ここで優勝したプロ棋士との二番勝負で争われる予定です。

前回を上回る35チームの出場が予定されている今回。どのチームが高額賞金と第2期電王戦の挑戦権をつかむか。そして勿論、最先端の技術にも注目が集まります。

Comments (0) | Trackbacks (0)

« Previous entries

コンピュータ将棋協会blog is Digg proof thanks to caching by WP Super Cache!