【番外編】コンピュータ囲碁DeepZenGo、トッププロ棋士に挑戦

8ヶ月前の3月、当ブログにて、【番外編】あすからコンピュータ囲碁がトッププロ棋士に挑戦、という記事を掲載いたしました。このとき紹介したAlphaGoは、広く報じられた通りイ・セドル九段と5局対局し4勝1敗と勝ち越し、内容でも圧倒して新時代の到来を証明しました。この五番勝負の直前まで、世界最大のコンピュータ囲碁大会である第8回UEC杯コンピュータ囲碁大会優勝者/準優勝者がプロ棋士に3子〜4子置かせてもらっていい勝負、という状況だったため、互先(ハンディキャップなし)での完勝というあまりの急激な進歩には、プロ棋士や人工知能の専門家でさえも唖然とさせられました。

かつてのコンピュータチェスのディープブルーのように、コンピュータ囲碁においてAlphaGoが独走態勢を築いた、と多くの人がこのとき考えましたが、2016年を終える前にそれを追撃する勢力が現れました。先述の紹介記事でも触れたDeepZenGoが、第2回囲碁電王戦にて、趙治勲名誉名人・25世本因坊に互先で挑むことになり、すでに第1局第2局が行われ、ニコニコ生放送にて中継されました。本記事は今年2度目の【番外編】となりますが、当ブログにおいて未了であったAlphaGoの打った碁についての簡単な総括も兼ねて、コンピュータチェスやコンピュータ将棋とも異なる展開を見せているコンピュータ囲碁の人類への挑戦について、コンピュータ将棋と比較しつつ再度触れることとします。

イ・セドル九段-AlphaGo戦の内容

AlphaGoの強さは、イ・セドル九段との対局の直前に予想されていた水準を遥かに上回るものでした。AlphaGoの特長は、単に強いというだけでなく、コンピュータチェスやコンピュータ将棋のイメージとはまた異なるゲーム人工知能の姿です。多くの人々にとってコンピュータ将棋のイメージは、とにかく読みが深くて正確、特に中・終盤に強く、剛腕をもって人間を圧倒する、一方で人間の奇抜な序盤作戦(例: 電王戦FINAL第5局)に引っかかるなど大局観や構想力についてはさほどでもない、というものでしょう。

これに対し、囲碁のプロ棋士や高段者によるAlphaGoの評価は、特に布石(序盤)の感覚、大局観に優れる、というものです。碁盤の隅や辺の確定的な地(囲碁用語で実利と呼ばれる)よりも、終局時の地の大きさが未知数な碁盤中央の厚み(勢力)を人間よりも重視し、実際に優位に立って逃げ切ってしまう、という展開で多くの勝利をものにしていました。デジタル的な計算で求めにくい要素で人類を大きくリードしてしまったのです。唯一AlphaGoが敗れた第4局は、優勢になりながらイ・セドル九段の白78の勝負手に対して攻め合いの読みを誤る、という予想外の展開でした(現在のAlphaGoはこの不具合を起こさないように改良されているそうです)。

このような特長は、近年コンピュータ囲碁で成果を挙げてきたモンテカルロ木探索(PDF)ディープラーニングの技術をAlphaGoも採用していることからある程度事前に予想されてはいましたが、その水準の高さは革命的でした。コンピュータ将棋の黎明期、「コンピュータ将棋は駒の損得ばかり重視して大局的な判断ができない」などと言われていましたが、このような過去の人工知能のイメージは完全に捨て去られるべき時代に入った、といえるでしょう。

人間の評価と影響

囲碁棋士によるイ・セドル九段戦後のAlphaGoへの評価はこちらなどにまとめられています。コンピュータ囲碁がコンピュータ将棋以上に大きな影響をプロ棋士に与えていることが伺えます。実際、最近のプロ棋士の公式戦ではAlphaGoの影響を受けたと思われる手が多数打たれているようです。5番勝負の棋譜はディープマインド社のサイトで見られます。

AlphaGoの開発において、このような変化が意図もしくは予想されていたかどうかは定かではありませんが、DeepZenGoプロジェクトについては、日本棋院が開発に協力していることから、コンピュータ囲碁の成果を布石の研究などに取り入れて人間の技術の進歩にも役立てよう、という意欲を多くの関係者が持っているものと思われます。DeepZenGoプロジェクト自体はイ・セドル九段-AlphaGo戦の前に発表されていますが、日本の囲碁のプロ棋士は近年の国際戦で中国・韓国の棋士に対する成績が芳しくないことから、コンピュータ囲碁からのフィードバックを得る意欲が電聖戦の構想の時点ですでにあったようです。AlphaGoの成果を目の当たりにした後にその意欲が増したであろうことは想像に難くなく、その点においてもDeepZenGoには強い期待がかけられているものと思われます。

コンピュータ囲碁の主要技術

コンピュータ囲碁の根幹をなす技術については、先述の通りモンテカルロ木探索(PDF)ディープラーニングが2本柱です。今年の第9回UEC杯コンピュータ囲碁大会では上位チームが軒並みこの2本を擁していたようで、オープンイノベーションの時代を象徴しているともいえます。コンピュータ将棋でも近年、オープンソースの強豪ソフトの増加や有力チェスソフトの技術の進化などにより、有力な技術の共有化が深まる傾向にありますが、コンピュータ囲碁ではこの2つがあまりにも強く、必須技術となっているようです。特にディープラーニングは現代の人工知能における主力技術であり応用範囲も極めて広く、多くの企業や研究者も研究開発に参加しているため、チェス専用チップが組み込まれていたディープブルーのような、真似をする人がほとんどいなさそうな技術よりもはるかに多くの注目が集まっているはずです。

AlphaGoDeepZenGoもこの2本柱からなります。先日の記事でも紹介したAlphaGoの技術について少し補足すると、ディープラーニングの技術を応用し、主に過去の棋譜からの学習で作り上げたポリシーネットワークと、主にコンピュータ自身による実戦シミュレーションによる強化学習で作り上げたバリューネットワークの2つの多階層ニューラルネットワークが重要な役割を果たします。DeepZenGoの技術もおおむね同様のようですが、メインプログラマの尾島陽児氏によって独自性がかなり盛り込まれているようです。第2回囲碁電王戦の終了後、DeepZenGoの技術についてより詳しい情報が明らかになることが期待されます。

第2回囲碁電王戦

冒頭に述べた通り、第2回囲碁電王戦はすでに2局を終了しています。第1局趙治勲名誉名人・25世本因坊が勝利しましたが、第2局DeepZenGoが悲願の勝利を挙げ、最終第3局に三番勝負の勝ち越しをかける(2連勝もしくは2連敗でも第3局が行われることは決まっていましたが)という最高の展開になっています。この2局について、明らかに損な手を打つなど中・終盤には疑問手も見受けられるものの、布石については高い評価を得られているようです。第1局のニコ生解説の一力遼七段は「(布石について)僕より強い」、第2局のニコ生解説の高尾紳路名人は「布石はAlphaGo以上ではないか」といったような発言をしています。今回のDeepZenGoのマシンスペックはCPU44コア、GPU4基でクラスタなし、と、イ・セドル九段戦時のAlphaGoのCPU1202個/GPU176基を擁するクラスタに比べて慎ましい構成ですが、これでトッププロに勝利したということは、AlphaGo以上の快挙をすでに成し遂げているともいえます。

大一番となる最終第3局は、11月23日(祝)に行われ、ニコニコ生放送で生中継されます。井山裕太六冠王がニコ生解説を担当する必見の一局。視聴方法については第2回囲碁電王戦のページをご覧ください。AlphaGoのときとはまた異なる歴史的瞬間が見られるかもしれません。

このエントリーをはてなブックマークに追加
はてなブックマーク - 【番外編】コンピュータ囲碁DeepZenGo、トッププロ棋士に挑戦
Share on Facebook
Post to Google Buzz
Bookmark this on Yahoo Bookmark
Bookmark this on Livedoor Clip
Share on FriendFeed

最初のコメントをどうぞ

トラックバックのリンク

コンピュータ将棋協会blog is Digg proof thanks to caching by WP Super Cache!