ゲーム・プレイヤのエクスパティーズ
パネリストの紹介
竹内郁雄(NTTソフトウェア研究所)

人間のexpertizationをなるべくそのままの形で取り込んだゲームプログラミングというのは1960年代からの、いわば温故知新の話題である。チェスにおけるDeep Blueの成功に押されて、というかブルートーザ(?)に踏み荒らされて、いまや「認知科学的ゲームプログラム」はすっかり影が薄くなったように見受けられる。
私は1970年代、このような認知科学的ゲームプログラムを夢見て、いくつかの実験を行なった。現在はそういったゲームプログラムを行なえるようなマシンと言語の研究開発を行なっている。 I shall return.
強いプログラムを作るためには、もちろんいろいろなことをやらないといけないが、ここでは少し極端な視点で問題点をはっきりさせよう。恥ずかしながら大昔、あるシンポジウムの夜、野崎昭弘先生とチェスをやろうということになった。しかし、チェス盤がないので将棋盤でやることになった、そのとき私のドジでなんと8×9の盤でやり、しばらくの間気がつかなかった!しかし、これでもゲームはゲームである。これでも人間はいつのまにか、戦術・戦略を構成してしまうように見える。しかも反復学習とは違うメカニズムが働いているようだ。
新しいゲームに遭遇したときのこのような「上達」のメカニズムをここで問題にしたい。理想をいえば、評価関数を使わない、シラミ潰し的な先読みをしないことが本質のゲームプログラムを作りたい。このアイデアの原点はソ連の元チェスグランドマスターBotvinnikが1970年ごろに行なったplanにもとづくゲームプログラムの研究である(Botvinnik, 1970)。私はその方法論でHexやCalculationといったゲームのプログラムを実際に作成した(竹内, 1977)。
そこでわかったことは、いまでいうreflectionのタワーの必要性である(そのころはまだreflectionの概念が存在しなかった)。Botvinnikの用語でいえば、planに対するmeta-plan、meta-planに対するmeta-meta-plan…の必要性である。これはまさに人間の自己モニター能力・適応能力に本質的に関わる問題である。昔はコンピュータのパワーが低くてできなかった実験もいまだったらできるかもしれない。

M. M. Botvinnik, Computers, Chess and Long-Range Planning, Springer-Verlag, (1970).
竹内郁雄:ゲームプログラミングの手法, 情報処理学会, 記号処理研究会1-3, (1977).

[ 戻る | 大会プログラム | 13回大会TOPへ ]
このページを閉じる