科学・技術と自然環境について、教育を考える。
  • 05«
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • »07
侮れぬ囲碁のコンピューターソフト
侮れぬ囲碁のコンピューターソフト

ついにコンピューターが将棋プロに勝った。現役のプロ将棋棋士とコンピューターソフトとの公式対局「電王戦」の第2局目でコンピューターが1勝をあげた。このような事態は、将棋ではいずれ近いうちに来るだろうことは予測されていた。だが囲碁ではそう簡単にはいかない、当分大丈夫と予測されている。しかし、それも怪しくなってきた。 

囲碁の上達には、囲碁理論の基礎知識(定石、戦術、手筋など)はある程度必要だが、通常の人の場合は実践を通して、読む力、感性を学習し身につける必要がある。人間の有する学習能力こそは最も素晴らしいもので、機械には真似できないものであった。ところが、この点で囲碁ソフトの開発に質的変化が起こりそうである。そうなると、近い将来に人間より強い囲碁ソフトができるだろう。

コンピューターの強さと弱点
 碁盤上に石を置く着手の数は余りにも莫大すぎるから、経験によって養われた感性により着手の候補をまず決め、後から読みの力でその手の適否を確かめる。石の方向や大場・急場の判断には、この感性が大いにものをいう。それゆえ、囲碁の理論や定石・手筋を憶え、読みの力をつけても強くなるとは限らない。囲碁理論の基礎知識以外に、読みの力と感性の育成、それに学習能力の3要素が欠かせない。これ以外にも、対局相手の性格や癖を読み取り、着手に変化をつけることができれば、一段と強くなる(勝率が上がる)。
 コンピューターソフトは、一瞬にして何万通りの手を読めるから、読む力は人間を遙かに上回る。また、感性を必要とする石の方向や大場などの判断は、実践例を沢山記憶させておけばかなり補える。だが、自ら判断することと、学習することはできなかった。
 いくらコンピューターでも、メモリー能力には限界がある。スーパーコンピューター(スパコン)ができてメモリー容量は格段に増大したが、それでも、囲碁の場合は終局までの全着手数には遠く及ばない。この膨大な手をすべて読み切れないから、人間は感性によって直感的に着手の範囲を制限している。その判断力は学習によって高められる。感性による判断力とその学習がコンピューターにはできなかった。それゆえ、チェスや将棋ではコンピューターがトッププロに勝てるようになっても、囲碁ではコンピューターはそう簡単に人間に追いつけないと私も思っていた。
 以前の囲碁ソフトの開発は、布石や定石、攻め合い法などを記憶させた上で、囲碁理論を取り入れた評価関数(一手の価値を決める関数)を求めるという正攻法であった。しかし、うまい評価関数の開発は大変難しく停滞していた。
 そこで、発想の転換がなされた。コンピューターのこれら欠陥を埋めるために、逆手を取ったモンテカルロ法が開発されてから、ゲームソフトは飛躍的に強くなった。囲碁ソフトも当然飛躍した。モンテカルロ法とは、ゲーム終局までの着手をランダムに並べ、すべてのパターンを較べてみて、その中の勝ちパターンを選ぶ。その着手を逆に辿ってその局面ま行き、着手を決める方法である。この方法は結果(答え)を見て遡るのであるから、一種のカンニング法であり、ゲーム理論は原理的には一切必要としない。当然囲碁も同じである。ひたすら勝ちパターンを見つけて遡る努力だけが必要である。だから、手数が短く最後まで並べきれるゲームなら、モンテカルロ法は負けなしである。だが、囲碁の場合は、手数が長く着手の変化もものすごく多いので、終局まで打つと着手の変化数は10の400乗ほどになる。それゆえ、スパコンのメモリー容量を遙かに超えて、最後まで並べきることは実際には不可能である。そこで、数十手先まで読んでその場面で最善手(勝ちに導く)と思われる手を決めるわけだが、それでも着手数は多すぎる。だから、無駄な着手の枝を切り捨てるために「ミニマックス法」という手段が開発された。

「ミニマックス法」とは 
たとえば、次の着手に10通の可能性があり、そのまた次の着手も10通りというように続くとしよう。すると、着手の分岐枝が一つの枝から10本づつでることになる。このような図を「思考木」または「探索木」という。次の可能な着手が常に10通りでは10手先で10の10乗になり、すぐにメモリーが不足するから、あまり先まで読めない。そこで、余分な着手と思われる思考木の枝を切り捨てる「枝切り」をする。それによって半分の枝を切り捨てることができるなら、着手の選択枝は5だから、10手先でも5の10乗となり、格段に少数になる。それゆえ、余分な選択枝を少しでも多く切り捨てることが望まれる。そのときどれが「余分な枝」かを判定する方法が問題である。いまのところ、もっとも優れた方法は、この「ミニマックス法」と呼ばれるものだそうである。そのエッセンスは次の通り。
一段落した末端局面で(できれば最終局面で)、すべての端末枝の着手の評価(その方法が問題であるが省略)をして、そこから前の着手へと枝を遡って一段ごとに余分な枝を切り捨てていく。そのさいの選択基準は、自分の着手については評価値が最大になるものを選び、相手の手番ではこちらの手の評価値が最小になる着手を選ぶのである。そのような思考木を選び、それ以外の枝は切り捨てるというのである。この評価法で次々に上に遡っていて着手を決めるわけである。「ミニマックス」という名はここからきている。

 このミニマックス戦略をモンテカルロ法に適用して着手を決めるなら、囲碁理論は原則として不要である。しかし、終局まで行って、そこから思考木を遡ることは不可能であるから、何手先まで読めば一段落した末端局面とみなせるか、それを判断しなければならないし、またその端末局面で着手の評価をせねばならないから、モンテカルロ法にもある程度の囲碁理論が要るはずである。それでも、このカンニング的モンテカルロ法は正攻法でないから、囲碁理論の進歩にはあまり寄与せず、強さにも限界があると思っていた。

学習するコンピューター
モンテカルロ法は莫大な記憶容量を持つコンピューターのみ可能であり、人間には真似できないことである。これがコンピューターの強みである。それに加えて、 囲碁上達に必要な基礎知識の上に、前記の3要素、読みの力、感性の養成、学習能力を具えたソフトができれば、たちまち人間の棋力を凌駕するであろう。コンピューターは布石、定石、手筋などの記憶、および読みの力(攻め合いなど)は人間を超えるから、判断力と学習能力が備われば千人力である。そうなるとプロ棋士も太刀打ちできなくなるだろう。
 その判断力や学習能力のソフトが、ロボットの技術開発によって最近急速に進歩しているそうである。人間の世話をするロボットは、人との交流によってその人の癖や性格を読み取り、状況に応じて行動(反応)する、つまり学習できるところまで発達していると、NHKスペシアルで放映された(2月)。学習(まなぶ)とは、単に情報を記憶しそれを蓄積して、必要に応じてその情報をそのまま引き出す、つまり「まねる」というのではない。蓄積された情報を組み合わせて、内部で新たな情報を創発することである。このような学習ができれば、やがて総合的判断力が生まれる。さらには、相手の性格に応じた駆け引き、つまり心理作戦までできるようになるかも知れない。この種の学習能力に欠けていることが、人間と比較してコンピューターの弱点であった。
 「単純な学習」(蓄積した情報を組み合わせる)ができるソフトは以前からあったが、学習によって新たな情報を創発するソフトの開発は生やさしいものではないので遅れていた。だが、一たんその壁が突破されると、最初はちゃちなものでも、急速に進歩するものである(この現象はソフト開発に限らず多方面に見られる)。ただし、囲碁・将棋などのゲームソフトの「学習」は、主として多くの情報を集めて新たな法則を見いだす帰納法に関する学習である。それは論理的証明に繋がるものとは異質の学習である。囲碁・将棋には帰納法的学習が必要であり、論理的証明の能力はあまり要らないだろう。ちなみに、演繹的証明法は帰納法的証明の学習よりも遙かに難しいから、それはコンピューターには当分できそうにない。

人間を追い越す囲碁ソフトの出現は案外近い? 
コンピューターが人間よりも劣るものは感性・判断力そして学習である。そのうちの学習ができるようになれば判断力もつき、鬼に金棒である。莫大な記憶容量の上に、その学習能力に基づいた判断力を獲得すれば、人間にはできないモンテカルロ法と併せて、その能力が人間の棋力を超えるのは最早時間の問題であろう。学習によって何手先まで読めばよいか、どの枝を切り捨てるべきかの判断力がつくようになる。そうなると、ランダムに打つモンテカルロ法を抜け出すことになるだろう。
つい最近まで、コンピューターの愚直さと容量の限界ゆえに、当分の間囲碁では人間に勝つことはできないと私は侮っていたが、これほど早く人間が追い越されそうになろうとは思いもよらなかった。これも「想定外」と負け惜しみを言うより、不覚を恥じる。

それはさておき、何年先に人間を超すコンピューターは現れるか。コンピューターソフトの仕組みについて素人の私にはまともな予想はできないが、敢えて懸けてみることにする。
人の世話をするロボット、また原発事故以後、危険地域で人間の代わりをするロボットが注目されだし、その社会的需要は大きい。この種のロボットは学習による判断力の育成が望まれる。それゆえ、学習し判断力を養うロボットの開発と進歩は急速であろう。この分野で開発されたソフト技術を囲碁ソフトに取り入れ、それに実戦を重ねて学習させるならば、あれよあれよという間に人間の棋力を超えると思う。

現在のところ、囲碁ソフトは一流プロ棋士と4子で競り合っている。だが、プロに追いつく囲碁ソフトの出現は案外早く、あと5~6年で実現するのではなかろうか。
スポンサーサイト
この記事へのコメント

管理者にだけ表示を許可する
 
Copyright © 2005 自然と科学. all rights reserved.