科学・技術と自然環境について、教育を考える。
  • 05«
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • »07
人間の思惟形式と囲碁AIについてI.
人間の思惟形式と囲碁AIについてI.

I.囲碁AIは自己の行動の「意味」を理解できたか
 囲碁ソフトAlphaGoが世界のトップ棋士李セドルに圧勝して世界をあっと言わせてから、一年も経っていないのに、深層学習
(Deep Learning)を取り入れた囲碁ソフトがいくつか開発された。日本で開発された DeepZenGo が活躍している。
 最近ネット碁でAlphaGo の進化版として、ハンドルネーム「Master」がトップ棋士を相手に無敵の強さを発揮したことが大きなニュースになった。
今やプロ棋士たちは囲碁AIの打った新手を真似るだけでなく、囲碁の考え方まで再考を促されていると聞く。囲碁理論の革命が始まっている。

 これまでの囲碁AIの開発研究は、人間の開発した定石や膨大な人間の打ち碁棋譜をひたすら記録し、そのデータを基に深層学習法によって帰納的に法則性を学習するというものであった。しかし、最早その域を超えて、自らの着手を編み出していると、囲碁AIに詳しいプロ棋士(大橋拓文六段)が解説している。それ以前は、プロ棋士には思いつかない着手、打てない(疑問手とされた)着手によってAIが勝ったので驚かされた。だが、Master の対局棋譜では、プロ棋士が感心させられる素晴らしい手が度々打たれているそうだ。もう棋士の棋譜から学ぶのではなく「人間の棋譜を介さずに、AI独自の強化学習で飛躍的な棋力の向上を試みているように思える。」(朝日新聞2月2日夕刊)。

 ここまでくると、AIは単なる学習を超えて質的進化を遂げているのではないかと想像される。なぜならば、AIは人間の棋譜(1次情報)を基に深層学習によって、ある程度高いレベルの法則性を帰納的に自ら編みだし、新データ(2次情報)として蓄積しているはずだ。そのいろいろな新データの蓄積量がある閾値を超えると、それら2次情報を組み合わせた着手を打つようになるはずである。すると前に入力されたデータ(1次情報)から離れだす。すなわち2次情報をもとに自ら深層学習をするようになる。そのように「進化」したAI同士で何万、何十万局も対局を重ねれば、人間の棋譜に頼らないAI独自の新囲碁理論(法則性、情勢判断、新定石、着手の評価法)を編み出すこともできるだろう。AIの囲碁ソフトはその域に達したのではなかろうか。モンテカルロ法には理論は必要なかったが、この2次情報とそれの組み合わせたレベルのAIはモンテカルロ法を超えて、自らの囲碁理論を編み出していると想像される。

 このようなAIの評価に対して異論がでる。AIの評価の仕方として指摘されることは、いかにAIの機能が進歩しゲームで人間に勝てるからといっても、また人間相手に(ロボットが)上手く応対できたとしても、AIには「自分の行動の意味が分かってない(理解していない)」ということである。言い替えれば、自らの行動(着手)の理由を説明できないというわけである。
 
 では「意味が分かる」とはいかなることなのであろうか。そもそも「意識とは何か」がまだよく分かっていないから、そこに立ち返って考察を進める必要がある。
 生物のごく初歩的な意識は、少なくとも次のように規定できるだろう。最初に発生した原始的意識とは、生物発生から間もない進化初期の生物が無意識的行動(食物摂取、光に対する反応など)を繰り返すうちに、徐々に芽生えた目的達成のための物理・化学的機能といえるであろう。
 すなわち、意識とは「物質の高度な組織系が目的を持って行動する物理・化学的運動機能」の発達したものと見るならば、「意識」とは、(生物の原始的意識も含めて)一つの物質系がある目的(餌を採るなど)を達成するための行動に際して、その内部に蓄積した情報を組織的に活用する内的機能(行動の起動因)といってよいだろう
。ただし、原始的意識の発生過程で、どこからが「意識」といえるか明確に定めることは今のところ難しい。

  もしこのように意識を定義できるならば、囲碁AI (Master) も「自己の行動の意味を理解する」という「意識」を持つたといえるだろう。その理由は以下の通り。
 囲碁AIは、最初のうちは人為的に仕込まれた定石、手筋、攻め合いや、棋譜のデータ(1次情報)を基に、深層学習によって学んだ着手を繰り返していただろう。だが、それら初期データ(1次情報)を基に習得したものなかには、帰納的にえられた規則性や法則的なものがあるだろう。それらの新データは1次情報にはなかった、より高度の2次情報である。この段階で、2次情報は1次情報という人為的レベルから、離れつつあるといえるだろう。
 その2次情報の蓄積量がある閾値(臨界量)を超えると、AIはその2次情報から独自に囲碁に勝つための高次の学習を始めるようになるだろう。それは囲碁AI同士の対局で達成される。その場合は、囲碁に勝つことを目的とする行動を始めたといえる。すると、AIはその行動のための評価関数(複雑で数学的関数形をなしてないかも知れないが)を内部に形成し、それによって着手の判断をしていると思われる。
 内部に蓄積された情報を操作して、目的ある行動をするということは、AIは自らの行動の「意味」を理解したといえるのではないか。
「意味」を理解できたか否かを判定するために、チューリングテストに掛けてみる価値があろう。

(注)チューリングテスト:アラン・チューリングは「機械に、知性を持った振る舞いができるかどうかという問題」を発表した(1947)。チューリングの提案は「機械は我々が(考える存在として)できることをできるか」というもので、人間の物理的な能力と知的な能力の間に、公平で厳しい境界線を引くことの試みである。
そのためにチューリングは、「模倣ゲーム」というテストを提案した。機械と人間を別々の部屋に入れ、テスト者はいくつかの質問をし、それに対するタイプ打ちの回答を読んで、どちらが機械でどちらが人間か当てるというゲームである。このゲーム中の機械は、テスト者に人間と思わせる回答をする。最後まで、どちらが人間なのかわからなければ、そのコンピューターは合格である。そのとき「そのコンピューターには知能がある!」と言える。ピュータは合格である。
「それ以前1936年に、哲学者のアルフレッド・エイヤーは、意識を持つ人間と意識を持たない機械を区別する方法を以下のように提案している。「私にとって、意識を持っているように見える対象が本当は意識をもつ存在ではなく、単なるダミーや機械であると判断する根拠は、意識の有無を判定するための経験的なテスト(empirical tests)のどれかに失格した、ということしかない。」

II.囲碁AIの「評価関数」
 AIがすでに評価関数をもったろうと推測できるデータが現れた。AlphaGo を開発したグーグル傘下の英ディープマインド社がAlpha Go 同士の何万局という対局の中から50局を選んで棋譜を公表した(6月4日、ただし棋譜の選択基準は不明)。
 それを見て囲碁界は騒然。「こんな碁はいまだかつて見たことがない」、常軌を逸した着手の続出で理解不能とまでいわれた。たとえば、これまでは手数が進んだ特殊な状況に限り有効とされていた「星への三々(さんさん)入り」を序盤の早いうちに互いに打ち合ったり、「双方の石がぶつかり合って手抜きがしにくい接触戦のさなかに戦いを放置して他方面に転戦」したり。これまでの常識では考えられない着手の連続にプロ棋士らは驚愕したそうである。

 その棋譜(一部だが)を実際に見ると、急場や大場、ときには攻め合いに構わず、他方面に打ちまた戻るという着手が続くこともある。まったく理解不能、驚くばかりである。しかし、互いにその様な手を打ち合っているところを見ると、囲碁AIにとってある規則性があり、一定の評価に基づいて進行しているのではないかと思わせる。つまり、AlphaGo は内部に独自の「評価関数」を持っていて、それによって着手の価値を計算しているのではないかと推測できる。同じ囲碁ソフトだから、同じ評価法によってゲームを進めているから「意気」が合うのだろう。

 その「評価関数」は、AIの蓄積した2次情報を基に徐々に形成したものであろう。そうなら、その評価関数は人間が築いてきた囲碁常識とは異質の論理を内包しているかも知れない。人間が開発しようとした評価関数は、一手の価値をその局面の配石との関連のみで評価するものであった。つまり、2次元面内での評価法であった。しかし、囲碁AIは、モンテカルロ法を進化させた学習法であるから、その「評価関数」は少なくとも数手先まで打った結果の状況評価を加味したものであると予想される。それゆえ、時間も入れた3次元的考察といえる。この解析法は一種のシミュレーションで、コンピューターの得意とするところである。

今後さらに、AIが進歩すれば、自らの行動(着手)の意味、「なぜその様に行動するのか」を説明できる機能を持たせることができるようになるだろう。それが次の課題である。

I I I.囲碁AIと人間との意思疎通
 プロ棋士たちは囲碁AIの打った新手を真似るだけでなく、囲碁の考え方まで再考を促されているということは、囲碁理論に革命が起こりつつあるということである。AIの打った棋譜から人間が学ぶことで、人間がAIの新手の意味を解釈して新理論を構築することは可能である。現在はその段階にある。だが、囲碁AIに着手の意図を説明させるソフトを開発すれば、人間とAIとの交流が可能になり、囲碁理論の格段の進歩と囲碁理論の革命に大きく寄与することは必定である。囲碁AIが自らの行動の「意味」を理解しているならば、それは可能なはずである。

 囲碁AIに、囲碁に関する会話を学習させて人間と交流を重ねれば、「手談」ではなく言葉で情報交換できるようになる。それがある程度まで可能であることは、ロボット(アンドロイド)と人間との交流で実証されている。単なる会話ではなく、そのうちに互いの感情移入まで起こるという実験報告もある。そうならば、人間の誘導による教育の仕方で、囲碁の理論的な会話も可能なはずである。AIに理論的な会話を教育すれば、人間の誘導質問によって理論的な回答を引き出すことができるだろう

 その様な交流を重ねていけば、囲碁AIが2次情報を用いて編み出した新手の根拠や意図を聞き出すことも可能になるだろう。そうなれば、「AIには自分の行動の意味が分かってない(理解していない)かどうか」も判定できる。

 プロ棋士の解説によると、AIは以前の予想に反して、序盤の布石に新機軸を編み出したそうである。また、囲碁AI同士の棋譜のように「常軌を逸した着手」が現れるように、そこには人間の発想からは思いつかない構想が見られるという。
その構想が如何にして生まれたかを誘導質問で答えさせることができるなら、AIが内部に形成した「評価関数」の様式を推測できるだろう。その評価関数は、明瞭な関数形になっていない可能性もあり(いずれにせよ変数の多い多変数関数だろう)、人間がこれまで考案した評価関数とは質的に異なるものかも知れない。


 いずれにせよ、人間とAIとの交流により、その応答から人間の盲点を突いた囲碁理論が浮かび上がってくるだろう。不完全でもAIの「評価関数」の形式が分かれば、それを手掛かりに囲碁の演繹的理論(囲碁ルールを公理とする演繹体系から最善手を導出する理論)を形成する可能性もでてくる。さらに進んで、人間とAIとの協同創作による新囲碁理論形成の可能性もある。それは正に囲碁理論の革命となるばかりでなく、人類とAIとの共存の仕方についても何らかの示唆を与えるだろう。
スポンサーサイト
Copyright © 2005 自然と科学. all rights reserved.