科学・技術と自然環境について、教育を考える。
  • 09«
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • »11
囲碁ソフトは行動の「意味」を理解できたか 
囲碁ソフトは行動の「意味」を理解できたか 

 囲碁ソフトAlphaGoが世界のトップ棋士李セドルに圧勝して世界をあっと言わせてから、一年も経っていないのに、深層学習(Deep Learning)を取り入れた囲碁ソフトがいくつか開発された。日本で開発された DeepZenGo が趙治勲名誉名人と対局し1勝をあげた(対戦成績2:1)。これも,トップ棋士にハンディなしで1勝をあげたと、大変な話題になった。

 最近ネット碁でAlphaGo の進化版として、ハンドルネーム「Master」がトップ棋士を相手に無敵の強さを誇っている。今やプロ棋士たちは囲碁ソフトの打った新手を真似るだけでなく、囲碁の考え方まで再考を促されているところまできた。 

 これまでの囲碁ソフトは、定石や膨大な棋譜をひたすら記録し、そのデータを基に深層学習法によって帰納的に法則を学習するというものであった。しかし、最早その域を超えて、自らの着手を編み出しているようだ、と伝えられる。以前は、プロ棋士には思いつかない着手、打てない着手(疑問手)を打ってAIが勝ったので驚かされた。だが、Master の対局棋譜では、プロ棋士が感動させられる素晴らしい手が打たれているそうだ。もう棋士の棋譜から学ぶのではなく「人間の棋譜を介さずに、AI独自の強化学習で飛躍的な棋力の向上を試みているように思える。」(朝日新聞2月2日夕刊)。 

 ここまでくると、AIは質的な進化を遂げているのではないかと想像される。AIの囲碁ソフトは人間の棋譜(1次情報)を基にした深層学習によって、ある程度高いレベルの規則性(法則性)を自ら編みだし、2次的データとして蓄積しているはずだ。その蓄積されたいろいろなデータ(2次情報)の量がある閾値を超えると、それら2次情報のデータを組み合わせた着手を打つようになるだろう。すると前に入力されたデータ(1次情報)から離れだす。すなわち2次情報をもとに深層学習をするようになる。そのように「進化」したAI同士で何万、何十万局も対局を重ねれば、人間の棋譜に頼らないAI独自の法則性(囲碁理論)を編み出すこともできるだろう。AIの囲碁ソフトはその域に達したのではなかろうか。勝敗だけの問題ならば、最早、AI囲碁ソフトは人間を超えた。 

 AIの評価として指摘されてきたことは、いかにAIの機能が進歩し人間に勝てても、またロボットが人間相手に上手く応対できても、AIには「自分のしているその意味が分かってない(理解していない)」ということである。機械的に無意識に反応しているだけで、その意味を理解してないというわけである。

 そもそも「意味が分かる」とはいかなることなのであろうか。「意識とは何か」がまだよく分かっていない。
しかし、生物(高度に組織化された物質系)のごく初歩的な意識は、少なくとも次のように規定できるだろう。最初に発生した「原始的意識」とは、生物発生から間もない進化初期の生物が無意識的行動(食物摂取、光に対する反応など)を繰り返すうちに、徐々に芽生えた目的達成のための物理・化学的機能の一種といえるであろう。

 すなわち、意識を「組織的物質系の物理・化学的運動による機能の一種」と見るならば、「意識」(生物の原始的意識も含めて)とは、一つの物質系がある目的(餌を採るなど)を達成するための行動に際して、その内部に蓄積した情報を統合的に活用する内的機能(行動の起動因)といってよいだろう。ただし、原始的意識の発生過程で、どこからが「意識」といえるか明確に定義することは今のところ難しい。  

 もしこのように意識を定義できるならば、囲碁ソフトMaster も「自己の行動の意味を理解する」という意識を持つたといえるだろう。最初は人為的に仕込まれた棋譜データ(1次情報)を基に深層学習によって無意識的な着手を繰り返していた(反応していた)囲碁ソフトが、習得したデータ(2次情報)の蓄積がある閾値を超えると、AIは独自に2次情報から囲碁に勝つための高次の学習を始めることも起こりうる。その場合は、囲碁に勝つことを目的とする行動を始めたといえるであろう。

 囲碁ソフトは打ち終わった(あるいは中途の)段階でゲームの勝敗を判定できるように、最初から作られている。勝てないと判定したら中途で投了することもある。すなわち「ゲームに勝つ」という目的は決まっている。そして勝つための着手を選択するように仕組まれている。すなわち「目的は何か」は決まっていて、それに向かって行動している。

 蓄積された2次的内部情報を統合して、目的のある行動をするということは、自らの行動の「意味」を理解したといえるのではなかろうか。チューリングテストに掛ける価値があろう。

スポンサーサイト
この記事へのコメント

管理者にだけ表示を許可する
 
Copyright © 2005 自然と科学. all rights reserved.