Transcript cogsci4

本日のメニュー(6/15~)
• (前回資料の続き部分)
• 人間が(あるいは人間も)行う知的処理を
コンピュータ上で実現しようという研究としての
人工知能について考える。
• 人工知能は:
–
–
–
–
–
何を目指すか
何を実現しえたか
どのような原理、方法(論)、技術に基づいているか
どういう困難や問題点があるか
人間の認知研究とどのような関わりを持つか
1
(前回資料への補足)
• 「天使悪魔問題」について
– 以下の URL には前回内容の詳述がある
• http://suseum.jp/gq/question/416 及び 417
• Raymond Smullyan の著書等も参照
• 論理でできること
• 論理に関わる「パラドックス」
–
–
–
–
「ウソつきのパラドックス」
「ヘンペルのカラス」
「ラッセルのパラドックス」
「リシャールのパラドックス」
2
本日のキーワード
• 人工知能(AI)
• ヒューリスティックス
• 記号主義・
記号処理パラダイム
• 計算論的認知観
• 人工知能の研究手法
• 表象主義
• (エージェント)
• Marr の視覚理論
次回予定
• 自然言語理解
ELIZA と SHRDLU
最近の動向
• エキスパートシステム
DENDRAL, MYCIN, AM,
Eurisko, Cyc
• 事例: ゲーム等
Deep Blue, あから2010、
将棋電王戦、WATSON 等
• 人工知能批判
• 強い AI と弱い AI
• フレーム問題
3
人工知能の現状(1)
• 直接的な意味での「人間の知能」の実現には至
っていない。
– ヒューマノイド・ロボット(鉄腕アトム、...)
– HAL 9000 (「2001 年宇宙の旅」)
– “AI” (「攻殻機動隊」)
– 人間社会で暮らす人工知能
– 参考: ロボットスーツ(ガンダム)
そもそもそれが研究目的にはなっていない?
• しかし個別には様々な重要な成果がある。
• 知能観のジレンマ:「人工知能は逃げ水?」
– 実現されてしまった機能は、もはや「知的」、「知能の
実現」とはみなされなくなる傾向がある。
4
人工知能の現状(2)
• そもそも何をもって「人工知能」とするかは、人に
よっても時代によっても様々。
• AI という研究分野自体が「拡散的」
– 研究面においても、当初は AI 研究として開始された
ものが、解決手法の研究が進む、特にアルゴリズム
的な扱いが可能になると AI とはみなされなくなる(AI
から独立する)。
– AI 研究の過程で生まれた様々な理論・言語・ツール・
技術が、spin-off として情報処理技術全般に広範に使
われる。
– ある意味では、この面に AI の最大の成果があるかも
しれない。
5
人工知能の現状(3)
• 人工知能研究が社会的に認知され、アカデミズ
ムとしても確立される反面、「人工知能」としての
自立性・アイデンティティ(あるいはその必要性)
が弱まっている。
• 研究内容についても、大規模コーパスが容易に
利用できるようになったことも背景にして、HMM
(Hidden Markov Model) のような確率モデル的
手法、統計的なパラメタ調整・学習手法によるア
プローチ(SVM 等)が全盛になっている。
6
人工知能の現状(4)
• 人工知能の弱い面
–
–
–
–
常識的な判断・推論 (⇒後述)
自然言語処理: 日常的な会話の実現
社会的文脈、他者との関係・協力・共同作業
感性、感情・情動
• これらは認知科学の他部門との最大の接点であ
り、こういった面での研究が(他に比べて)進展し
ないことは、人工知能さらにはコンピュータ科学
一般と、認知科学一般との関係が希薄になって
きていることにつながっている。
7
人工知能の現状(5)
• 近年の様々なイベントは、人工知能に耳目を集め、
また復権・再認識させるきっかけとなっている。
–
–
–
–
–
ゲーム: チェス、将棋、オセロ、...
WATSON (IBM)
各種ロボットの開発・発展
「感性情報処理」
脳波、筋電等の生体データの直接利用
• 課題
– どこまで「理解」しているか?
– どこまで人間に近づいているか?近づく必要はあるか?
– “Technological Singularity”、 “General AI”
実現するか? どのように? いつごろ?
8
人工知能の要: Heuristics(1)
• Heuristics (発見的手法) ⇔ algorithm
• アルゴリズム
– 問題解決のための機械的に実行可能な処理
手順がある。
– その手順には十分な一般性がある。
問題のパラメタを変えることで、他の場合にも適用できる。
– 処理のための時間・手間を問わなければ、有
限時間内で必ず解決できることが保証されて
いる(「解がない」ことが示される場合も含む)。
9
人工知能の要: Heuristics(2)
• ヒューリスティックス(発見的手法)
– 問題に応じて個別的に「発見」、開発されるような解決手
法。
– いつでもうまくいく保証は(必ずしも)ない。
– アルゴリズムが存在しない場合(知られていない場合)、
存在しても実用的な価値がない場合などに適用される。
– 問題の解決法自体を探し出すことを含んで言う場合もあ
る(メタ解決)。
• 人間の場合: 思いつき、発想、ひらめき等々
10
人工知能の成果(1): ゲーム
• ゲーム(知能ゲーム、特に2人ゼロ和有限確定完全
情報ゲーム)
– チェッカーズ
世界チャンピオンクラス、ゲームそのものがほぼ「解決」
(Chinook: 2007)
– オセロ
世界チャンピオンクラス(Logistello 1997)
– チェス
世界チャンピオンクラス(DeepBlue, 1996-7)
– 将棋
プロレベルに追いついた(!) →あから2010、将棋電王戦
詰将棋は専門家レベル(以上?)
– 囲碁
アマ初段~有段程度 (モンテカルロ法により急進)
11
ゲームの複雑さ
ゲーム
チェッカーズ
オセロ
チェス
将棋
囲碁
盤面数 ゲーム木
1018
1031
1028
1058
1050
10123
1071
10226
10172
10360
Victor Allis (1994). Searching for Solutions in Games and
Artificial Intelligence. Ph.D. Thesis, University of Limburg,
Maastricht, The Netherlands. ISBN 9090074880.
他
12
13
人工知能の成果(2): 数学
• 数式処理(計算機代数)
– Slagle の SAINT(大学初年級の積分)
• この当時では AI 研究の代表例だったが、アルゴ
リズムベースの数式処理研究が進み、AI とは一
線を画する。
• 現在では Macsyma, Reduce, Mathematica, Maple
などのシステムは科学技術領域における不可欠
のツールになっている。 例:Mathematica Integrator
14
人工知能の成果(3): 応用(1)
• カーナビ、道案内システム
– 状態空間探索の典型的問題
– 一般には探索空間が巨大なため、全探索(最
適解)は不可能
– ほとんどの場合、実用的には十分高い水準に
ある。
• 情報検索(Web ページ検索等)
– テキストの検索手法、索引語抽出手法、検索
結果の順位付け、類似語の推定など
15
人工知能の成果(4):視覚・聴覚
• 視覚・聴覚関係
– 文字認識
• 初期の重要な成果は郵便番号読み取り機
• 現在では Windows の IME パッドをはじめ、標準
的なツールになっている。
– 音声認識
– 画像理解・解析
– 音声合成
• 自然な発話・発音
– 音楽認知・分析、作成
16
人工知能の成果(5):自然言語
• 機械翻訳
– 1960 年代後半の ALPAC レポート(それまでの研
究成果への批判的報告)で一時頓挫する。
– 現在最近では Systran ベースの Yahoo! / Babelfish
、Google 翻訳など、実用(に供される)レベルの翻
訳サービスも存在する。が、
現在(2014)では統計的手法を用いたものが主流
• 内容を理解していなくても、かなりの部分は機
械的な言語置換え作業で間に合う。
• (自然言語理解については後述)
17
人工知能の成果(6):応用(2)
• 科学技術関係
– エキスパートシステム DENDRAL による化合物につい
ての新発見など、様々な成果がある。
• Spin-off 技術
– プログラミング言語(Lisp, Prolog, ...)
– プログラミングパラダイム(関数型・論理型プログラミン
グ、オブジェクト指向、エージェントプログラミング、...)
– TSS システム(時分割処理システム)、対話型処理
18
人工知能の成果(7):認知モデル
• 人間の認知について何がわかったか
– ある意味、「最大の成果」は、人間の認知がいかに複
雑な情報処理過程であるかを(再)認識させられたこ
と。
• 認知アーキテクチャ(認知過程の計算的モデル)
– EPAM (Feigenbaum), GPS (Newell & Simon), ACT
(Anderson), SOAR (Newell), ...
– 多くの認知モデルが作成されているが、人間が実際
に行っている処理過程をそのまま反映している保証
はない。 ⇒ 「メタファ」としてのモデル
19
人工知能の成果(8):一般知識
• 常識推論、一般的な質疑応答システム
– Cyc, OpenCyc (1984~)
– Open Mind Common Sense, ConceptNet
– ….
• WATSON
(1999~)
http://www-03.ibm.com/innovation/us/watson/
– 2011年、クイズ番組 Jeopardy! で人間のクイズ
王と対戦し、総合優勝した。
20
人工知能の成果(9): 学習
• 記号的な学習・類推
– 記号的に表された知識構造や概念の帰納的な学
習・獲得。
– 初期の例: Evans の類推プログラム、Winston の
学習研究など。
• パラメタ学習(機械学習)
– 状態を表す数値的なパラメタを操作して学習・最
適化を行う。
– パーセプトロン、ニューラルネットワーク
– 最近では数値的な機械学習手法が基礎技術とし
て広範に応用されている。(データ検索、マイニン
グ、自然言語処理、パターン認識、ゲーム等々)
21
人工知能の成果(10): 適応
• Subsumption Architecture (Brooks, 1986~)
• 虫や小動物の行動などを例に、認知的行動
はトップダウンの、合目的的な行動計画によ
ってではなく、動作単位(モジュール)の適応
的動作によりボトムアップに形成されるという
立場。
• ロボットの行動形成などで成果を上げた。
(参考: 掃除機ロボット)
• 認知一般にまで適用しうるかについては難し
そう。
22
人工知能の成果(11): 日本の例
• カナ漢字変換は日本の人工知能研究の重要な
成果と評価されている(「第5世代レポート」等)。
• コンピュータ将棋
– あから 2010 (特集解説も参照(授業 Web ページ))
– 将棋電王戦(2011-14)
• ロボット関連諸技術(2足歩行ロボット等)
• 歌唱分析・合成
– Vocaloid (初音ミクシリーズ等)
23
研究のアプローチ・手法
• 時代に応じて中心となる(あるいは現実的
な)研究手法が変わっていく
–
–
–
–
–
–
状態と探索
「小さな世界」(「積木の世界」等)
知識と推論(エキスパートシステム等)
現実世界への対応
学習と適応化
大規模データの利用
• 詳細については資料・文献参照
24
人工知能(主流派)
• エキスパートシステムに見られるように、知
識表現と推論手法が研究の主対象。
• 推論については汎用の手法で十分強力で
ありうるという立場。
• さらに、知識は記号的に表現され、人間に
とっても意味や推論過程が理解できること
が重視される。
25
表象主義(Representationalism)
• 人間の持っている知識は、外界の事実を忠実に
反映した「表象(表現)」であり、その表象を操作
することにより思考が行われるという考え方。
• もっと極端には、外界の事物の認識は、表象を
通じてのみ行われる(可能である)という考え方。
• (主流派)人工知能は事実上、この立場に立つ。
• 問題点: 的確な判断を行うために必要な表象が
すべて入手可能か、適切な表現手法は何か、等
々。
参考: フレーム問題 [Frame]
26
記号主義・記号処理パラダイム
• 知識は「記号的」に表現され、知識の操作・推論
は記号処理過程として扱える、という立場。
• 形式的体系(記号論理、チューリングマシンとし
てのコンピュータ)と親和性が高い。
• 一方で、人工知能に対する批判は主として記号
主義的立場に向けられた。
• 1980 年代になると、人工知能内でも記号主義の
問題点が強く意識されるようになる。
27
参考: Marr の視覚理論
• David Marr (1945-1980)
– “Vision: A Computational Investigation into
the Human Representation and Processing of
Visual Information” (Freeman, 1982)
乾・安藤(訳):「ビジョン ー 視覚の計算理論と
脳内表現」(産業図書、1987)
– “Artificial Intelligence: A Personal View”,
Artificial Intelligence, vol.9, no.1 (1977),
pp.37-48
28
Marr の視覚理論(2)
• Levels of Analysis
– Computational level
システムは何をするか(どのような問題を解くか)、な
ぜそのような機能を有するか
– Algorithmic level
その機能をどのように実現するか、どのような知識表
現を用い、どのようなプロセスで処理するか
– Implementational level
システムは物理的にどのように実現されているか
29
Marr の視覚理論(3)
• Stages of Vision
– Primal Sketch
情景から抽出される線・領域等の属性
– 2.5D Sketch
Primal Sketch から構成される、テクスチャや
奥行き感を含む描像。ステレオ視、オプティカ
ルフロー、視差などと関連
– 3D Model
情景を表す3次元モデル
30
記号主義と対立する立場
• 知識は記号で表わされるような「集中表現」
ではなく、分散的に表現される。
• 学習・知識獲得こそが重要である。
• 推論などの処理も推論エンジンなどで集中
的に行われるのでなく、分散処理される。
⇒ エージェント (Agent)
• 1980 年代のニューラルネットワーク研究の
台頭。
31
記号主義と対立する立場(2)
• 知能は孤立して存在するのではなく、外界
・環境との関係(外界からの情報獲得や外
界への働きかけ、他者との関係)の中に存
在している。
–
–
–
–
現象学・解釈学的立場(Heidegger, Gadamar)
「生態学的アプローチ」(J. J. Gibson, 佐々木)
Subsumption Architecture (R. Brooks, 1986)
共同・協調作業とそれへのコンピュータ支援
32
その他の人工知能批判
• H. Dreyfus
– 現象学的見地からの原理的な批判
• J. Searle
– 「強い AI、弱い AI」の概念設定
– 機能主義批判: 「中国語の部屋」 [ChRm]
• J. Weizenbaum
– ELIZA の作者
– 人工知能が社会にもたらす影響を危険視
• T. Winograd & F. Flores
– Winograd は自然言語理解システム SHRDLU の作者
– コンピュータ技術の進むべき方向は AI の実現ではな
い、という観点からの批判
33
本日の課題
• 人工知能における基本概念・用語、研究
の動向を理解する。
• 典型的・代表的な研究例について、原論文
などを含めて内容を調べる。
• パズルなどの問題について、自分で解い
てみてその解き方を観察・考察する。
34
35
36
付録: ゲームプログラムの基本
• 以下は本文で取り上げた将棋プログラム
の基本事項についてまとめたものです。
37
基本事項: 状態空間
• 状態: 問題解決途中の場面・状況。
それを表すデータ表現(知識表現)
– 初期状態: 問題で与えられた最初の状態。
– 目標状態: 問題が「解決された」状態。
一般には1つとは限らない。
• 複数の解がある
• 解がない
• 操作: 1つの状態から別の状態に移動す
るための処理
38
状態空間(2)
• 制約・ルール
状態や操作についての制限。
– 可能な状態、不可能な(違法な)状態
– 可能な操作
• 状態空間: 状態をノード、操作(による移動)をリンクで
表したグラフ構造。
• 問題解決: 状態空間中で、初期状態から出発して目標
状態に至る経路を示すこと。
– 目標状態が複数ある場合:
解を1つ求めればよい、すべての解を求める
– 目標状態が存在しない場合
39
状態空間探索
• 基本 (前方探索 forward search)
初期状態から出発し、可能なリンクをたどって目標
状態に至る経路を見出す。
• 同じ状態を何度も調べないことが重要。
• 後方探索 (backward search)
目標状態から出発して初期状態に至る。
• 発見的探索 (heuristic search)
ムダな探索経路をできるだけ探さないで済ませる。
40
例題:川渡り問題
• 問題
旅人 (T)、狼(W)、ヤギ(G)、キャベツ(C) が旅をし
ていて川に行き着いた。川には渡し舟が1艘あり
、一度に乗れるのは TWGC のうちの2つまでで
、操船は T にしかできない(つまり T は必ず舟に
乗らなければならない)。
全員が川を渡るにはどうすればいいか。
• 制約: 旅人 T がいないとき、
– 狼、ヤギ(W, G )だけだと狼がヤギを食べてしまう。
– ヤギ、キャベツ(G, C) だけだとヤギがキャベツを食べ
てしまう。
– (したがって無事なのは W, C の組み合わせだけ)
41
川渡り問題の状態表現(1)
• 川の左岸・右岸に TWGC のどれがいるか
が状態になる。
• (渡っている途中の状態(船上にあるとき)
は考えなくてよい。)
• 実際には左岸・右岸の一方だけでよい。
• 初期状態:
T
W
G
C
目標状態:
• 最初に TG が渡った後:
T
W
G
C
T
W
G
C
42
川渡り問題の状態表現(2)
• 状態の総数: T, W, G, C が左右どちらか
の岸にあるから、 24 = 16 通り
• 禁止状態: T のいない側に WG, GC の組
み合わせがある。
T
T
T
W
W
W
これが右の6通り
G
G
G
C
• 可能な状態数:
16 – 6 = 10 通り
C
T
T
W
G
C
W
G
C
C
T
W
G
C
43
初期状態
T
W
G
C
T
W
G
C
T
W
G
C
T
W
G
C
T
W
G
C
×
×
×
44
初期状態
T
W
G
C
T
W
T
W
G
C
G
C
45
T
W
G
初期状態
T
W
G
C
C
T
W
W
目標状態
G
C
T
W
G
C
T
T
W
G
G
C
W
G
C
W
G
C
T
T
C
T
W
G
C
T
W
G
C
46
各種の探索
• 現実的な問題では全探索はできない
• 局所評価(評価関数)と「山登り法」
• 最良優先探索
– 複数の「探索前線」の保持
– (Genetic Algorithm)
• 深さ限定探索
• AND/OR 木
• ゲーム木
• 制約伝播法
47
ゲーム木
• 「2人完全情報ゼロ和ゲーム」
チェス、碁、将棋、オセロ、三目並べ、…
– 2人の対戦、有利・不利が相反的関係にある
– ゲームの各状態(盤面)における情報が、両
者にすべて共有されている。
• 全探索は不可能であることが前提
⇒ 評価関数が中心的な役割を果たす。
48
ゲーム木(2)
• 評価関数: max: 先手有利、min: 後手有利
• Mini-max tree
– 一方の有利な状況 = 他方の不利な状況
– 1手ごとに、探索目標が入れ替わる。
• 1手目: 先手にとって最も有利な手を選ぶ
• 2手目: 後手にとって最も有利(先手にとって最も不利)な手
を選ぶ。
• …
• mini-max 探索
• α-β pruning
49
評価関数の利用
• 評価関数
ある状態における探索状況の良し悪し(解までの距離、
得られる解の良し悪し等)を、探索を行わずに、少ないコ
ストで計算する関数。
• 「山登り法」 (Hill Climbing)
– 評価値の良い状態から順に探索していく
– local peak, plateau
• 最良優先探索
レベル間にわたる複数の「探索前線」から評価値
の高いものを優先して探索する。
50
mini-max 探索
max
A
B
D
I
6
E
J
4
G
F
K
8
min
C
L
5
M
7
N
3
max
H
O
1
P
6
Q min
9
評価関数値
51
mini-max 探索
6
6
I
C
4
7
E
J
L
5
M
7
3
min
3
9
G
F
K
8
max
B
8
D
6
A
6
N
3
max
H
O
1
P
6
Q (min)
9
52
αーβ pruning(枝刈り)
• 基本の mini-max 探索は、あるレベルでの
評価関数値がすべて算定されていることが
前提。
• しかし評価関数の計算にはコストがかかる。
• 実際には計算しなくてもいい(探索に影響し
ない)ものもある。
• αーβ pruning は探索範囲を一定の割合で減
らすが、指数オーダーを改善するわけでは
ない。
αーβ pruning
66
D
max
B
C
>=84
E
63
A
610
>=75 39
F
I
J
K
L
61
42
84
×
M
75
N
37
<=39
G
H
O
18
(肩付きの数: 値が決定する順番。
×は計算の必要がない部分)
min
×
P
Q
×
×
max
(min)
ゲーム木(3)
• その他の探索テクニック
– 各種の発見的探索
– 選択的深化 (selective deepening)
• 特定の有望そうな枝だけを重点的に探索する
– 事前探索
• 局面・手順データベース(終盤データベース、「定石」)
• 評価関数の良否
• 盤面が急激に変わる状況
「水平線効果」
55
ゲームプログラムを強くする
• 「仕込み」:あらかじめ調べた結果をデータ
ベース化する。
– 終盤データベース、定石データベース等
– 過去の対戦記録(特に上級者の)
• 機械学習手法の発展とその利用
– 自分自身、あるいは他のソフトと対戦するなど
• 新規な手法・アルゴリズムの開発
– 囲碁におけるモンテカルロ法の適用など
56
コンピュータ将棋について
• 基本は評価関数を用いたゲーム木探索
• しかしコンピュータの高性能化、多重並列
化などにより性能そのものが大幅アップ
– 第3回電王戦5局の GPS 将棋は 700近いマシ
ンによる並列処理
• 定跡的な手順のデータベース化
• またプロ棋士の棋譜等による学習を本格
的に利用
– 譜例が少ないと役に立たない(入玉戦など)
57
コンピュータ将棋(2)
• プロ棋士(女流棋士)との公式対戦
– あから 2010
対清水(女流棋士):コンピュータ勝利
– 将棋電王戦(1) 2012
対米長(元名人:引退棋士):コンピュータ勝利
– 将棋電王戦(2) 2013
5戦の「団体戦」:コンピュータ側の3勝1敗1分
– 将棋電王戦(3) 2014
コンピュータ側の4勝1敗
– 将棋電王戦(4) 2015
コンピュータ側の2勝3敗
58
コンピュータ将棋(3)
(第2回電王戦)
• 観戦記などによれば、人間側の優劣判断とコ
ンピュータ側の優劣判断とは食い違っている。
– プロ棋譜データに基づいているにも関わらず、な
ぜ違いが生じたのか?
– コンピュータは新しい「戦略」を見出している?
• 疲労・思いこみなどの「人間的」要因
• 第4戦の引き分けは、コンピュータ必勝の状況
を入玉戦に持ち込まれたため。
59
コンピュータ将棋(4)
• 第3回電王戦(2014)
– クラスタを使用せず、同一スペックのマシンで対戦
– それでもコンピュータ側が4勝1敗
• 電王戦 FINAL(2015)
– 人間側が3勝2敗と勝ち越し
• 今後はどうなる?
– 現在の形の電王戦は終了、別棋戦が開始予定
– コンピュータがプロレベルに達しているのは間違いない。
– 人間を超えたか?
• 現時点ではまだ断定はできない。
• 人間側の「巻き返し」、新しいタイプの戦略・作戦の登場?
– 人間に学べることは?
60
61
事例: 自然言語理解
• 1960 年代に、機械翻訳プロジェクトが推進される
が、期待された成果が得られなかった(ALPAC 報
告)。
• SHRDLU
– Winograd による自然言語理解システム(1970)
– 対象領域についての知識の重要性を強調し、質問応答
を行う。
• 以後、自然言語理解研究は着実に進められるが、
90 年代以降は事例ベース、確率モデルを用いる
手法などが(実用的目的から)中心となる。
62
特異な事例: ELIZA
• (Weizenbaum 1966) [ELIZA 1, 2]
パターン照合ベースの自然言語「応答」システム
– Weizenbaum: Computer Power & Human Reason
– Winograd & Flores: Understanding Computers and
Cognition
– ⇔Winograd, Terry: Understanding Natural Language
(1972): SHRDLU
• まともな構文解析はしない
• 文中からキーワードを拾ってきて、それに対して
定型的パターンの中から応答を組み立てる。
63
ELIZA (続き)
• 例: 文中に mother があれば「家族の話」と解して
、”tell me more about your family” のような応答文
を組み立てる。
• プログラムと本気で応答を始める人が出てきてしま
った(!?)
• (Rogers 学派精神分析の応用)
– DOCTOR: 精神分析医のような応答を行なうプログラム
– PARRY: 精神分裂症的症状の応答を行なうプログラム
– DOCTOR vs. PARRY
64
最近の自然言語処理(機械翻訳)
• 前述のように、現在では統計的手法に基づく
確率モデル、機械学習を用いる手法が主流と
なっている。
• ある意味では60年代の手法に逆戻り。
しかし...... 違うのは:
– 大規模なコーパス
– マシン性能の飛躍的向上
– モデル化手法・理論の進歩
• 「理解」はしているか? cf. 「中国語の部屋」
65