講義資料1 - 思考と言語研究室

Download Report

Transcript 講義資料1 - 思考と言語研究室

自然言語処理2007
平成20年1月7日(月)
東京工科大学
コンピュータサイエンス学部 亀田弘之
1
今までやってきたこと
2
今までやってきたこと





自然言語処理とは
自然言語処理(理解)過程の概要
形態素解析(各種手法とツール)
構文解析
言語獲得(文法獲得)
3
自然言語処理とは

自然言語 (Natural Languages)

言語
思考のための道具
 情報・知識を記述・蓄積するための道具
 コミュニケーションのための道具




言語=自然言語+人工言語
自然言語=文字言語+音声言語+視覚言語
処理=理解+生成
処理の主体(機械 or 人間)
本授業は主として「文字言語+理解」を取り扱う4
自然言語処理(理解)過程の概要





形態素解析 (Morpheme analysis)
構文解析 (Syntactic analysis)
意味解析 (Semantic analysis)
談話解析 (Discourse analysis)
状況解析 (Situation analysis)
5
形態素解析の手法








文字種法
最長一致法
文節数最少法
接続表を利用する方法
遷移確率を用いる方法
コスト最小法(Juman)
隠れマルコフモデル法(Chasen)
その他(Kabocha等はSVMを利用)
SVM: Support Vector Machine(機械学習法の1つ)
6
形態素解析のツール





Juman
Chasen(茶筌)
Kobako/J
その他いろいろあります
(Internetなどで調べてみましょう.)
自作のソフトウェア
7
統語解析

言語・文法
言語=文法的に適格な文の集合
文法=<Vn, Vt, s, P>
Vn:非終端記号の集合
Vt:非終端記号の集合
s: 開始記号
P:書き換え規則群
(チョムスキーの文法理論に準拠)
8
統語解析

言語・文法
言語=文法的に適格な文の集合
文法=<Vn, Vt, s, P>
Vn:非終端記号の集合
(構文構造記述用文法用語集)
Vt:終端記号の集合(語彙)
s: 開始記号
P:書き換え規則群
(チョムスキーの文法理論に準拠)
9
Tom broke the cup with the hammer.
10
言語獲得(文法獲得)


未知語獲得(Vtの拡張)
統語規則獲得(VnおよびPの拡張)
11
未知語獲得


定義
分類
12
未知語の定義


人間にとっての未知語:
初見の単語?(定義困難?)
機械にとっての未知語:
システム辞書に登録されていない単語
(未登録語)
13
未知語の分類(概要)



第1種の未知語(異表記未知語)
第2種の未知語(未知複合語)
第3種の未知語(その他)
14
第1種(異表記未知語)
1.
2.
3.
4.
東京大学付属病院  東京大學附属病院
組合せ 組み合せ 組み合わせ 組み合わせ
飛び込む  飛びこむ
コンピュータ  コンピューター
etc.
15
第2種(未知複合語)
1.
2.
3.
4.
5.
6.
数学辞典
見学旅行
個人旅行
月旅行
温泉旅行
積み立て旅行
etc.
これらの単語を辞書で調べてみよう.
このうちの幾つかは通常の辞書には載っていない.
そのような語は他にもあり得る.どうすればいいのだろうか?
16
第3種

その他



のだめ
rlgg
モー娘
17
未知語処理



要素プロセス
処理モード
処理方略
18
未知語処理の要素プロセス
1.
2.
3.
4.
5.
6.
7.
未知語存在の検出
未知語候補の切り出し
内部構造の解析
品詞推定
意味推定
意味整合性の確認
辞書処理(追加・削除・更新 など)
19
未知語処理の処理モード
未知統語
規則
処理モード
未知語
モード1
無
無
モード2
有
無
モード3
無
有
モード4
有
有
20
今日の内容

より深い自然言語処理


他者理解
感情・意図理解(・社会認知?)
心のモデル(・認知機能モデル?)
21
心のモデルと
それに基づく感情・意図推測方法
東京工科大学
亀田弘之・小澤朋之・難波創
2006年10月20日
電子情報通信学会思考と言語研究会
平成19年10月20日発表資料
於 NHK基礎研究所
22
はじめに(1/5)
社会の高度化・複雑化
いじめ
心の問題
引きこもり
「癒し」を切実に求めている
23
はじめに(2/5)
癒し
心理的効果
人を元気づけることや動機づける
生理的効果
ストレスを低減し血圧や脈拍を正常にさせる
現代社会に必要とされている
24
はじめに(3/5)
人との共存を目的として開発されているロボット
PaPeRo
ifbot
人に安らぎや癒しを与えることができる
25
はじめに(4/5)
癒される~
ふれあい
円滑で自然な意思疎通が必要不可欠
26
はじめに(5/5)
コミュニケーションによる癒しの実現
人とふれあう癒し系ロボット PDDIN
PDDINです
よろしく~♪
27
従来の心・感情モデル(1/5)
心のモデル
“人の心”という概念を扱う場合に,まさに
その心自体を記述・表現するためのものである
心のモデルに関するさまざまな提案がされている
28
従来の心・感情モデル(2/5)
図1:心の計算機モデル(岡田直之)
29
従来の心・感情モデル(3/5)
図2:意識の外にある無意識の自律分散計算結果に
ボトムアップに注意を払う受動的な意識を仮定する心のモデル
(前野隆司)
30
従来の心・感情モデル(4/5)
図3:感情の立体モデル(P.Plutchik)
31
The Theory of Mind(心の理論)


Premack & Wooddruff(1978)
Baron-Cohen(1995)
32
心の理論とは
33
The Theory of Mind




ID (Intentionality Detector)
意図検出器
EDD (Eye-Direction Detector)
視線方向検出器
SAM (Shared Attention Mechanism)
共有注意の機構
ToMM (Theory of Mind Mechanism)
心の理論の機構
34
従来の心・感情モデル(5/5)
従来のモデルの問題点
1.処理のためのデータ構造やアルゴリズムが
明確に示してはいない
2.工学的に応用するまでに至っていない
人とふれあう癒し系ロボットPDDINの
研究・開発による心のモデルの考案
35
PDDIN
2002年度から開発されている
研究内容
1.感情モデルの提案
2.感情モデルをもちいた,感情システムの構築
3.対話処理システムの構築
4.ロボット本体の作製
36
PDDIN2005 デモムービー
37
考察



モデルの意義の一つは
「システムの設計図」である。
従来の心・感情のモデルは設計図としては
不十分。
というのも…
38

ソフトウェア工学の分野では、
「大規模化・複雑化した情報システム」
に対して、様々な観点から分析・記述・設計

人間の心(脳)も同様ではないのか?
39
ソフトウェア工学で使用する図(UML)
1.
2.
3.
4.
5.
6.
7.
ユースケース図
クラス図
オブジェクト図
シーケンス図
ステートマシン図
(ステートチャート図)
アクティビティ図
コンポーネント図
8.
9.
10.
11.
12.
コミュニケーション図
(コラボレーション図)
配置図
コンポジット図
タイミング図
相互作用概念図
こんなにたくさんある!
40
論理ビュー
UMLでの各種ビュー
ユースケースビュー
クラス図
オブジェクト図
シーケンス図
ユースケース図
アクティビティ図
ステートマシン図
(ステートチャート)
コミュニケーション図
(コラボレーション図)
コンポーネント図
配置図
コンポーネントビュー
並行性ビュー
41
こんなにたくさんの視点がある!配置ビュー

人間の心(脳)に対しても、UMLを参考にし
てモデルを記述するべきであろう。
(今後の方針)
42
心のモデル

計算論的なモデルが必要
(今回の基本的主張)
43
記憶のモデル(従来のモデルの例)
銘記
保持
想起
感覚
貯蔵庫
短期記憶
長期記憶
44
心のモデル

データ構造+アルゴリズム

知識表現+プログラム
(オブジェクト指向)
45
心のモデルの概要図
46
心のモデルの知識表現
47
心のモデルのプログラム
48
心のモデルのプログラム

理解と生成


生成はシステム設計者依存
理解は相手がある->この解決方法は?
49
心のモデルのプログラム

理解と生成


生成:生成関数Fを利用
理解:生成関数Fの逆関数で推定



逆関数の存在は?
逆関数の同定(作成)方法は?
逆関数の計算は?
解決すべき問題はたくさんある!
どうすればいいのか!?
50
刺激A
反応B
51
同一視
D:心の状態
A:発話+仕草
F: D → A
心のメカニズム
は共通
D:心の状態
A:発話+仕草
F: D → A
図6.心のモデルの共通仮説
52
生成関数Fの定義
刺激X
心の状態Y
α
A
反応
F(X,Y)
F1
α
B
F2
β
A
F3
β
B
F4
γ
A
F5
γ
B
F6
53
まとめ




癒しを実現するためには心のモデルが重要
(他者理解なくしては癒しなし!)
計算論的心のモデルが必要
計算論的とは、
知識表現+プログラム
心のモデルの提案


知識表現+プログラム
他者理解の方法
(IbS: Inference by Synthesis)
54
The Theory of Mind




ID (Intentionality Detector)
意図検出器
EDD (Eye-Direction Detector)
視線方向検出器
SAM (Shared Attention Mechanism)
共有注意の機構
ToMM (Theory of Mind Mechanism)
心の理論の機構
55
今日はこれまで.
56