1 - ATR 脳情報研究所

Download Report

Transcript 1 - ATR 脳情報研究所

小脳各部への主要な入力と出力
機能部位
解剖学的
部位
主入力
出力核
出力最終目標
機能
前庭小脳
片葉
前庭器官
前庭核
動眼運動
ニューロン
前庭動眼反射
脊髄小脳
虫部
脊髄
視聴覚
前庭
室頂核
脳幹
運動野
体幹運動制御
脊髄小脳
中間部
脊髄
中位核
大細胞性赤核
運動野
末梢部運動制御
大脳小脳
外側部
大脳
歯状核
小細胞性赤核
運動野
運動前野
運動開始
計画
タイミング
大脳小脳連関
小脳皮質
小脳核
橋核
視床
大脳皮質
橋核
小脳
背側
46野
9野外側部
内側
中位核
歯状核
歯状核背側
大脳皮質
大脳皮質
歯状核外側
視床 VPLo
X
1次運動野
腹側運動前野
歯状核腹側
MD/VL
前頭前野
小脳の高次認知機能への関与
I. 脳活動計測
(1)
(2)
(3)
(4)
(5)
(6)
(7)
運動の想像
名詞からの動詞の連想
ペグボードパズル
複数の形の視覚識別
心的回転
皮膚感覚による物体認識
視覚的注意
SPECT
PET
fMRI
PET
PET
fMRI
fMRI
Ryding et al. (1993)
Raichle et al. (1994)
Kim et al. (1994)
Parsons et al. (1995)
Parsons et al. (1995)
Gao et al. (Bower) (1996)
Allen et al. (1997)
II. 患者
(1) ハノイの塔
(2) 視覚運動認知
(3) 自閉症患者
小脳皮質変性症 Grafman et al. (Hallet M.) (1992)
小脳皮質変性症 Nawrot & Rizzo (1995)
小脳サイズ
Courchesne et al. (1995)
III. 解剖
(1) 46野
(2) IQ
HSVI
小脳サイズ
Middleton & Strick (1994)
Paradiso et al. (1997)
小脳が言葉の連想に
役立っている
• 名詞を見て理解する(大脳皮質の後ろ
の視覚に関わる部分)
• 名詞を聞いて理解する(大脳皮質の横
の聴覚に関わる部分)
• 名詞を見て発音する(大脳皮質の真ん
中上と小脳の中心部分)
• 名詞を見て動詞を連想する(大脳皮質
左の言語野と小脳右の外側部分)
小脳内部モデル理論
• 小脳は入力を出力に変換する神経回路の
集まり
• シナプスの伝達効率が変化して異なる変
換を学べる
• 学習は教師がいて、誤差を教えてくれる
• 脳の外にある、運動のための身体の一部、
道具、他人の脳などのまねをする内部モ
デルを学ぶ
ヒトの知性の内部モデル仮説
• 多数の内部モデルが対になり、多重に、
階層的に配置される
• それが、複雑な行動を計画し、想像し、
実行する仕組みである
• これは、複雑な運動パターンを認知す
るため、つまりコミュニケーションに
も使われる
• 言語の機構もこれに違いない
高次認知機能の小脳内部モデル仮説
・小脳の異なる部位の入出力結合は多様
・小脳の異なる部位の計算の目的は多様
・皮質神経回路は一様
・シナプス可塑性は普遍
・入出力変換の教師有り学習
仮説
(1)系統発生的に新しい部位も古い部位と同様内部モデルを
学習で獲得する
(2)内部モデル学習の対象は運動器官に限らない
例:外界の対象物 (道具など)、脳の他の部位、他者 (の脳)
モザイク:多重の順逆モデル対
(1) 計算論的理由
・世界はモジュール構造
・世界は1個の神経回路でモデル化できるほど単純ではない
・異なる学習エポック間での空間的・時間的干渉を減らす
・運動プリミティブ(認知プリミティブ)
(2) 支持するデータ
・小脳内の多重スポット:fMRI
・脱適応と再適応は適応より速い
・学習したモジュールの混合
(3) 仮説
多重の逆モデルを学習したりスイッチしたりする最良の
方法は多重の順逆モデル対を学習することである
i
責任信号によるモジュールのスイッチング
責任信号:順モデルの予測の相対的良さ
 i t 
exp  xAt  xi t

n
j1

2

exp  xAt  xj t
2

(1)
(1)
逆モデル1
(4)
n
uE t   i t  ui t  (2)
逆モデル2
順モデル2
x2 - +
2
xD
dwi
di
 i t
x t  xi t (3)
dt
dwi A
d i
d i
  i t
u t  ui t (4)
dt
di D
-+
(3)
u2 - +
順モデル学習のゲート
逆モデル学習のゲート
x
順モデル1 1
u1 - +
1
運動指令の線形重ね合わせ
i1
ソフトマックス
uD
逆モデルn
un - +
uA
xA
順モデルn
n
xn - +
(b)スイッチングと制御
対象
責任信号
初期状態
1
1
0.8
0.8
責任信号
(a)モジュールの学習
0.6
0.4
0.2
0
0
1
2
9
8
7
6
5
4
3
2
1
0
×10
1
1
0.8
0.6
0.4
0.2
0
1
2
責任信号
責任信号
1
0.8
0.2
1
2
1
2
3
4
B
軌 道
K
0.4
0.2
0.2
-0.4
-0.6
×104
1
2
3
×104
ステップ
0.4
-0.2
3
0.2
×10
0
2
0.4
4
軌 道
7
6
1
0.6
00
3
ステップ
×104
ステップ
1
0.4
3
0.2
×104
0.6
2
0.4
0.8
00
1
0.6
0
0
3
ステップ
0
ステップ
0.8
0
5
0.2
4
責任信号
責任信号
M
0.4
0
3
ステップ
0.6
0
-0.2
-0.4
-0.6
0
1
2
ステップ
3
0
×104
1
2
ステップ
3
×104
苔状線維
遠心性コピー
大脳皮質
フィードバック
運動指令
苔状線維
目標軌道
マイクロ
ゾーン
マイクロ
ゾーン
順モデル
運動指令
誤差
感覚フィード
バックの予測
登上線維
感覚
フィード
バック
歯状核か
大脳皮質
逆モデル
登上線維
運動指令
下オリーブ核
予測誤差
下オリーブ核
歯状核
尤度モデル
尤度
事前確率
登上線維
苔状線維
文脈情報
責任信号
予測器
マイクロ
ゾーン
事前確率
責任信号推定器
ソフトマックス
小川の三角形
フィード
フォワード
運動指令
上位運動指令
+
N
2
1
予測モデ ル
事前確率
尤度モデ ル
遠心性コピー
Priors
制御モデ ル
目標軌道
n
2
フィードバック
運動指令
+
1
順モデ ル
下位責任信号
運動指令
遠心性コピー
規格化
感覚フィードバック
・
尤度モデ ル
逆モデ ル
目標軌道
フィードバック
運動指令
規格化
ヒトの脳に
道具の内部モデルがある
• ヒトの脳の活動を脳を傷つけずに外から計
測できる(fMRI, PET、脳波、脳磁図など)
• 新しい道具を学ぶ時に小脳のたくさんの部
分が活動する
• 特定の道具を使う記憶(内部モデル)は狭
い場所に別々にある
MRIガント リ ー
スク リ ーン
y
x
プロジェ ク タ
鏡
マウス
パッ ド
追跡課題
p
q
マウス
 x   cos sin   p
 
・ 回転変換    
 y    sin cos    q
y
q
カーサー
・ 積分変換
標的
120°
p
手の空間
x
スク リ ーンの空間




xÝ   p
yÝ  q
トラッキング誤差
トラッキング誤差
テスト条件
ベースライン条件
セッション数
テスト条件
ベースライン条件
(エラーはテスト条件に揃えてある)
t-値
2種類の活動が観察された
1. 学習を誘導する誤差信号
2. 獲得された内部モデル
トラッキング誤差と相関の高い領域
学習後,誤差のレベルを揃えた時に
タスクと相関の高い領域
1.0
0.8
250
0.6
200
0.4
150
0.2
100
0.0
50
0
1
3
5
7
セッション数
9
i
11
rエラーを
揃えた
i
セッション
ベースラインからのMR信号上昇率(%)
ベースラインからのMR信号上昇率(%)
と
の共通領域
1.0
250
0.8
200
0.6
150
0.4
100
0.2
50
0.0
0
1
3
5
7
9
Number
of sessions
セッション数
11
Errorエラーを
equalized
揃えた
セッション
回転変換セッションで活動した領域と,速度制御セッション
で活動した領域とは異なっていた.
統計的に有意性が低いレベル(CC<.14)で調べても,2つの
活動領域は明らかに異なっていた.
回転変換
セッション
CC=0.25 p<0.005
CC=0.14 p<0.10
注:空間フィルター処理は行っていない
速度制御
セッション
小脳内の順モデルの異常:分裂病
(Frith, Blakemore, Wolpert)
• 自分でくすぐってもくすぐったくない
• 小脳の活動で、体性感覚野の活動が抑制される
(Nature Neurosci, 1998; NeuroImage 1999)
• 分裂病の患者は自分でくすぐっても、くすぐった
い
• 幻聴など多くの症状が、順モデルによる運動指
令からの感覚フィードバックの予測の異常と見な
せる(Brain Res Rev, 2000)
制御の妄想の計算モデル
• 運動制御のモデル
• 順モデルの異常
仮 説
ヒトの言語システム(ブローカ野、ウェルニッケ野、新小脳
腹外側部)は運動・行動パターンの特に階層的な計画・実行
認知・編集(コミュニケーション)に携わる、系統発生的に
古いマカクの相同なシステム(運動前野腹側、上側頭溝、大
脳小脳)から連続的に進化したものである。
(1) ミラーニューロンとPET
(Rizzolatti et al., 1992;1996)
(2) バイオロジカルモーションの認知 (STS)
(Perrett et al., 1989;1990)
(3) ヒトとマカクの前頭領野の相同
(Petrides & Pandya, 1994)
(4) ヒトの言語コミュニケーションの神経機構の解明は
マカクのミメシスを含む非言語的コミュニケーション
を研究することで初めて可能となる
小川の三角形:埋め込み構造、自己回帰
そして階層性のためのハードウェア?
下オリーブ核
下オリーブ核
下オリーブ核
い
階層的多重順逆モデル対
・・ろは
責予
責予
予 制
予 制
(1) シンボル接地問題、チャンキングの問題
を力学系の多重モジュールによる予測と
制御の観点から根源的に解決
(2) ある階層での責任信号予測器の相互結合
が形成するネットワークは、それ以下の
階層と物理世界が結合して1つの力学系
を形成する
(3) 1つ上の階層の順モデルはこの力学系の
状態変化を予測し、逆モデルは文脈情報
と目標軌道を下の階層に与えて、この力
学系を制御する
責予
責予
予 制
予 制
責予
責予
責予
責予
責予
責予
予 制
予 制
予 制
予 制
予 制
予 制
2
1
 11 12 
1N
N
A

B


(4) チャンキング(モジュール化)と階層化
は全て双方向の情報の流れの下で自己組
織される
(5) モジュールがシンボルに相当し、責任信
号予測器のダイナミクスがシンタックス
に相当する。
BI
A
1
2
A
3
B
I
4
A
い
5
C
DII
2
1
A
い
5
4
C
II
3
B
コミュニケーションにおける
階層的な多重の順逆モデル対
(1) 運動パターンの認知から内部状態を推定する
受容した運動パターン→自身の運動パターン
→多重モデルが並列的に予測と制御のシミュレーション
x t  u˜ it  x˜ it  argmin xt  x˜ it
逆
順
比較
i
→最も予測の良い対が推定された内部状態
→隠れた高い階層のダイナミクス(シンボル)の推定
関連:共鳴、共感、心の理論、シミュレーション説、音声知覚の
運動指令説
(2) 運動パターンの提示により内部状態を制御する
他者の (1) の内部モデル及びその逆が必要
→共通の内部モデルの構造を仮定
い
・・ろは
責予
責予
予 制
予 制
責予
責予
予 制
予 制
責予
責予
責予
責予
責予
責予
予 制
予 制
予 制
予 制
予 制
予 制
2
1
 11 12 
1N
N
A

BI
A
1
2
A
3
B
I
B

4

A
い
5
C
DII
2
1
A
い
5
4
C
II
3
B
責予
責予
1

予 制
2
予 制
責予
N
責予
 11
責予
 12
責予
 1N
予 制
予 制
予 制
予 制
1
2
A
A
BI
A
3
B
I
い
4
5
D
II
2
1
C
A
い
5
4
C
II
3
B
異なる運動系列のシンボル化
R=0.0009
1-2-1-2-1-3-4-1-3-4-3-4-3-4
2
R=0.001
1-2-1-2-1-3-4-1-3-4-3-4
0
0
-π
-π
2
1
0
π
0
-π
π
1
10
20
30
00
1
10
20
30
1
10
20
30
1
00
20
30
1
10
20
30
1
00
10
sec
20
30
30
00
10
20
30
3
10
20
30
1
00
20
1
00
10
20
30
1
4
4
4
10
2
10
3
3
00
1
2
2
0
1
1
1
1
-π
1
1
00
2
0
1
00
π
-3π
-3π
00
2π
-2π
-2π
00
R=0.002
1-2-1-2-1-2-1-3-4-1-3-4
10
sec
20
30
00
10
sec
20
30
ACROBOTの振り上げ
生徒
DZÇà ÉsÉNÉ`ÉÉǾ å©ÇÈǞǽ Ç…ÇÕÅA
Å gQuickTime ýÅh ã@î\ä gí£Ç²Å A
Å gV ideoÅ hêLí£ÉvÉçÉOÉâÉÄ Ç™ïKóvÇ­Ç•
ÅB
見まね
DZÇà ÉsÉNÉ`ÉÉǾ å©ÇÈǞǽ Ç…ÇÕÅA
Å gQuickTime ýÅh ã@î\ä gí£Ç²Å A
Å gV ideoÅ hêLí£ÉvÉçÉOÉâÉÄ Ç™ïKóvÇ­Ç•
ÅB
先生
DZÇà ÉsÉNÉ`ÉÉǾ å©ÇÈǞǽ Ç…ÇÕÅA
Å gQuickTime ýÅh ã@î\ä gí£Ç²Å A
Å gV ideoÅ hêLí£ÉvÉçÉOÉâÉÄ Ç™ïKóvÇ­Ç•
ÅB
運動パターンの観測から得られた
責任信号予測値による見まね

生徒
1
  12


見まね 1   12

先生

1

6
7π
0
π
2
2
2
0
-π
π
-π
0
-π
-2π
1
3
4
0
1
-π
1
00
2
1
-π
ˆ 1

1
10
20
30
1
ˆ

2
00
1
10
00
1
10
00
10
20
30
ˆ

1
00
1
10
00
10
20
1
3
20
30
ˆ

4
sec
20
1-2-1-2-3-2-4-2-1-3-2-3-4
-1-3-4-3-4-3-4-3-4-3-4-1-3-4
30
00
1
10
00
10
20
sec
20
1-2-3-2-1-3-4-2-1-3-4-3-4
3
1
4
1
00
30
30
10
20
30
10
20
30
10
20
30
20
30
1
00
30
0
1
00
30
2
20
1
-π
0
00
10
sec
1-2-3-2-1-2-1-3-4-3-4-3-4
心の理論 (Theory of Mind)
心の理論の計算モデル
Agent A
:)
(Computational Theory of Mind
)
Agent B
Agent B
Agent A
(1) A, Bがそれぞれ順に世界を制御、
HMPFIMを獲得
(2) 本質的仮定:2つのHMPFIMは異なる
が似ている
HMPFIM
HMPFIM
(3) お互いに相手のモデルを獲得
B
A
mcA
xA mcB
World
(4) 上は不可能(
xB
,mc観測不能)
(5) imitationのアルゴリズムを用いて他
者の
を推定、これを用いて

,mc
theory of mind学習( (2))
(6) Bootstrap or Annealing
~ B   mc
~ A (1 )mc*A
mc
 0
大脳
小脳
大脳基底核
神経回路
双方向+水平結合
一方向
ループ
シナプス可塑性
ヘッブ則・反ヘッブ則
異シナプス可塑性 (LTD, LTP, RP)
ドーパミンに制御されるヘッブ則
学習形態
教師なし学習
教師あり学習
強化学習
人工的神経回路
連想記憶、コグニトロン
パーセプトロン、マダリン
アクター・クリティーク
モジュール性
領野、コラム
解剖・機能部位、マイクロゾーン
腹背側軸のチャネル、局所モジュール
機能 古
すべて
運動の協調・滑らかさ
行動の選択・安定性
機能 新
すべて
すべて
すべて
計算原理
統計モデルの学習
フィルター:近距離ガウス分布
水平結合:遠距離コインシデンス
力学系の予測と制御モデルの学習
価値関数・報酬関数モデルの学習
入出力、内部状態
外界のデータ統計に基づく効率的
内部表現
大脳皮質等で獲得された効率的内部
表現に基づく因果関係モデル
(入出力変換)
効率的内部表現と情動に基づく価値
のモデル化
計算
低次元への圧縮
因果関係
意味のある因果関係
ひとこと
確率
規則
意味
言語
Lexicon
Syntax
Semantics
銅谷 (1999)を改変、加筆
脳計算モデルによる
6感コミュニケーション
(1) 脳の重量
ネアンデルタール大
(2) 数(コミュニケーション)
多数の脳と身体の共同作業
300万年前
ミメシス
共同作業
20-3万年前 言語
高効率
数千年前
記号
時間と空間を超える
数百年前
交通(全身)
リアルタイムではない
160年前
電信
記号・リアルタイム
120年前
電話
音声言語・感情
●コミュニケーション
20年前
インターネット
記号→受動的画像・音声 信号の認知
未来
ミメシス+時間+空間+文化
分身コミュニケーション
脳研究+ロボット
●脳のモデル
●見まね制御
●脳のモデル
●見まね制御
●時間遅れ
●コミュニケーション
信号の認知