KES04講義ノート

Download Report

Transcript KES04講義ノート

確率的情報処理(2013nov.7)
市場の記憶は3歩で消える?
ー価格変動の予測可能性ー
鳥取大学工学部知能情報工学科
田中美栄子
[email protected]
為替と乱流の類似
• Ghashgaie,et.al、NATURE 381、
1996
• 為替のモーメントが発達した3次元等
方乱流のKolmogorovスケーリング則
と同じ形になる
• 情報流/エネルギー流が、カスケード
構造に従って大きなスケールから小さ
なスケールへと移動する、と解釈
外国為替と乱流の実データ
1 .4 1 5
"te s t.txt"
価格差
1 .4 1 4
価
格
1 .4 1 3
1 .4 1 2
1 .4 1 1
1 .4 1
10
20
30
40
50
60
70
80
90
100
外国為替
7
"te s t.txt"
速度差
6 .5
速
度
6
5 .5
5
4 .5
10
20
30
40
50
乱流
60
70
80
90
100
価格差、速度差は類似
0 .0 0 5
"s a u s d d e m "
0 .0 0 4
0 .0 0 3
価
格
差
0 .0 0 2
0 .0 0 1
0
-0 .0 0 1
-0 .0 0 2
-0 .0 0 3
-0 .0 0 4
-0 .0 0 5
0
50
100
150
200
250
300
350
外国為替
2 .5
"s a 0 5 2 2 1 "
2
速
度
差
1 .5
1
0 .5
0
-0 .5
-1
-1 .5
-2
0
50
100
150
乱流
200
250
300
350
マルチファン乱流風洞@宮崎大学
筒は15メートル
実験は2001年
~2004年にかけ
て工学部材料物理
工学科小園研究室
を中心に行われて
いる。
乱流と外国為替の対応表
乱流
外国為替
速度差 Δv
価格差 Δx
空間の解像度
Δr
時間の解像度
Δt
ζn
(Δv ) ∝(Δr )
n
(Δx )n ∝(Δt )ξ
n
0.01
"data.n1"
"data.n3"
"data.n5"
n=2
0.0001
1e-006
n=4
1e-008
1e-010
n=6
1e-012
1e-014
1e-016
1
10
100
1000
10000
100000
本研究で求めた結果
1e+006
文献[1]での結果
Ghashghaieらの論文(右)とほぼ同じ結果を再現
使用データ
外国為替データ
データ名
FX1
FX2
TRB
詳細
1992~1993年
ドイツマルク対アメリカドル
1995~2001年
日本円対アメリカドル
乱流データ
データ数
約147万
約1000万
2002年3月に宮崎大学の乱流 25万個
風洞実験により得られたデータ
1.確率密度分布
為替、乱流のデータを用い、価格差Δx、速度
差Δvの確率密度分布を求める。
ここで
• t:時刻
• r:距離
• x(t):時刻tでの価格 • v(r):距離rでの速度
• Δv=v(r)-v(r+Δr)
• Δx=x(t)-x(t+Δt)
とする(Δt、Δrというのはデータ上でのtickを
単位とした飛ばし幅である)。
tickの説明
データ
1 1.41185
2 1.412
3 1.4113
4 1.41175
5 1.4107
6 1.41145
7 1.411
8 1.4118
9 1.4108
10 1.4115
11 1.41175
12 1.411
• 為替では取引毎に
データが取られており、
一回取引が行われる
度に1tickデータが増
えている。
• Δt=5というのは5tick
Δt=5の時
Δx=0.0004 を意味しており、Δxは
Δx = x(t)-x(t+Δt)
はじめに
為替データ
価格変動はランダムウォーク
極短期データ(Tickデータ)
完全なランダムでない
→予測が可能?
金融Tickデータ
時間
1995/01/02 14:5
3
1995/01/02 14:5
3
1995/01/02 14:5
3
1995/01/02 14:5
5
1995/01/02 14:5
5
価格
100.3
100.22
100.2
100.18
Price
日付
100.1
100.23
100
100
200
300
400
500
600
Tick
100.20
100.25
極短期価格変動の記録
為替市場の記憶長
• 超短期価格変動はランダム変動ではない
• ならば過去の変動と現在の変動に関連
がある
• 関連していたとして、いくつ前までの変動
が関連しているのか?
• 条件付確率、自己相関関数、相互情報量
の3つの解析方法でそれぞれ調べる
1.上下運動の条件付き確率
UP ?
?
DOWN ?
記憶長1の条件付確率
P(1|A)
1
'P0'
'P1'
0.8
0.6
0.4
0.2
0
0
20
40
60
80
100
120
140
160
180
200
Data Set Num ber
• もしも価格変動が完全にランダムならば
P(1|0)=P(1)=0.5
,
P(1|1)=P(1)=0.5
• しかし P(1|0)=0.71 >> P(1|1)=0.29
• 為替価格変動は1つ前の動きに関連がある
記憶長2の条件付確率
P(1|AB)
1
'P00'
'P01'
'P10'
'P11'
0.8
0.6
0.4
0.2
0
0
20
40
60
80
100
120
140
160
180
Data Set Num ber
• P(1|0) =0.71
P(1|00)=0.780 ± 0.05
P(1|10)=0.681 ± 0.03
• 2ステップ前も関連している
200
記憶長3の条件付確率
P(1|ABC)
1
'P000'
'P001'
'P010'
'P011'
'P100'
'P101'
'P110'
'P111'
0.8
0.6
0.4
0.2
0
0
20
40
60
80
100
120
140
160
180
200
Data Set Num ber
• 8本の条件付確率がほぼ4つのグループ
• 3ステップ前も若干ながら関連している
記憶長4の条件付確率
P(1|ABCD)
1
'P0000'
'P0001'
'P0010'
'P0011'
'P0100'
'P0101'
'P0110'
'P0111'
'P1000'
'P1001'
'P1010'
'P1011'
'P1100'
'P1101'
'P1110'
'P1111'
0.8
0.6
0.4
0.2
0
0
20
40
60
80
100
120
140
160
180
Data Set Num ber
• 16本には分かれていない
• 記憶長4以上に意味はない
• 条件付確率から求めた記憶の深さは3
200
2.相互情報量
I( x, y) = H( x ) - H(x | y)
= -∑x P( x ) log2 P( x ) + ∑∑
P
(
y
)
P
(
x
|
y
)
log
P
(
x
|
y
)
2
x
y
•P(y),P(x|y)はyの定義によって計算方法が異な
る
1.「m個前まで全て」を条件とする場合
(m=1ならy={0,1}、m=2ならy={00,01,10,11})
2.「m個前のみ」を条件とする場合
(mに関わらずy={0,1})
「m個前まで全て」を条件とした時の解析結果
0.148
'result'

m=3までは
得られる情
報量が大き
い

m=4以降は
m=3までと
比べてほぼ
無視できるく
らいの大きさ
0.146
0.144
0.142
得られる情報量
が大きい
0.14
0.138
0.136
1
1.5
2
2.5
3
3.5
Memory Depth m
4
4.5
5
「m個前のみ」を条件とした時の解析結果
'600m-out'
0.14

m=2までは得
られる情報量
が明らかに存
在

m=3以降はほ
ぼ得られる情
報量がない

記憶の深さは
3程度である
0.12
0.1
0.08
0.06
得られる情報量が
ほとんど存在しない
0.04
0.02
0
1
2
3
4
5
6
Memory Depth m
7
8
9
10
3.自己相関関数
1
'ujALL-corr'
0
• T=3、4
0.8
0.6
C(T)=0.0
T=4
0.4
0.2
• 為替におけ
る記憶の深
さは3程度
0
-0.2
-0.4
-0.6
0
2
4
6
T (tick)
8
10
統計量による結論
• 条件付確率
記憶の深さを4としても、16本に分離しない
• 自己相関関数
T=3、4でC(T)が0へと収束
• 相互情報量
記憶の深さを3より大きくしても得られる情報
量は不変
為替における記憶の深さは3である
進化計算による予測
UP ?
?
FLAT ?
DOWN ?
履歴 (H)に対応した最適戦略
• 履歴の長さ = N
H  h1 h 2 h 3  h N
h i { 0, 1, 2 }
0 – DOWN
1 – FLAT
2 – UP
予測ゲノム (P)が環境に応じて進化
遺伝子長 = 3N
P  p1 p 2 p 3  p 3N
p j { 0, 1, 2 }
p1 p2 p3
…
p3N 1 p
3N
予測ゲノム(葉)と履歴(木)
例) H  210の場合
0 1
0 1
2
1
0 1
2
2
p1 p2 p3 p4 p5 p6
…
0
2
…
0
1
2
p25 p26 p27
世代交代
A B … I J
A
A1:A9
OLD
下位90%
B
B1:B9
…
I
I1:I9
J
J1:J9
NEW
シミュレーション
エージェント数
予測ゲノム初期値
1世代の予測期間
最大世代数
100
全不変
2,500 ticks
1,000 世代
実験結果
80
予測率 (%)
70
60
50
N=1
N=2
N=3
N=4
N=5
40
30
20
10
0
0
200
400
600
世代
800
1000
40世代ごとの平均予測率
80
予測率 (%)
70
60
50
N=1
N=2
N=3
N=4
N=5
40
30
20
10
0
0
200
400
600
世代
800
1000
200世代までの様子
80
N=1
予測率 (%)
70
60
50
40
N=2
30
N=3
20
N=4
10
0
N=1
N=2
N=3
N=4
N=5
N=5
0
50
100
世代
150
200
700から800世代までの様子
67.8
N=3
67.6
予測率 (%)
67.4
N=2
N=4
67.2
67.0
66.8
66.6
66.4
N=5
66.2
66.0
700
720
N=1
740
760
世代
N=1
N=2
N=3
N=4
N=5
780
800
ここまでの結論
• 予測率は67~ 68%
• 履歴長Nが3以上で頭打ち
さらに予測率を上げるには ?
• もう少し広い判断材料が必要
新たな判断基準:比較平均法
• 現在価格と過去i tickの平均価格との比較
H  h1 h 2 h 3  h N
h i { 0, 1, 2 }
0 – LOW
1 – FLAT
2 – HIGH
改良の試み:比較平均法
例)h2の場合
HIGH
2 Tick の平均価格
改良の試み:比較平均法
例)h3の場合
3tickの平均価格
実験パラメータ:比較平均法
‧
‧
‧
‧
エージェント数
100
予測ゲノム初期値 全て不変と予測
1世代の予測期間 2,500 ticks
最大世代数
1,000 世代
40世代ごとの平均予測率:比較平均法
80
予測率 (%)
70
60
50
N=1
N=2
N=3
N=4
N=5
40
30
20
10
0
0
200
400
600
世代
800
1000
700から800世代までの様子:比較平均法
予測率 (%)
68.5
68
67.5
67
N=1
N=2
N=3
66.5
66
700
720
740
N=4
N=5
760
世代
780
800
第2の方法(比較平均法)まとめ
• 68~69%の予測率
• 平均価格を用いることで予測率が約1%上昇
• 履歴長Nが4で頭打ち
結論
• 70%弱という確率で予測ができた
• 為替Tickデータは偏った癖を持つ
• 第1の方法でNを2,3とすれば予測率が上
昇した
• 第2の方法ではNが4まで予測率が上昇した
• 少なくとも過去3,4tickは価格変動に影響す
る