Transcript KES04講義ノート
確率的情報処理(2013nov.7) 市場の記憶は3歩で消える? ー価格変動の予測可能性ー 鳥取大学工学部知能情報工学科 田中美栄子 [email protected] 為替と乱流の類似 • Ghashgaie,et.al、NATURE 381、 1996 • 為替のモーメントが発達した3次元等 方乱流のKolmogorovスケーリング則 と同じ形になる • 情報流/エネルギー流が、カスケード 構造に従って大きなスケールから小さ なスケールへと移動する、と解釈 外国為替と乱流の実データ 1 .4 1 5 "te s t.txt" 価格差 1 .4 1 4 価 格 1 .4 1 3 1 .4 1 2 1 .4 1 1 1 .4 1 10 20 30 40 50 60 70 80 90 100 外国為替 7 "te s t.txt" 速度差 6 .5 速 度 6 5 .5 5 4 .5 10 20 30 40 50 乱流 60 70 80 90 100 価格差、速度差は類似 0 .0 0 5 "s a u s d d e m " 0 .0 0 4 0 .0 0 3 価 格 差 0 .0 0 2 0 .0 0 1 0 -0 .0 0 1 -0 .0 0 2 -0 .0 0 3 -0 .0 0 4 -0 .0 0 5 0 50 100 150 200 250 300 350 外国為替 2 .5 "s a 0 5 2 2 1 " 2 速 度 差 1 .5 1 0 .5 0 -0 .5 -1 -1 .5 -2 0 50 100 150 乱流 200 250 300 350 マルチファン乱流風洞@宮崎大学 筒は15メートル 実験は2001年 ~2004年にかけ て工学部材料物理 工学科小園研究室 を中心に行われて いる。 乱流と外国為替の対応表 乱流 外国為替 速度差 Δv 価格差 Δx 空間の解像度 Δr 時間の解像度 Δt ζn (Δv ) ∝(Δr ) n (Δx )n ∝(Δt )ξ n 0.01 "data.n1" "data.n3" "data.n5" n=2 0.0001 1e-006 n=4 1e-008 1e-010 n=6 1e-012 1e-014 1e-016 1 10 100 1000 10000 100000 本研究で求めた結果 1e+006 文献[1]での結果 Ghashghaieらの論文(右)とほぼ同じ結果を再現 使用データ 外国為替データ データ名 FX1 FX2 TRB 詳細 1992~1993年 ドイツマルク対アメリカドル 1995~2001年 日本円対アメリカドル 乱流データ データ数 約147万 約1000万 2002年3月に宮崎大学の乱流 25万個 風洞実験により得られたデータ 1.確率密度分布 為替、乱流のデータを用い、価格差Δx、速度 差Δvの確率密度分布を求める。 ここで • t:時刻 • r:距離 • x(t):時刻tでの価格 • v(r):距離rでの速度 • Δv=v(r)-v(r+Δr) • Δx=x(t)-x(t+Δt) とする(Δt、Δrというのはデータ上でのtickを 単位とした飛ばし幅である)。 tickの説明 データ 1 1.41185 2 1.412 3 1.4113 4 1.41175 5 1.4107 6 1.41145 7 1.411 8 1.4118 9 1.4108 10 1.4115 11 1.41175 12 1.411 • 為替では取引毎に データが取られており、 一回取引が行われる 度に1tickデータが増 えている。 • Δt=5というのは5tick Δt=5の時 Δx=0.0004 を意味しており、Δxは Δx = x(t)-x(t+Δt) はじめに 為替データ 価格変動はランダムウォーク 極短期データ(Tickデータ) 完全なランダムでない →予測が可能? 金融Tickデータ 時間 1995/01/02 14:5 3 1995/01/02 14:5 3 1995/01/02 14:5 3 1995/01/02 14:5 5 1995/01/02 14:5 5 価格 100.3 100.22 100.2 100.18 Price 日付 100.1 100.23 100 100 200 300 400 500 600 Tick 100.20 100.25 極短期価格変動の記録 為替市場の記憶長 • 超短期価格変動はランダム変動ではない • ならば過去の変動と現在の変動に関連 がある • 関連していたとして、いくつ前までの変動 が関連しているのか? • 条件付確率、自己相関関数、相互情報量 の3つの解析方法でそれぞれ調べる 1.上下運動の条件付き確率 UP ? ? DOWN ? 記憶長1の条件付確率 P(1|A) 1 'P0' 'P1' 0.8 0.6 0.4 0.2 0 0 20 40 60 80 100 120 140 160 180 200 Data Set Num ber • もしも価格変動が完全にランダムならば P(1|0)=P(1)=0.5 , P(1|1)=P(1)=0.5 • しかし P(1|0)=0.71 >> P(1|1)=0.29 • 為替価格変動は1つ前の動きに関連がある 記憶長2の条件付確率 P(1|AB) 1 'P00' 'P01' 'P10' 'P11' 0.8 0.6 0.4 0.2 0 0 20 40 60 80 100 120 140 160 180 Data Set Num ber • P(1|0) =0.71 P(1|00)=0.780 ± 0.05 P(1|10)=0.681 ± 0.03 • 2ステップ前も関連している 200 記憶長3の条件付確率 P(1|ABC) 1 'P000' 'P001' 'P010' 'P011' 'P100' 'P101' 'P110' 'P111' 0.8 0.6 0.4 0.2 0 0 20 40 60 80 100 120 140 160 180 200 Data Set Num ber • 8本の条件付確率がほぼ4つのグループ • 3ステップ前も若干ながら関連している 記憶長4の条件付確率 P(1|ABCD) 1 'P0000' 'P0001' 'P0010' 'P0011' 'P0100' 'P0101' 'P0110' 'P0111' 'P1000' 'P1001' 'P1010' 'P1011' 'P1100' 'P1101' 'P1110' 'P1111' 0.8 0.6 0.4 0.2 0 0 20 40 60 80 100 120 140 160 180 Data Set Num ber • 16本には分かれていない • 記憶長4以上に意味はない • 条件付確率から求めた記憶の深さは3 200 2.相互情報量 I( x, y) = H( x ) - H(x | y) = -∑x P( x ) log2 P( x ) + ∑∑ P ( y ) P ( x | y ) log P ( x | y ) 2 x y •P(y),P(x|y)はyの定義によって計算方法が異な る 1.「m個前まで全て」を条件とする場合 (m=1ならy={0,1}、m=2ならy={00,01,10,11}) 2.「m個前のみ」を条件とする場合 (mに関わらずy={0,1}) 「m個前まで全て」を条件とした時の解析結果 0.148 'result' m=3までは 得られる情 報量が大き い m=4以降は m=3までと 比べてほぼ 無視できるく らいの大きさ 0.146 0.144 0.142 得られる情報量 が大きい 0.14 0.138 0.136 1 1.5 2 2.5 3 3.5 Memory Depth m 4 4.5 5 「m個前のみ」を条件とした時の解析結果 '600m-out' 0.14 m=2までは得 られる情報量 が明らかに存 在 m=3以降はほ ぼ得られる情 報量がない 記憶の深さは 3程度である 0.12 0.1 0.08 0.06 得られる情報量が ほとんど存在しない 0.04 0.02 0 1 2 3 4 5 6 Memory Depth m 7 8 9 10 3.自己相関関数 1 'ujALL-corr' 0 • T=3、4 0.8 0.6 C(T)=0.0 T=4 0.4 0.2 • 為替におけ る記憶の深 さは3程度 0 -0.2 -0.4 -0.6 0 2 4 6 T (tick) 8 10 統計量による結論 • 条件付確率 記憶の深さを4としても、16本に分離しない • 自己相関関数 T=3、4でC(T)が0へと収束 • 相互情報量 記憶の深さを3より大きくしても得られる情報 量は不変 為替における記憶の深さは3である 進化計算による予測 UP ? ? FLAT ? DOWN ? 履歴 (H)に対応した最適戦略 • 履歴の長さ = N H h1 h 2 h 3 h N h i { 0, 1, 2 } 0 – DOWN 1 – FLAT 2 – UP 予測ゲノム (P)が環境に応じて進化 遺伝子長 = 3N P p1 p 2 p 3 p 3N p j { 0, 1, 2 } p1 p2 p3 … p3N 1 p 3N 予測ゲノム(葉)と履歴(木) 例) H 210の場合 0 1 0 1 2 1 0 1 2 2 p1 p2 p3 p4 p5 p6 … 0 2 … 0 1 2 p25 p26 p27 世代交代 A B … I J A A1:A9 OLD 下位90% B B1:B9 … I I1:I9 J J1:J9 NEW シミュレーション エージェント数 予測ゲノム初期値 1世代の予測期間 最大世代数 100 全不変 2,500 ticks 1,000 世代 実験結果 80 予測率 (%) 70 60 50 N=1 N=2 N=3 N=4 N=5 40 30 20 10 0 0 200 400 600 世代 800 1000 40世代ごとの平均予測率 80 予測率 (%) 70 60 50 N=1 N=2 N=3 N=4 N=5 40 30 20 10 0 0 200 400 600 世代 800 1000 200世代までの様子 80 N=1 予測率 (%) 70 60 50 40 N=2 30 N=3 20 N=4 10 0 N=1 N=2 N=3 N=4 N=5 N=5 0 50 100 世代 150 200 700から800世代までの様子 67.8 N=3 67.6 予測率 (%) 67.4 N=2 N=4 67.2 67.0 66.8 66.6 66.4 N=5 66.2 66.0 700 720 N=1 740 760 世代 N=1 N=2 N=3 N=4 N=5 780 800 ここまでの結論 • 予測率は67~ 68% • 履歴長Nが3以上で頭打ち さらに予測率を上げるには ? • もう少し広い判断材料が必要 新たな判断基準:比較平均法 • 現在価格と過去i tickの平均価格との比較 H h1 h 2 h 3 h N h i { 0, 1, 2 } 0 – LOW 1 – FLAT 2 – HIGH 改良の試み:比較平均法 例)h2の場合 HIGH 2 Tick の平均価格 改良の試み:比較平均法 例)h3の場合 3tickの平均価格 実験パラメータ:比較平均法 ‧ ‧ ‧ ‧ エージェント数 100 予測ゲノム初期値 全て不変と予測 1世代の予測期間 2,500 ticks 最大世代数 1,000 世代 40世代ごとの平均予測率:比較平均法 80 予測率 (%) 70 60 50 N=1 N=2 N=3 N=4 N=5 40 30 20 10 0 0 200 400 600 世代 800 1000 700から800世代までの様子:比較平均法 予測率 (%) 68.5 68 67.5 67 N=1 N=2 N=3 66.5 66 700 720 740 N=4 N=5 760 世代 780 800 第2の方法(比較平均法)まとめ • 68~69%の予測率 • 平均価格を用いることで予測率が約1%上昇 • 履歴長Nが4で頭打ち 結論 • 70%弱という確率で予測ができた • 為替Tickデータは偏った癖を持つ • 第1の方法でNを2,3とすれば予測率が上 昇した • 第2の方法ではNが4まで予測率が上昇した • 少なくとも過去3,4tickは価格変動に影響す る