Transcript eviews

E-Views 入門
内容
• データの読み込み
– テキストファイル
• CSV型
• 固定長ファイル
– Excelファイル
•
•
•
•
記述統計
グラフ
回帰分析
仮説検定
データの読み込み
• テキストファイル
– CSVファイル
• データの区切りがカンマ,改行でコードの区切り
• 空白またはタブをデータの区切りとする場合もある
– 固定長ファイル
• 多くのソフトでは,CSVファイルの第1行に説明変数の名
前を含めておくと説明変数も含めて読み込んでくれる
– 変数名を別途指定する方法もあり
• Excelファイル
– ソフトウェアのバージョンによっては,*.xlsx形式(Office
2007以降の形式)が読み込めない場合あり。
– その場合には,*.xls(Office 2003形式)でimportする。
– EXCELからCSVファイルの変換は簡単
データのimportの実際
• wooldridge のデータセットのwage1.rawを使用
–
–
–
–
賃金と学歴,勤続年数等のクロスセクション・データ
24の変数
526のオブザベーション
データセット本体に変数名は含まれていない
• wage1.des, wage1.raw をテキスト・エディター(メモ帳など)で
開く
– wage1.des データセットの説明
– wage1.raw データセット本体(本体に変数名は含まれていない)
• 注意
– ファイルマネージャーで拡張子を表示するようにしておく
ことファイルマネージャーのメニューから
• ツール/フォルダーオプションから設定
– データセット,EviewsワークファイルはUSBメモリーなど書
き込み可能な媒体に保存しておく
wage1.des の内容
wage1.raw の内容
この画面は,1行を
折り返さないように
表示している。
秀丸で同様にする
には,メニューから
表示/折り返し/最大
とする
このファイルは,先頭行に変数名が含まれていない
• 以下では次の方法でデータを読み込む
1. 先頭行に変数名を入れたファイルを作り,それから読み込む
2. データ本体だけからなる wage1.raw をそのまま読み込み,ファ
イルのimportの際に変数名を指定する
3. excel ファイルからの読み込み
一般的には,データセットをexcelで管理し,先頭行に変数名を含めて
おくと便利
変数の説明は別のシートに記入しておく
excelファイルが読めないソフトでも,CSVファイルに変換して読むこと
ができる
先頭の行に変数名を挿入する
wage1.desの変数名をコピーして,wage1.rawの先頭行に挿入:この段階では変数名
の途中に改行が入っている
改行を取り除いて変数名を1行に直す。適当な名前をつけて保存する。
変数名とデータの桁をそろえておくと読み込みのときに失敗が少ない。
次に,E-Viewsを起動する 画面 はver 7.0
メニュー
コマンドライン
ヘルプ
テキストデータの読み込み
• Eviewsでは,最初に空のデー
タセットを作り,そこにimport
するという形で読み込む
• メニューから
– File  New Workfileを選択
• 新しいワークファイルを作る
– Workfile structure typeから
unstructured/undatedを選択
• Unstructured/undatedクロス
セクションデータ
• Dated時系列データ
• Panel パネルデータ
– Data range
• Observationsにオブザベーショ
ンの数を入れる
• 少なすぎる数を入れるとそれ以
上読み込まれないことに注意
オブザベーション数が526の空のデータセットが完成
データの読み込み
•メニューからFile  Import 
Read….を選択読み込むファ
イルを選択する (右の画面
に)
•Name for series or Number if
named in file変数の数を記入
• データセットの先頭行に変数
名があるので,変数名の数だけ
を記入
•ここでは変数の数は24なので,
24をインプットしてOKを押す
ヘッダー行の指定
先頭行に変数名がある場合(1行の場合)には1
先頭行からデータの場合には0
データセットの完成
適当な名前をつけて保存する
データセットの先頭行に変数名を含めていない場合
Name for series or Number…の欄に,変数名を挿入する
wage1.desを開いて,該当部分をコピーして貼り付けると楽。
変数名を挿入
先頭行から
データが始ま
るので0とする
Excel のファイルからのimport
File  Import  Read-Text-Lotus-Excelから目的のExcelファイルを選択
ここではwage1.xlsを選択(このファイルの先頭行は変数名が含まれていない)
次の画面で,Names for series or Number if named in file の欄に変数名を
ペースト(先頭行に変数名を含めている場合には変数の数を入れる)
ここで扱うデータはA1のセル
からデータが始まる
(先頭行にデータがあったり,
第1列にオブザーベーションの
番号が入っているデータもあ
る)
データセットの中を確認
変数wageを選択
クリックするとスプレッド
シートのような画面が現れ
る
Wageのヒストグラム
変数wageのスプレッドシートの画面のメニューから
View  Descriptive Statistics & Tests Histogram and Statsを
たどる
140
Series: WAGE
Sample 1 526
Observations 526
120
100
80
60
40
20
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
5.896103
4.650000
24.98000
0.530000
3.693086
2.007325
7.970083
Jarque-Bera
Probability
894.6195
0.000000
0
0
2
4
6
8
10
12
14
16
18
20
22
24
ヒストグラムの画面からViewSpreadsheetでスプレッドシートの画面に
メニューから他の項目を選択すると,データをいろいろな角度から眺めること
ができる
複数データを選択
複数の変数を選択(離れた
変数を選択するためには,
Ctrl+マウスで指定)
右クリック Open as
group
下のような複数データのス
プレッドシート画面が表れる
記述統計
要約統計量(平均,最大,最小等)
メニューからView  Descriptive Stats Common sample
common sample (変数の欠損値がある場合,共通のサンプルでの統計量を算出)
individual sample
(変数ごとのサンプルで)
複数の変数の散布図を一度に描くこともできる
複数の変数をグループと開いた状態(スプレッドシート画
面)で,menuから view graph を選択すると
散布図行列を指定(他にも
いろいろオプションあり)
scatter(散布図)を選択
20
散布図行列の
結果
EDUC
15
10
5
0
60
EXPER
40
20
0
他にもいろいろな
50
40
TENURE
グラフがあります
30
20
10
0
30
WAGE
20
10
0
0
5
10
EDUC
15
20
0
20
40
EXPER
60
0
10
20
30
TENURE
40
50
0
10
20
WAGE
30
Boxplot
60
outlier
50
Third quartile
Mean
Median
First quartile
40
30
20
10
E
W
AG
E
R
N
U
TE
EX
PE
R
ED
U
C
0
相関係数
グループ変数の記述統
計量もmenuのviewか
ら簡単に指定できる
回帰分析
次のようなモデルを考える
yi    1x1,i  2 x2,i   k xk ,i  ui
i:オブザーベーションを表す添え字 i=1,2,…,n
yi : 被説明変数(従属変数)
x1i, x2i,..., xki : 説明変数(独立変数)
ui: 誤差項
•観測されたデータから,1,2,..,kを推定
• 理論モデルの統計的検証
• 事実の解明(複数の要因でyを説明)
•推定方法 最小二乗法(OLS),最尤法(ML)など
E-Viewsでの回帰分析
メニューから
QuickEstimate Equation を選択する
specification にモデルとなる式を
記入
y = a0 + b1* x1 + b2*x2 なら
y c x1 x2
と書く(cは定数項を表す)
変数の間はスペースを入れる
Method はLSで最小二乗法
推定するオブザーションを指定:1 526 で1番目から526番
目のオブザーべションを指定(1と526の間にスペース)
回帰分析の出力
結果を保存したければNameを
選択して保存
残差の検討
回帰分析の結果の画面で,menuからResidsを
選択残差のグラフ
もとに戻るには,View  Estimation Output
menuで,ViewActual, Fitted, Residual を選
択してもよい。
View から残差が回帰分析の前提を満たしてい
るかの統計的検定も行える。
4
3
2
2
1
1
0
0
-1
-1
-2
-3
50
100
150
200
Residual
250
300
Actual
350
400
Fitted
450
500
変数の作成・加工
• 実際の分析では,統計データをさらに加工して分析すること
が通常
– 理論モデルの概念に合うような変数が必要
•
•
•
•
•
所得(Y)と貯蓄(S)のデータから貯蓄率(S/Y)を作成
所得から税負担や社会保険料負担を引いて可処分所得を求める
名目所得を物価指数で割り,実質所得で分析する
恒常所得と変動所得に分解
世帯構成員一人当たりの所得,子供・高齢者の調整
– 消費関数の形状
•
•
•
•
C=a+bY
C =a + b1*Y + b2* Y2 (所得の2次関数)
log(C)=a + b log(Y)
(対数線形)
あらかじめ,どの関数形が正しいかはわからない場合が多い
E-Viewsでの変数の作成
• wage  log(wage)を作成
• メニューからQuick Generate
Series を選択
• Enter equation の欄に数式を記入
• 新変数名=数式
• +,-,*, /,^ (加減乗除,べき乗)
• log(x),exp(x),sqr(x), abs(x)
• x(-1), dx =x – x(-1)
• x= (y>100)
• y>100ならx=1
• otherwise x=0
• 論理式 and, or
グラフの利用
• 回帰分析の前に,まずデータのチェック
• 変数の大まかな傾向をみる
– 記述統計
– ヒストグラム,散布図
– データの誤入力
• 回帰分析と散布図の違い
– 回帰分析(重回帰分析):複数の要因
– xとyの散布図:他の変数の影響はコントロールされていな
い
時系列データの分析
Philips.rawを読み込む
16
フィリップス曲線
12
16
4
12
0
8
INF
8
-4
4
50
55
60
65
70
75
INF
インフレ率と失業率の
推移
80
85
UNEM
90
95
00
0
-4
2
3
4
5
6
UNEM
7
8
9
10
Helpの利用
User’s Guide, Referenceも
Helpメニューから利用できる
EViews Help Topics を選ぶと