Transcript eviews
E-Views 入門 内容 • データの読み込み – テキストファイル • CSV型 • 固定長ファイル – Excelファイル • • • • 記述統計 グラフ 回帰分析 仮説検定 データの読み込み • テキストファイル – CSVファイル • データの区切りがカンマ,改行でコードの区切り • 空白またはタブをデータの区切りとする場合もある – 固定長ファイル • 多くのソフトでは,CSVファイルの第1行に説明変数の名 前を含めておくと説明変数も含めて読み込んでくれる – 変数名を別途指定する方法もあり • Excelファイル – ソフトウェアのバージョンによっては,*.xlsx形式(Office 2007以降の形式)が読み込めない場合あり。 – その場合には,*.xls(Office 2003形式)でimportする。 – EXCELからCSVファイルの変換は簡単 データのimportの実際 • wooldridge のデータセットのwage1.rawを使用 – – – – 賃金と学歴,勤続年数等のクロスセクション・データ 24の変数 526のオブザベーション データセット本体に変数名は含まれていない • wage1.des, wage1.raw をテキスト・エディター(メモ帳など)で 開く – wage1.des データセットの説明 – wage1.raw データセット本体(本体に変数名は含まれていない) • 注意 – ファイルマネージャーで拡張子を表示するようにしておく ことファイルマネージャーのメニューから • ツール/フォルダーオプションから設定 – データセット,EviewsワークファイルはUSBメモリーなど書 き込み可能な媒体に保存しておく wage1.des の内容 wage1.raw の内容 この画面は,1行を 折り返さないように 表示している。 秀丸で同様にする には,メニューから 表示/折り返し/最大 とする このファイルは,先頭行に変数名が含まれていない • 以下では次の方法でデータを読み込む 1. 先頭行に変数名を入れたファイルを作り,それから読み込む 2. データ本体だけからなる wage1.raw をそのまま読み込み,ファ イルのimportの際に変数名を指定する 3. excel ファイルからの読み込み 一般的には,データセットをexcelで管理し,先頭行に変数名を含めて おくと便利 変数の説明は別のシートに記入しておく excelファイルが読めないソフトでも,CSVファイルに変換して読むこと ができる 先頭の行に変数名を挿入する wage1.desの変数名をコピーして,wage1.rawの先頭行に挿入:この段階では変数名 の途中に改行が入っている 改行を取り除いて変数名を1行に直す。適当な名前をつけて保存する。 変数名とデータの桁をそろえておくと読み込みのときに失敗が少ない。 次に,E-Viewsを起動する 画面 はver 7.0 メニュー コマンドライン ヘルプ テキストデータの読み込み • Eviewsでは,最初に空のデー タセットを作り,そこにimport するという形で読み込む • メニューから – File New Workfileを選択 • 新しいワークファイルを作る – Workfile structure typeから unstructured/undatedを選択 • Unstructured/undatedクロス セクションデータ • Dated時系列データ • Panel パネルデータ – Data range • Observationsにオブザベーショ ンの数を入れる • 少なすぎる数を入れるとそれ以 上読み込まれないことに注意 オブザベーション数が526の空のデータセットが完成 データの読み込み •メニューからFile Import Read….を選択読み込むファ イルを選択する (右の画面 に) •Name for series or Number if named in file変数の数を記入 • データセットの先頭行に変数 名があるので,変数名の数だけ を記入 •ここでは変数の数は24なので, 24をインプットしてOKを押す ヘッダー行の指定 先頭行に変数名がある場合(1行の場合)には1 先頭行からデータの場合には0 データセットの完成 適当な名前をつけて保存する データセットの先頭行に変数名を含めていない場合 Name for series or Number…の欄に,変数名を挿入する wage1.desを開いて,該当部分をコピーして貼り付けると楽。 変数名を挿入 先頭行から データが始ま るので0とする Excel のファイルからのimport File Import Read-Text-Lotus-Excelから目的のExcelファイルを選択 ここではwage1.xlsを選択(このファイルの先頭行は変数名が含まれていない) 次の画面で,Names for series or Number if named in file の欄に変数名を ペースト(先頭行に変数名を含めている場合には変数の数を入れる) ここで扱うデータはA1のセル からデータが始まる (先頭行にデータがあったり, 第1列にオブザーベーションの 番号が入っているデータもあ る) データセットの中を確認 変数wageを選択 クリックするとスプレッド シートのような画面が現れ る Wageのヒストグラム 変数wageのスプレッドシートの画面のメニューから View Descriptive Statistics & Tests Histogram and Statsを たどる 140 Series: WAGE Sample 1 526 Observations 526 120 100 80 60 40 20 Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis 5.896103 4.650000 24.98000 0.530000 3.693086 2.007325 7.970083 Jarque-Bera Probability 894.6195 0.000000 0 0 2 4 6 8 10 12 14 16 18 20 22 24 ヒストグラムの画面からViewSpreadsheetでスプレッドシートの画面に メニューから他の項目を選択すると,データをいろいろな角度から眺めること ができる 複数データを選択 複数の変数を選択(離れた 変数を選択するためには, Ctrl+マウスで指定) 右クリック Open as group 下のような複数データのス プレッドシート画面が表れる 記述統計 要約統計量(平均,最大,最小等) メニューからView Descriptive Stats Common sample common sample (変数の欠損値がある場合,共通のサンプルでの統計量を算出) individual sample (変数ごとのサンプルで) 複数の変数の散布図を一度に描くこともできる 複数の変数をグループと開いた状態(スプレッドシート画 面)で,menuから view graph を選択すると 散布図行列を指定(他にも いろいろオプションあり) scatter(散布図)を選択 20 散布図行列の 結果 EDUC 15 10 5 0 60 EXPER 40 20 0 他にもいろいろな 50 40 TENURE グラフがあります 30 20 10 0 30 WAGE 20 10 0 0 5 10 EDUC 15 20 0 20 40 EXPER 60 0 10 20 30 TENURE 40 50 0 10 20 WAGE 30 Boxplot 60 outlier 50 Third quartile Mean Median First quartile 40 30 20 10 E W AG E R N U TE EX PE R ED U C 0 相関係数 グループ変数の記述統 計量もmenuのviewか ら簡単に指定できる 回帰分析 次のようなモデルを考える yi 1x1,i 2 x2,i k xk ,i ui i:オブザーベーションを表す添え字 i=1,2,…,n yi : 被説明変数(従属変数) x1i, x2i,..., xki : 説明変数(独立変数) ui: 誤差項 •観測されたデータから,1,2,..,kを推定 • 理論モデルの統計的検証 • 事実の解明(複数の要因でyを説明) •推定方法 最小二乗法(OLS),最尤法(ML)など E-Viewsでの回帰分析 メニューから QuickEstimate Equation を選択する specification にモデルとなる式を 記入 y = a0 + b1* x1 + b2*x2 なら y c x1 x2 と書く(cは定数項を表す) 変数の間はスペースを入れる Method はLSで最小二乗法 推定するオブザーションを指定:1 526 で1番目から526番 目のオブザーべションを指定(1と526の間にスペース) 回帰分析の出力 結果を保存したければNameを 選択して保存 残差の検討 回帰分析の結果の画面で,menuからResidsを 選択残差のグラフ もとに戻るには,View Estimation Output menuで,ViewActual, Fitted, Residual を選 択してもよい。 View から残差が回帰分析の前提を満たしてい るかの統計的検定も行える。 4 3 2 2 1 1 0 0 -1 -1 -2 -3 50 100 150 200 Residual 250 300 Actual 350 400 Fitted 450 500 変数の作成・加工 • 実際の分析では,統計データをさらに加工して分析すること が通常 – 理論モデルの概念に合うような変数が必要 • • • • • 所得(Y)と貯蓄(S)のデータから貯蓄率(S/Y)を作成 所得から税負担や社会保険料負担を引いて可処分所得を求める 名目所得を物価指数で割り,実質所得で分析する 恒常所得と変動所得に分解 世帯構成員一人当たりの所得,子供・高齢者の調整 – 消費関数の形状 • • • • C=a+bY C =a + b1*Y + b2* Y2 (所得の2次関数) log(C)=a + b log(Y) (対数線形) あらかじめ,どの関数形が正しいかはわからない場合が多い E-Viewsでの変数の作成 • wage log(wage)を作成 • メニューからQuick Generate Series を選択 • Enter equation の欄に数式を記入 • 新変数名=数式 • +,-,*, /,^ (加減乗除,べき乗) • log(x),exp(x),sqr(x), abs(x) • x(-1), dx =x – x(-1) • x= (y>100) • y>100ならx=1 • otherwise x=0 • 論理式 and, or グラフの利用 • 回帰分析の前に,まずデータのチェック • 変数の大まかな傾向をみる – 記述統計 – ヒストグラム,散布図 – データの誤入力 • 回帰分析と散布図の違い – 回帰分析(重回帰分析):複数の要因 – xとyの散布図:他の変数の影響はコントロールされていな い 時系列データの分析 Philips.rawを読み込む 16 フィリップス曲線 12 16 4 12 0 8 INF 8 -4 4 50 55 60 65 70 75 INF インフレ率と失業率の 推移 80 85 UNEM 90 95 00 0 -4 2 3 4 5 6 UNEM 7 8 9 10 Helpの利用 User’s Guide, Referenceも Helpメニューから利用できる EViews Help Topics を選ぶと