Transcript E-Views

SPSS 入門
麻生良文
内容
• データの読み込み
– テキストファイル
– Exelファイル
• 記述統計
• グラフ
• 回帰分析
データの読み込み
• wage1.raw というファイルを読み込む
• wage1.des, wage1.raw をテキスト・エディター(メモ帳
など)で開く
– wage1.des データセットの説明
– wage1.raw データセット本体(本体に変数名は含まれて
いない)
• wage1.raw:wage, educ, … など 24の変数,526個のオブザベー
ションからなるデータであることがわかる
• データセット本体の先頭行に変数名を含めておくと便利(他の統
計ソフトを利用する場合には特に)
wage1.des の内容
wage1.raw の内容
wage1.desの変数名をwage1.rawの先頭行に挿入:この段階では変数名
の途中に改行が入っている
改行を取り除いて変数名を1行に直す。適当な名前をつけて保存する。
変数名とデータの桁をそろえておくと読み込みのときに失敗が少ない。
(SPSSでは,桁を揃えて固定書式でないとうまく読み込めなかった)
テキストデータの読み込み
メニューから「ファイル」「テキストデータの読み込み」を選択
次のような画面が表れるのでガイドにしたがって進む
csvファイルの場合には「自由書式」を選択。
ここでは「固定書式を選択」
ファイルの先頭行には変数名が
含まれていた
ファイルの先頭行は変数名であるため
データの読み込み成功
スプレッドシートのような画面が表れる(データビュー)
変数ビューの画面
educ(教育年数)はスケール変
数に直しておく
Excelファイルの読み込み
wage1.xlsを開く
Excelファイルの読み込みwage1.xlsを開く
先頭行に変数名を記入(wage1.desからコピーしてくるなどして)
名前をつけて保存する
Excelデータの読み込み
• SPSSの起動
• 最初にファイルを開くためのダイアログボックスが表れる。
「別の種類のファイルを開く」を選択して,ファイルを開か
ないで起動する
• ファイルテキストデータの読み込み
–
–
–
–
「ファイルの種類」でExcelの拡張子を選択する
読みたいファイルを選択
後はテキストファイルの読み込みと同様
(右のような画面が表れる)
Excelのワークシート上でデータの範囲をコピーして,
SPSSのデータビューの画面上で貼り付けても,データ
の読み込みは可能
ただし,変数名まではうまくインポートできなかった
変数の記述統計
メニューから
「記述統計」「記述統計」とたどる
記述統計量を求めたい変数を選択
左側のボックスで変数を選択して,
マウスでクリックすると選択できる
記述統計の出力結果
グラフを描く
ヒストグラム
メニューから「グラフ」
「図表ビルダー」
変数の平均値を比較
メニューからグラフレガシーダ
イアログ棒とたどっていく
箱ひげ図(BoxPlot)
メニューから
グラフレガシーダイア
ローグ箱ひげ図単純,
変数ごとの集計定義
を選択して変数を選択
4分位点
中央値(50%点)
複数のデータの大まか
な分布を知りたいとき
に便利
散布図
グラフレガシーダイア
ローグ散布図/ドット
単純な散布図
とたどり,x軸とy軸の変
数を指定
wage, educ,
exper,tenureの撒布
図行列
メニューから
グラフレガシー
ダイアログ散布
図/ドット行列散
布図
とたどって,変数を
指定する
左は,wage,
educ ,exper,
tenureの行列散布
図(散布図行列)
相関係数
メニューから
分析相関2変量
を選択して変数を指定
回帰分析
次のようなモデルを考える
y i     1 x1 , i   2 x 2 , i     k x k , i  u i
i:オブザーベーションを表す添え字 i=1,2,…,n
yi : 被説明変数(従属変数)
x1i, x2i,..., xki : 説明変数(独立変数)
ui: 誤差項
•観測されたデータから,1,2,..,kを推定
• 理論モデルの統計的検証
• 事実の解明(複数の要因でyを説明)
•推定方法 最小二乗法(OLS),最尤法(ML)など
回帰分析
メニューから
分析回帰線型
を選択
従属変数(被説明変数)と
独立変数(説明変数)を
左のボックスから選択
回帰分析の出力結果
推定された係数の値
変数の作成・加工
• 実際の分析では,統計データをさらに加工して分析すること
が通常
– 理論モデルの概念に合うような変数が必要
•
•
•
•
•
所得(Y)と貯蓄(S)のデータから貯蓄率(S/Y)を作成
所得から税負担や社会保険料負担を引いて可処分所得を求める
名目所得を物価指数で割り,実質所得で分析する
恒常所得と変動所得に分解
世帯構成員一人当たりの所得,子供・高齢者の調整
– 消費関数の形状
•
•
•
•
C=a+bY
C =a + b1*Y + b2* Y2 (所得の2次関数)
log(C)=a + b log(Y)
(対数線形)
あらかじめ,どの関数形が正しいかはわからない場合が多い
wage log(wage)を作成
メニューから
「変換」「変数の計算」を
選択
右の画面の「目標変数」に
新変数名を記入: lnwage
数式に計算式を記入:
LN(wage)
「関数」から数学関数を選択
してもよい
注意: SPSSでは自然対数
はLN(), 常用対数はLG10()
論理式を用いた代入もで
きる
例) x= (y>100)
y>100ならx=1,
otherwise x=0
対数変換された賃金
(lnwage)のヒストグラム
wageに比べると左右対
称に近い形になってきた
グラフの利用
• 回帰分析の前に,まずデータのチェック
• 変数の大まかな傾向をみる
– 記述統計
– ヒストグラム,散布図
– データの誤入力
• 回帰分析と散布図の違い
– 回帰分析(重回帰分析):複数の要因
– xとyの散布図:他の変数の影響はコントロールされていな
い
時系列データの分析
Philips.rawを読み込む
16
フィリップス曲線
12
16
4
12
0
8
IN F
8
-4
4
50
55
60
65
70
75
IN F
インフレ率と失業率の
推移
80
85
UNEM
90
95
00
0
-4
2
このグラフはE-Viewsで作成したもの
3
4
5
6
UNEM
7
8
9
10
付属のデータを活用してSPSSに慣れる
• サンプル・データ
– SPSSの実行プログラムの入っているディレクトリー
(フォルダー)
– Ver19では,通常は,
C:\program files\ibm\spss\statistics\19\samples
以下のフォルダーに入っている
• Helpの活用