実証分析の手順 経済データ解析 2011年度 実証分析とは 経済学をはじめ、経営学、心理学などではさまざまな理論が提唱され ている。 また、これらの理論に加え、知識や経験をもとに、ある問題について の仮説を考えることができる。 実証分析とはこれらの理論や仮説が正しいかどうかを、 統計データを用いて検証する方法である。 実証分析の結果は、過去の理論の修正や新しい理論の構築に用い られる。 実証分析には回帰分析がよく用いられる。 さまざまな 理論・仮説 一致? 不一致? 統計データによる 分析結果 一致すれば理論や仮 説が正しいとみなされ、 不一致の場合には再 検討をおこなう。 実証分析の手順 モデルの定式化 <ステップ1> <ステップ2> モデルに含まれる変数と実際のデータの対応 <ステップ3> パラメータの推定と統計量の算出 <ステップ4> モデルの検討 <ステップ5> 不合格 合格 政策・予測への応用 <ステップ3>のパラメータの推定と統計量の算出というのは、Y=a+bXというモ デルを想定した回帰分析において、係数推定値a,bや決定係数などを算出する ことである。Excelの分析ツールで計算できる。 <ステップ1> モデルの定式化 分析目的が数式の形(これをモデルという)であらわされ ていることが実証分析の出発点である。 (例) 「消費が増大する原因には、所得の増大がある」 すなわち、 (所得↑ → 消費↑) を分析目的とするなら、 → Y(消費) = a + b X(所得) ↑ 結果 ↑ 原因 という形のモデルに定式化できる。 「消費が増大する原因には、所得の増大がある」 ⇒ 消費関数といわれる、経済理論の中の1つ これは消費関数という理論が、現実経済に適合しているかどうかを 検証する実証分析である。 このような理論がないか、探せない場合 ⇒ 自分の知識、経験にもとづいて仮説をたて、これをモ デルとして定式化する。 (例)死亡率は都道府県によって異なる。なぜこのような違いが 出るのか、その原因を分析したい。 (‰) 都道府県別死亡率(人口千人あたり) (平成21年) 14.0 12.0 10.0 8.0 6.0 4.0 2.0 0.0 北青岩宮秋山福茨栃群埼千東神新富石福山長岐静愛三滋京大兵奈和鳥島岡広山徳香愛高福佐長熊大宮鹿沖 海森手城田形島城木馬玉葉京奈潟山川井梨野阜岡知重賀都阪庫良歌取根山島口島川媛知岡賀崎本分崎児縄 道 川 山 島 死亡率を決定する理論が見つけられなかった場 合、自分で仮説を立てる。 ここでは、おもな原因として次の3つを考えた。 1 寿命 - 高齢者の多い県は死亡率が高いはずである 2

Download Report

Transcript 実証分析の手順 経済データ解析 2011年度 実証分析とは 経済学をはじめ、経営学、心理学などではさまざまな理論が提唱され ている。 また、これらの理論に加え、知識や経験をもとに、ある問題について の仮説を考えることができる。 実証分析とはこれらの理論や仮説が正しいかどうかを、 統計データを用いて検証する方法である。 実証分析の結果は、過去の理論の修正や新しい理論の構築に用い られる。 実証分析には回帰分析がよく用いられる。 さまざまな 理論・仮説 一致? 不一致? 統計データによる 分析結果 一致すれば理論や仮 説が正しいとみなされ、 不一致の場合には再 検討をおこなう。 実証分析の手順 モデルの定式化 <ステップ1> <ステップ2> モデルに含まれる変数と実際のデータの対応 <ステップ3> パラメータの推定と統計量の算出 <ステップ4> モデルの検討 <ステップ5> 不合格 合格 政策・予測への応用 <ステップ3>のパラメータの推定と統計量の算出というのは、Y=a+bXというモ デルを想定した回帰分析において、係数推定値a,bや決定係数などを算出する ことである。Excelの分析ツールで計算できる。 <ステップ1> モデルの定式化 分析目的が数式の形(これをモデルという)であらわされ ていることが実証分析の出発点である。 (例) 「消費が増大する原因には、所得の増大がある」 すなわち、 (所得↑ → 消費↑) を分析目的とするなら、 → Y(消費) = a + b X(所得) ↑ 結果 ↑ 原因 という形のモデルに定式化できる。 「消費が増大する原因には、所得の増大がある」 ⇒ 消費関数といわれる、経済理論の中の1つ これは消費関数という理論が、現実経済に適合しているかどうかを 検証する実証分析である。 このような理論がないか、探せない場合 ⇒ 自分の知識、経験にもとづいて仮説をたて、これをモ デルとして定式化する。 (例)死亡率は都道府県によって異なる。なぜこのような違いが 出るのか、その原因を分析したい。 (‰) 都道府県別死亡率(人口千人あたり) (平成21年) 14.0 12.0 10.0 8.0 6.0 4.0 2.0 0.0 北青岩宮秋山福茨栃群埼千東神新富石福山長岐静愛三滋京大兵奈和鳥島岡広山徳香愛高福佐長熊大宮鹿沖 海森手城田形島城木馬玉葉京奈潟山川井梨野阜岡知重賀都阪庫良歌取根山島口島川媛知岡賀崎本分崎児縄 道 川 山 島 死亡率を決定する理論が見つけられなかった場 合、自分で仮説を立てる。 ここでは、おもな原因として次の3つを考えた。 1 寿命 - 高齢者の多い県は死亡率が高いはずである 2

実証分析の手順
経済データ解析 2011年度
実証分析とは
経済学をはじめ、経営学、心理学などではさまざまな理論が提唱され
ている。
また、これらの理論に加え、知識や経験をもとに、ある問題について
の仮説を考えることができる。
実証分析とはこれらの理論や仮説が正しいかどうかを、
統計データを用いて検証する方法である。
実証分析の結果は、過去の理論の修正や新しい理論の構築に用い
られる。
実証分析には回帰分析がよく用いられる。
さまざまな
理論・仮説
一致?
不一致?
統計データによる
分析結果
一致すれば理論や仮
説が正しいとみなされ、
不一致の場合には再
検討をおこなう。
実証分析の手順
モデルの定式化
<ステップ1>
<ステップ2>
モデルに含まれる変数と実際のデータの対応
<ステップ3>
パラメータの推定と統計量の算出
<ステップ4>
モデルの検討
<ステップ5>
不合格
合格
政策・予測への応用
<ステップ3>のパラメータの推定と統計量の算出というのは、Y=a+bXというモ
デルを想定した回帰分析において、係数推定値a,bや決定係数などを算出する
ことである。Excelの分析ツールで計算できる。
<ステップ1> モデルの定式化
分析目的が数式の形(これをモデルという)であらわされ
ていることが実証分析の出発点である。
(例) 「消費が増大する原因には、所得の増大がある」 すなわち、
(所得↑ → 消費↑) を分析目的とするなら、
→ Y(消費) = a + b X(所得)
↑
結果
↑
原因
という形のモデルに定式化できる。
「消費が増大する原因には、所得の増大がある」
⇒ 消費関数といわれる、経済理論の中の1つ
これは消費関数という理論が、現実経済に適合しているかどうかを
検証する実証分析である。
このような理論がないか、探せない場合
⇒ 自分の知識、経験にもとづいて仮説をたて、これをモ
デルとして定式化する。
(例)死亡率は都道府県によって異なる。なぜこのような違いが
出るのか、その原因を分析したい。
(‰)
都道府県別死亡率(人口千人あたり) (平成21年)
14.0
12.0
10.0
8.0
6.0
4.0
2.0
0.0
北青岩宮秋山福茨栃群埼千東神新富石福山長岐静愛三滋京大兵奈和鳥島岡広山徳香愛高福佐長熊大宮鹿沖
海森手城田形島城木馬玉葉京奈潟山川井梨野阜岡知重賀都阪庫良歌取根山島口島川媛知岡賀崎本分崎児縄
道
川
山
島
死亡率を決定する理論が見つけられなかった場
合、自分で仮説を立てる。
ここでは、おもな原因として次の3つを考えた。
1 寿命 - 高齢者の多い県は死亡率が高いはずである
2 医療 - 医療機関が充実していれば死亡率は低いはずである
3 衛生 - 衛生状態が悪いと死亡率が高いはずである
この仮説を定式化すると次のモデルになる。
Y(死亡率)=a+bX(寿命)+cZ(医療)+dW(衛生)
考えた3つの原因が3つの説明変数になる
<ステップ2> モデルに含まれる変数と実際のデータとの対応
定式化されたモデルを分析するためには、モデル
に含まれる変数に適当なデータを対応させる必要
がある。
最初に分析目的に応じて、2種類の統計データの
うちどちらを用いるかを決める。
– 時系列データ
データを時間の順序にならべたものであり、過去の変動から現
状を把握し、将来を予測するなどの目的に用いる。
– クロスセクションデータ
ある1時点において何らかの属性に関してならべたものであり、
地域差などの現状を把握するために用いる。
次に各変数に対応する適当なデータを探す
死亡率の大小を表す原因として、「医療の充実」という原
因を考えたが、これを表すデータとしてどのようなものが
あるか?
– 医師数
– 病院数
– 病床数
などが候補になる。
これらの候補の中で、どのデータが最適であるかを考え
てみる。
一方で、入手可能かどうかも重要な点となる。
⇒ 以上のことから「人口10万対医師数」のデータを「医療
の充実」を表すデータとして用いる。
死亡率の分析では、各変数に次のようなデータ
を対応させることにしよう。
Y(死亡率) - 人口千人あたりの死亡率
X(寿命) - 高齢者比率(65歳以上人口/総人口)
Z(医療) - 人口10万対医師数
W(衛生) - し尿処理水洗化率
これらのデータは、代表的な統計資料集である
『日本統計年鑑』から得ることができる。
総務省統計局のホームページには日本統計年
鑑のすべての表がExcel形式で掲載されている。
<ステップ4> モデルの検討
モデルの変数に対応する適切なデータが見つ
かったら、分析ツールで分析をおこなえば良い。
⇒ これが<ステップ3>
分析ツールの結果で、最初に見るのは次の2点
– 係数推定値 - モデル定式化の際に想定した因果
関係と分析結果が一致するかどうか、その符号に着
目する。
– 決定係数および自由度修正済み決定係数 - 決定
係数が1に近ければ分析をおこなう意味があったとい
えるが、0.6以下などの場合には、その他の説明変数
を加える必要があったと考えられる。また、重回帰の
場合には、自由度修正済み決定係数も見る。
※ 係数推定値の符号の検討
さまざまな
理論・仮説
一致?
不一致?
高齢者比率の高い都道
府県ほど、死亡率は高い 一致
はずである。
⇒ X(高齢者比率)の係数推定
値の符号は+となるはず。
人口10万対医師数の多
い都道府県ほど、死亡率 不一致
は低いはずである。
⇒ Z(人口10万対医師数)の係
数推定値の符号は-となるは
ず。
統計データによる
分析結果
分析ツールで分析をおこ
なった結果、 X(高齢者
比率)の係数推定値の符
号は+となった。
分析ツールで分析をおこ
なった結果、 Z(人口10
万対医師数)の係数推定
値の符号は+となった。
分析結果がよくない場合
– 定式化の際の誤り(元になった理論や各自の知識、
経験などが誤り)
– データや分析手法の誤り
という2つの原因が考えられる。
「係数推定値の符号が想定したものと異なる」
「決定係数(または自由度修正済み決定係数)の
値が小さい」場合には、モデルをどのように改良
すべきかを考えてみる。
⇒ 実際の分析をおこなうときのことで、この講義のレポート
としては、そこまで要求しない。