2.1節の参禅データと学習目標

Download Report

Transcript 2.1節の参禅データと学習目標

第1章 基礎集計
 この章では、3、4年生は2年次の心理
統計
学の復習を兼ねて、2年生は心理統計学
と
並行して、1変量もしくは2変量データ
の基礎
集計の方法を学ぶ。定性的・定量的変数
の
場合の度数分布・2変量間の関連性につ
い
第1章の内容
1.1節 カテゴリー変数の度数分布と変数間の
関連性の有無の検定
1.1.1節 カテゴリー変数の度数分布の出力
結果
1.1.2節 カテゴリー変数間の分割表の検定
結果
1.2節 定量変数の度数分布と2つの定量的変
数間の相関係数とその検定
1.2.1節 定量変数の分布特性
1.2.2節 定量変数間の相関関係
1.2.3節 はずれ値の相関係数への影響
1.1節 カテゴリー変数の度数分布と
変数間の関連性の有無の検定
 参禅データ収集の研究目標や
100
作業仮説を知るー参禅行動の
実態を探る
50
 分析方法を学ぶー度数分布
とクロス表による参禅行動の
実態の解明
 SAS の出力結果と基本的な統
計用語とその見方を知るー度
数分布、クロス表によるカ
イ二乗検定、期待度数
0
1 2 3 4
月 月 月 月
厳しす 適当
ぎ
東京
名古屋
大阪
もっと
厳しく
男
27
275
75
女
3
124
10
参禅データとは?
 まず、千野のホームページ
の 講義ノート「データ解
析/基礎と応用 I」の中の
1.1 節を開け、参禅デー
タの具体例を見てみよう。
 つぎのスライドは、同上
WEB頁 1.1 節の内容を示
す。これを読んで、参禅
データの概要を知ろう。
WEBテキスト上の参禅データの内容(1)
 WEB テキストの Table 1.1 のデータは、A
大学
514 名の 新入生に対するある年度の永平
寺参
禅調査結果の一部を示している。データは各
人
ごと、通し番号に続く、参禅への動機の 強
さ、参
禅の有意義さ、座禅時間の長さ、座禅指導の
仕
WEBテキスト上の参禅データの内容(2)
現代の生活に座禅は必要であり今後も座禅の機
会
を持ちたいか、 食事はどうであったか、睡眠は
どうで
あったか、法話についての意義の評価、 永平寺
の雰
囲気はよかったか、の14項目と、それぞれ5
段階評
定尺度から成る 参禅の前後における座禅に対す
る
WEBテキスト上の参禅データの内容(3)
 つまり、この調査では、最初の14項目は定
性的(カ
テゴリー)変数であり名義尺度(中には評定
尺度で
間隔尺度と見做せるものもあるが)であり、
後半の
20項目は一応定量的変数で間隔尺度と見做
すこ
とができる。
そこで、まず前半の14項目については、
各範ちゅ
データのコンピュータへの入力
 データはどのような
形で
コンピュータに入
力?
 データのコード化は
どの
ようにすればよい?
 データ分析のための
SAS プログラムと
は?
1.1.1節 カテゴリー変数の
度数分布の出力結果
 度数分布の出力結果はどんな形?
http://www.agu.ac.jp/~chino/m
ultivar/chapter1/sec1-1-1.html
1.1.2節 カテゴリー変数間の
分割表の検定結果
 クロス表(あるいは分割表)って、
どんなもの?
http://www.agu.ac.jp/~chino/
multivar/chapter1/sec1-12.html
分割表の検定にかかわる基礎概念
 分割表(クロス表)ってどんなもの?
 定性2変数間の関連の有無は統計ソフトの出
力結
果の何を見ればわかるの?
 カイ二乗検定の p 値
 分割表からは、2変数間の関連の有無以外に
何が
わかるの?
 カイ二乗検定のための統計量はどんな形?
 実度数と期待度数、セルカイ二乗って何?
分割表(クロス表)とは・・・
 被験者の各々を2つの
属
性(定性的変数)で分
類し
て表にしたものだよ。
 右の表の例では、行属
座 もっ
性
男
性
は性、列属性は座禅指
導
の評価。
女
と
きび
しく
適
当
きび
しす
ぎ
定性2変数間の関連は p 値で
ピアソンのカイ二乗統計量か尤
度比
カイ二乗統計量とその p 値を見ると、
定性
2変数間の関連性の有無が判定できる。

p  0.05 以下ならば、統計的 に有意
分割表で関連性の有無以外に
わかることは何?
 関連性が統計的に有意な場合、どのセルに関連
性
が顕著に現れており、それはどのような特徴を
持って
いるかがわかる。
 そのためには、各セルの実度数、期待度数、及
びセ
ルカイ二乗値の出力をさせて、それらを検討す
ること
ができる。
カイ二乗統計量とその意味
(WEBテキスト 1.1.2節の (1.1)~(1.3)式)
r
r
c
c
 2    ( fij  gij ) 2 / gij  hij ,
i 1 j 1
i 1 j 1
ここで、
gij  ( f i f  j ) / N , hij  ( f ij  gij ) 2 / gij ,
c
r
j 1
i 1
f i   f ij , f  j   f i j
実度数、期待度数、セルカイ二乗
 分割表の実度数
 分割表の各セルの観測サンプル数
 分割表の期待度数
 当該行及び列の周辺度数の積をサンプル総数
N で割ったもの。前頁の gij がそれにあたる。
 分割表のセルカイ二乗
 セルごとのカイ二乗値で、前頁のhij がそれに
あたる。
SAS の出力における実度数、期待度数、セルカ
イ二乗、周辺度数
きびし過 適当
ぎ
男
女
計
27
22.0
1.13
3
8.00
3.12
30
275
292.6
1.06
124
106.4
2.93
399
もっとき
びしく
75
62.3
2.57
10
22.66
7.07
85
計
周辺度数
377
137
514
カイ二乗検定用データの具体例(1)
 同検定では、期待度数
と
いう重要な概念がある
(WEBテキスト、1.1.
2節)。
男
 例えば、右表の実度数
女
137
 30
3
に対する期待度数は、
 7.996,
計
514
と計算される。
もっと
厳しく
適当
厳しす
ぎた
計
27
3
30
275
124
399
75
10
85
377
137
514
カイ二乗検定用データの具体例(2)
 すなわち、女子で
「もっと
厳しく」 してほしいと
思った
学生の実際の度数(実
度
数)3名に対して、
(2つの
属性間に関連がみられ
な
いと仮定した時)この
セル
に期待される度数(期
男
女
計
もっと
厳しく
適当
厳しす
ぎた
計
27
3
30
275
124
399
75
10
85
377
137
514
カイ二乗検定用データの具体例(3)
同様に、右表の実度数
75 に対する期待度数は、
377 85
 62.344,
514
と計算される。
男
女
計
もっと
厳しく
適当
厳しす
ぎた
計
27
3
30
275
124
399
75
10
85
377
137
514
千野 WEB 頁の SAS 出力を見よう
まず、2つの属性間の
関
連性の有無をカイ二乗検
定
の p-値で見よう。
 つぎに、分割表の各セル
の
セルカイ二乗、実度数、
期
待度数を見て、関連性の
性と座禅指導の評価の間には、
統計的に有意な関連性はあるのか(1)
Statistic
Chi-Square
Likelihood Ratio Chi-square
DF
Value
Prob
2
2
17.889
20.400
0.000
0.000
性と座禅指導の評価の間には、
統計的に有意な関連性はあるのか(2)
 Statistic の項の Chi-square の項が、ピアソ
ン
のカイ二乗検定結果、Likelihood …の項が、
尤度比カイ二乗検定結果である。
 通常は、ピアソンのカイ二乗検定の p 値
を見
る。この例からは、両変数間には1パー
セント
以上の高い水準で有意な関連性があるこ
両変数間の関連が統計的に有意なので、
つぎに詳細を見てみよう
 両変数間の関連にどんな
特徴が見られるかを検討
するために、クロス表に
実
度数だけでなく、期待度
数、
及びセルカイ二乗値を出
力
させて、セルのどこにそ
のよ
実度数、期待度数、セルカイ二乗による
関連性の特徴の検討
きびし過 適当
ぎ
男
女
計
22
22.0
1.13
3
8.00
3.12
30
275
292.6
1.06
124
106.4
2.93
399
もっとき
びしく
75
62.3
2.57
10
22.66
7.07
85
計
377
137
514
両変数の関連性の特徴をまとめると
どのようなことが言えるか?
 セルカイ二乗値が最大の(2,3)セルを見ると、
実度数
10に対して期待度数がおよそ23なので、女子
でもっとき
びしくしてほしいと思った者は少ないことがわか
る
 つぎにセルカイ二乗値が大きい(2,1)セルを
見ると、実
度数3に対して期待度数が8なので、女子できび
し過ぎ
WEBテキスト の 2.1.2 節を読み、
これまでの知識を再度整理しよう(1)
 2つ前のスライドの結果と、つぎの出力結果から、
STATISTICS FOR TABLE OF CAT2 BY CAT6
Statistic
DF
Value
Prob
----------------------------------------------------------------Chi-Square
2
17.889
0.000
Likelihood Ratio Chi-Square 2
20.400 0.000
………………………………………………………………..
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(1)
 上の出力結果のカイ二乗検定の統計量の値
を
みると、17.889 で、危険率に対応する Prob
の
値は、0.01 より小さい。
したがって、この結果は、分割表の行カ
テゴリ
ーである性別と列カテゴリーである座禅指
導の
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(2)
 一般的には、分割表のカイ二乗検定は、つ
ぎの統計量による。ここで、分割表の行、
列属性をそれぞれ A 、B 、行数、列数をそ
れぞれ r 、s とし、総度数を N とする。こ
の時、帰無仮説 H 0 :2つの属性 A 、B は
互いに独立(関連無し)、のもとでは、各
セルの期待度数が5より大の時:
r
s
  ( fij  gij ) / gij , (1.1)
2
2
i 1 j 1
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(3)
は、近似的に自由度 ν =(r-1)(s-1) なる χ2 - 分
布に従う。ここで、
gij  fi f j / N, (1.2)
(1.2) 式の gij は、2つの属性 A 、B が互いに
独立(関連無し)のもとで (i ,j ) セルに期待され
る度数であり、 期待度数 (expected frequency)
と呼ばれている。
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(4)
 また、(1.1) 式から明らかなように、こ
の式の
左辺の χ2 は、各セルについての次式で
与
えられる量 hij の和、として定義されて
いる
ので、hij は、セルカイ2乗と呼ばれ、
全体的
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(5)
セルカイ2乗:
期待度数
hij  ( fij  gij ) / gij,
2
実度数
期待度数
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(6)
 したがって、帰無仮説が棄却された場
合
には、上の期待度数とこの量 hij を同
時に
出力できていれば、2つの属性 A 、B
のど
こにとりわけ大きな独立性からのず
れがど
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(7)
 上の出力例で具体的に見てみると、
後
者の値の相対的に大きいセルは、
(2,3)
セル、(2,1) セル、(2,2) セル、及び
(1,3)
セルであることがわかる。
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(8)
 これらの値、及びそれに対応するセ
ルの
期待度数の実度数からの乖離の方向
か
ら、例えば女子は相対的には座禅指
導
をもっと厳しくして欲しいと思 った
ものが
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(9)
 最後に、分割表の検定では一般にサ
ン
プル数が小さいときにはカイ2乗
分布が
歪むことが知られている (Yates,
1934)。
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(10)
 Yates によれば、分割表のカイ2乗検
定で
カイ2乗が歪む原因は、もともと統
計学的
分布としてのカイ2乗分布そのもの
は連
続分布であるのに対して、分割表の
検
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(11)
 また、歪みの方向は、一般にリベラル
な方
向であることも知られている。その
原因の
1つは、このような場合の正確な検
定とし
て知られているあとで述べる Fisher
の直
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(12)
一般の分割表では必ずしも周辺度数
は
固定されておらず、そのような場合
、検定
は相対的にリベラルとなることがわ
かって
いるからである。
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(13)
ここで、サンプル数の小ささの目安は、各
セルの
(期待)度数のいずれかが5以下かどうか
、であ
る。本邦のテキストの中には、「各セルの
度数が
5 以下のものがある」という表現を使って
いるもの
も2、3見られるのに対して、欧米のテキ
ストでは
WEBテキスト の 1.1.2 節を読み、
これまでの知識を再度整理しよう(14)
また、竹内啓編の統計学辞典では、「標本数が
少な
いたとえばセルの期待度数が5未満の時」という
表現
をしているものもある。 (1.1) 式の分布は、2つの
属性
間に関連がない、という帰無仮説のもとでの分布
であ
るから、そのような場合、平均的には実度数は期
待度
セル内の期待度数が少ない場合の
対処法ー(2×2分割表の場合)(1)
 イエーツの修正法
この方法では、セル内のいずれか1つ
でも期
待度数が5以内のものが存在するときは、
例え
ば2×2分割表の場合には、WEB テキス
トの
1.1.2節の(1.1)式のカイ二乗値はつ
ぎのよう
セル内の期待度数が少ない場合の
対処法-(2×2分割表の場合)(2)
N (ad  bc)
 
(a  c)(b  d )(a  b)(c  d )
2
2
イエーツの修正の仕方
2×2分割表の場合、テキストの p.6 にあるように、
N
N
1. ad  bc  の時、 ad  bc  とする
2
2
N
2. ad  bc  の時、  2  0 とする
2
N
N
3. ad  bc   の時、 ad  bc  とする
2
2
セル内の期待度数が少ない場合の
対処法-(一般の分割表の場合)(3)
 一般の r×c 分割表の場合の、(連続
性
の)補正方法としては、SAS
Institute
(1990, p.339) は、 Fienberg (1977,
p.21)
のつぎの公式をあげている:
セル内の期待度数が少ない場合の
対処法-(一般の分割表の場合)(4)
r
c
 c  [max(0, fij  gij  0.5)] / gij
2
2
i 1 j 1
ここで、上のカイ二乗統計量の自由度は、補正前
と同一である。
セル内の期待度数が少ない場合の
対処法-(5)
 イエーツの修正に代わる、より正確な検定法に
フィッシャーの直接確率法(Fisher‘s exact
test) が
ある。
 この方法では、周辺度数が固定された条件下で、
得られたデータ以上に偏る度数が得られる確率
を
すべて代数的に計算する方法である。
1.2節 定量変数の度数分布と
2つの変数間の相関係数とその検定

まず、千野 WEB テキスト
の
URL
http://www.agu.ac.jp/~chino/
multivar/chapter1/sec1-2.html
にある藤井(1983)が収
集した5
0名の被験者の筆跡と性格に
関
藤井(1983)の筆跡と性格データ
 このデータ は、藤井 (1983) が収集した50
名の
被験者の筆跡と性格に関するものである。
この
データは、第2章でも再度取り上げるが、
ここで
は簡単に紹介するにとどめる。このデータ
のう
ち、ここでは INV なる類型論に基づく5尺
度に
テキストを読み、藤井データの特徴
と分析の関心について再確認しよう
 つぎのスライドに
示す千野のWEBテ
キストの 2.2 節
「定量変数の度数分
布と2つの定量変
数間の相関係数と
その検定」
を読んでみよう。
千野のWEBテキスト2.2節の内容
 前節では、カテゴリー変数の度数分布とそれ
ら
の間の関連性の検定についての基礎集計に
つ
いて述べた。この節では、変数が一応定量
的に
得られている(正確には、間隔尺度以上の
尺度
水準での測定がなされている)時、前節と
同様な
1.2節での学習内容のまとめ(1)
 藤井データ収集の研究
目標や作業仮説ー性格
変数間の関係や、筆跡
と性格の関係を探ること。
 分析方法ーここでは、
性
格変数の度数分布や性
格変数相互間の相関係
数を検討する。
100
50
0
1 2 3 4
月 月 月 月
東京
名古屋
大阪
INV2
・
・
・
・
・
・
・
・
・
・
・
INV1
1.2節での学習内容のまとめ(2)
 SAS の出力結果と基本的な統計用
語とその見方ーピアソンの相関係数
とその検定結果の見方。
1.2.1節 定量変数の分布特性
 千野の WEB テキストの URL
http://www.agu.ac.jp/~chino/
multivar/chapter1/
sec1-2-1.html
にある2つの棒グラフを見て
みよう。
 このような分布の型の違いを
統計的に検定する1つの方法
 正規性の検定
平均 μ、分散 σ2 の
正規分布の特徴
2.15%
34.13 %
34.13%
13.59 %
μ-2σ,
μ-σ,
2.15%
13.59%
μ,
μ+ σ,
μ+2σ
約70%
約95%
WEBテキストを読み、正規性の統計的検定
と出力結果について再確認しよう
つぎのスライドに示した、
千野のWEB テキストの
URL:
http://www.agu.ac.jp/~chin
o/multivar/chapter1/
sec1-2-1.html
の 1.2.1節
「定量変数の分布特性」を
読んで正規性の統計的検
定方法の出力結果の意味
を再確認しよう。
WEBテキスト1.2.1節の内容(1)
 最初の chart プロシジャは、単に5つの尺度そ
れぞれのヒストグラムを描かせるためのもので
ある。結果の一部を示すと、つぎのようになる
:
<2つの分布図>
 検査により、分布の型がずいぶん異なることが
わかる。実際、これらが果たして正規分布に従
う母集団からのランダムサンプルといえるかど
うかを検定するのが、上の2つ目のプログラム
である。出力結果は、つぎのようになる:
<正規性の検定結果>
正規性の統計的検定と出力結果
 Shapiro-Wilk の W
統計量
 帰無仮説は、「母
集団は正規分布に
従う」、又は「デ
ータは正規母集団
からの標本である
」
 P 値が 0.05 以下
 正規性の帰無仮
説 を棄却
WEBテキスト1.2.1節の内容(2)
 univariate プロシジャは、上の出力からわか
るよ
うに、正規性の検定のみならず任意の定量
変
数のいろいろな統計量を計算してくれる。
もちろ
ん、上の例のようにこのプロシジャでオプ
ションと
して normal を指定しなければ、正規性の
検定
WEBテキスト1.2.1節の内容(3)
 正規性の検定結果は、上の出力の中程に表
示
されており、この例ではサンプル数が 2000
以
下なので Shapiro-Wilk 統計量 W の値と、
そ
の横に統計量の値以下の値を取る確率が
Prob
< W として出力される。この値が 0.05 以
下で
WEBテキスト1.2.1節の内容(4)
 これに対して、最初の INV1の分布及びそ
の他
の尺度については、すべて正規性は棄却で
き
なかった。
1.2.2 節
定量変数間の相関関係
 WEBテキストの 以下の
URL にある複数の変数間
の相関係数の出力結果は
どんな形?
 http://www.agu.ac.jp/~chi
no/multivar/chapter1/sec12-2.html
 SAS の相関行列の出力結
果は、何を表している?
相関係数の定義とその性質(1)
 ピアソンの相関係数は、WEB テキスト の
うえ
に示した URL の中の(2.4)式に示し
たように、
共分散と2つの変量それぞれの標準偏差を
用
いて表される。
 相関係数は、-1から1の値をとり、負の
場合は
負の相関、ゼロに近い場合は無相関、正の
相関係数の定義とその性質(2)
sxy
rxy 
sx s y
共分散
標準偏差の積
相関係数の値と散布図の特徴
 相関係数が負、ゼロ、正の場合、2変数の関係を
散布
図として描くと、下の図で左から順につぎのよう
な特徴
が見られる。
・ ・
。
・
・
・
・
・
・
負の相関
・
・
・
・
・
・
・
・
・
・
無相関
・
・
・
・
・
・
・
・
正の相関
・
相関係数の有意性検定
 WEBテキスト の (1.5) 式に示したように、母相関係
数をρとすると、帰無仮説 H0 : ρ= 0 のもとで、標本
相関係数 r から計算されるつぎの量 t が、自由度ν=
N-2 の t-分布に従うことを利用する:
相関
係数
t
N はサンプル数
r N 2
1 r
2
テキストを読み、相関係数とその検定につい
ての基礎知識を整理しよう
 つぎのスライドに示し
た、
WEBテキストの上記
URL
の2.2.2節
「定量変数間の相
関関
係」を読んでみよう。
 また、INV の5尺度間
の
相関係数の検定結果を
1.2.3節 はずれ値の
相関係数への影響
 データの大勢から見て、明らかに飛び離れて
いるデータを、「はずれ値」と呼ぶ。
 はずれ値は、異常値ではない。
 はずれ値を入れると有意な相関になる場合で
も、はずれ値をはずすと、ほとんど相関がな
くなる場合があるので注意が必要である。
 はずれ値と異常値の違いは区別しなければな
らない。
はずれ値の具体例を見てみよう
 浮田らの収集した、50名の被験
者の
クレペリン精神作業検査の結果か
ら、
2つの尺度を取り上げ、散布図を
描い
て見たのがURL
http://www.agu.ac.jp/~chino/multi
var/chapter1/sec1-2-3.html
にある図である。
 これと、はずれ値をはずして全体
WEBテキストを読み、はずれ値の
相関係数への影響ついて再確認しよう(1)
相関係数は、多くの多変量解析の基本と
なる
指標であるが、データの中に異常に大きな
値や
小さな値を持つサンプルを含む場合には、
この
値が大きく変動し、場合によっては相関係
数の
検定結果にも大きく影響するので、注意が
WEBテキストを読み、はずれ値の
相関係数への影響ついて再確認しよう(2)
 うえの散布図は、浮田・横井ら (1996) によ
る被
験者48名のクレペリン精神作業検査にお
ける休
憩後の動揺率を横軸に、同休憩後の平均誤
答
率を縦軸にした2変数の散布図である。こ
の図
右上の被験者の両変数の値は共に、他の被
WEBテキストを読み、はずれ値の
相関係数への影響ついて再確認しよう(3)
 ちなみに、両変数間の相関係数は 0.692 で
あ
り、1パーセント水準以上の高い水準で
統計的
に有意である。しかし、もしうえのはず
れ値を1
つ除くと、相関係数は劇的に 0.253 と小さ
くな
り、もはや5パーセント水準でも有意で
第2章 因子分析
心理学の多くの分野では、例えば性格、知
能、
対人態度・印象、筆跡特徴など、現象そのも
のを
たくさんの物差しで測定する必要がある。因
子分
析は、これらの尺度のうち、似た者同士をグ
ルー
ピングするための方法であり、その基本的概
念と、
第2章の内容
2.1節
例
2.2節
型
2.3節
2.4節
ス回転
2.5節
因子分析の目的と具体
サーストンの多因子模
主因子解
単純構造とバリマック
因子得点
2.1節 因子分析の目的と具体例
 この節では、まず因子分析の目的を簡単に言
葉を用いて説明し、つぎに因子分析の大枠を
具体的なデータや分析例を図や表を用いて紹
介する。
 因子分析の具体例としては、諸君が1年次の
基礎実験で体験した YG 性格検査の12尺度
データと、人の筆跡の特徴を測る29尺度に
よる筆跡データを用いる。
因子分析の目的
 (1) 因子分析は、複数の検査得点や評定尺
度
得点をもとに、似通った尺度同士をグルーピ
ング
する方法
 (2) 因子分析では、尺度の分類だけでなく、
尺度
に対する反応の似通った人同士をグルーピン
2.1.1節 尺度間の類似性をどう定義?
 それでは、因子分析では、どのようにして複
数の尺度相互が似通っているかどうかを定義
するのであろうか。
 因子分析では、尺度間の類似性の有無は、既
に第1章の1.2節で学んだ相関係数の言葉
で定義する。
 そこで、1.2節で既に示した相関係数の正
負に対応する次の図を思いだそう。
相関係数の値と散布図の特徴(再掲)
 相関係数が負、ゼロ、正の場合、2変数の関係を
散布
図として描くと、下の図で左から順につぎのよう
な特徴
が見られる。
・ ・
。
・
・
・
・
・
・
負の相関
・
・
・
・
・
・
・
・
・
・
無相関
・
・
・
・
・
・
・
・
正の相関
・
正の相関と尺度相互の類似性(1)
 前図の右端の正の相関関係が、例えば YG 性格
検査の抑うつ性と気分の変化の2尺度間で認め
られるとすると、
気分の
変化
大
小
抑うつ性
低
高
尺度相互間の相関と類似性(1)
 すなわち、前図から、両変数間に正の相関が認め
られる場合、
(1)抑うつ性が高い人ほど気分の変化も大き
く、
(2)抑うつ性が低い人ほど気分の変化も低い
、
ことになる。すなわち、この場合、2つの臨床
心理学的概念は、統計的には相互に似通った性格
の側面を測定している、と言える。
正の相関と尺度相互の類似性(2)
 これに対して、もし抑うつ性と気分の変化の間
に負の相関が認められるとすると、そのことは
(1)抑うつ性が高い人ほど気分の変化も
小さく、
(2)抑うつ性が低い人ほど気分の変化も
高い、
ことになる。すなわち、この場合、2つの臨
床心理学的概念は、統計的には相互に相反した
性格の側面を測定している、と言える。
言い換えれば、両尺度は非類似度が高い
、とも
正の相関と尺度相互の類似性(3)
 これに対して、もし抑うつ性と気分の変化の間
は無相関(少し上の3つのグラフの真ん中の関
係)とすると、そのことは
抑うつ性の高低と気分の変化の大小、の間に
は
特別な関係は認められない、
ことになる。
言い換えれば、両尺度は類似性が認められ
ない、とも言える。
項目や被験者の分類のためには、何を利用する?
 相関行列による項目や被験者の分類
因子分析では、そのために多くの項目に対
する
多くの被験者の検査得点や評定尺度得点から、
すべての項目間の相関係数を計算
 相関行列とは?
項目間の相関係数を縦横に配置したもの。
千野のWEB頁にある、次頁のスライドを参照
のこと:
http://www.agu.ac.jp/~chino/multivar/
相関行列の例
WEBテキスト 1.2.2 節のINV 5尺度間の相
関行列
INV1
INV2
INV3
INV4
INV5
INV1
1.00
0.31
0.22
0.38
0.17
INV2
0.31
1.00
0.26
0.50
0.40
INV3
0.22
0.26
1.00
0.47
0.55
INV4
0.38
0.50
0.47
1.00
0.40
INV5
0.17
0.40
0.55
0.40
1.00
2.1.2節 YG 性格検査12尺度の因子分析
 YG の場合、相関行列は、上のような行列で12
行12列から成る。
 12尺度間の相関行列をもとに、似たもの同士
のグループ(因子)が幾つあるかを、当該行列
の固有値を尺度分、すなわち12個計算し、そ
れらの値からグループ数(因子数)を決める。
 因子数が決まったら、のちに定義する因子パ
ターンを求め、各因子の内容を解釈し、因子の
名前をつける。
固有値とは?
 固有値とは、1つ前のスライドのような行数と
列数が
等しい数値の並び(これを数学では、行列とい
う)が
与えられた場合、その全体に「固有な」数値を
指す。
 この固有な数値は、行数(もしくは列数)だけ
存在す
ることがわかっている。
 この固有な数値は、特別な方法を用いて計算す
因子分析における固有値の意味(1)
 因子分析、とりわけあとで学ぶ主因子法
とい
う方法では、固有値は、各因子でもって
全デ
ータ(すべての尺度に対する被験者の得
点)
のばらつきをどれぐらい説明できるかの
指標
になっている。
因子分析における固有値の意味(2)
 そのために、この値がある値以上(通常
1)
であるような因子が意味のある因子と
みなさ
られ、全尺度で測られたデータに含ま
れる因
子数の推定のために用いられるのであ
る。
YG 性格検査の因子分析結果を
千野のウエブ上で見てみよう
 千野の以下の URL に対応す
るホームページの後半を見
てみよう。
 http://www.agu.ac.jp/~chino
/multivar/chapter3/
sec3-1-4.html
これらをまとめると、つ
ぎの2つのスライドのよう
になる:
YG 12尺度データの相関行列の固有値
Eigenvalue
固有値が
1
の境
1
4.80
2
1.61
3
0.71
4
0.24
5
0.16
6
0.09
7
0.05
8
−0.02
9
−0.05
10
−0.10
11
−0.17
12
−0.21
大きい順
に
上から下
へ
性格検査の因子分析からわかること(1)
 因子分析では、例えばYG 性格検査12
尺度相互の相関行列から出発して似たも
の同士を集めることにより、
12尺度は、直前のスライドの固有
値の値から、2グループ(2因子)から
成る、
と推定する。
性格検査の因子分析からわかること(1)
 その後、つぎのスライドのような後に詳し
く述べ
る「回転後の因子パターン」を用いて、
各因子
がどのような内容から成るのかを解釈し
、因子
に名前を付ける。これを因子の命名とい
う。
 回転後の因子パターンには、そのための情
報
回転後の因子パターン
Factor 1
Factor 2
yg 1. depression
0.76
−0.22
yg 2. cyclic tendency
0.78
−0.08
yg 3. inferiority complex
0.60
−0.54
yg 4. neurosis
0.79
−0.37
yg 5. objectivity
0.76
−0.14
yg 6. cooperativeness
0.63
0.07
yg 7. aggressiveness
0.35
0.37
yg 8. general activitly
yg 9. rhathymia
−0.28
0.08
0.67
0.48
yg10. thinking extroversion
−0.58
0.15
yg11. ascendance
−0.31
0.80
yg12. social extroversion
−0.26
0.77
性格検査の因子分析からわかること(3)
 うえの回転後の因子パターンから、第1グ
ルー
プ(第1因子)は、抑うつ性、気分の変化
等の前
半の尺度群で構成され情緒安定性因子、第
2
グループ(第2因子)は、一般的活動性、
社会
的外向性等の後半の尺度群で構成される向
性・活動性因子と見れる。
性格検査の因子分析からわかること(4)
YG 性格検査の2因子構造が明らかになった
なら
ば、 (各因子の)因子得点を推定することに
より、
各被験者の分類を行える。
 因子得点とは、大雑把に言えば、各因子上の
個
人差を表す得点、といえる。
 すべての被験者の2因子の因子得点を散布図
に
描いたとした場合の例が次のスライドである。
性格検査の因子分析からわかること(5)
 すべての被験者の2因子の因子得点を計
算
し、散布図に描くとすれば、各因子の意
味内
容から、YG 性格の型判定の5分類(A, B,
C,
D, E) の被験者の位置はつぎのようにな
るは
ずである。
YG 性格2因子の因子得点の散布図と
YG性格検査の5類型との関係
向性・活動性
因子得点
外向的
B型
不安定
D型
A型
E型
安定
C型
内向的
情緒安定性
因子得点
性格検査の因子分析からわかること(6)
 これらの5分類は因子分析による2因子
の
因子空間を埋め尽くしており、YG検査
の5分
類が1つの妥当な被験者の分類方法に
なっ
ていることがわかる。
2.1.3節 筆跡データの SAS 出力(1)
 藤井 (1983) の筆跡28
項
目の因子分析結果
 つぎに、千野の
WEB
テキストで紹介する筆
跡
29項目の因子分析結
果
を見てみよう。
筆跡データの SAS 出力(1)
 千野の WEB テキストの以下の URL
http://www.agu.ac.jp/~chino/multivar/chapter2
/sec2-8-2.html#top
には、藤井 (1983) の筆跡データ(1983)の
中の筆跡
に関する29項目に対する50名の被験者の得
点の因
子分析による因子パターンがあげられている。
つぎのスライドは、それを抜粋したものであ
藤井データ(1983)の概要
 うえのWEB 頁にある藤井データは、千野ゼ
ミの
藤井(1983)が筆跡と性格に関する探索
的な研
究を行うにあたって収集したものである。
 彼女は性格を INV という類型論にもとずく検
査
と、特性論にもとずく YG 性格検査の2種類
で診
断し、筆跡を28個の7段階 SD 尺度と転記
時間
29尺度による筆跡の因子の抽出
 既述の YG 性格検査の12尺度の検査結果の因
子分析と同様、筆跡の29尺度相互の相関行
列
を求め、YG性格検査の場合と同様に、その固
有
値を計算したところ、筆跡の因子は5因子あ
るこ
とがわかった。
 しかし、5因子の因子パターンを求め、各因
子の
筆跡データの SAS 出力(2)
第1因子
第2因子
第3因子
IMG
1
0.07
0.03
0.02
IMG
2
0.66
0.15
IMG
3
−0.03
−0.02
IMG
4
0.87
−0.21
−0.25
⁞
⁞
−0.25
0.09
第4因子
0.60
−0.15
0.7
9
0.4
3
0.14
0.8
9
⁞
IMG28
−0.12
0.44
IMG29
0.20
0.25
0.17
因子寄与
10.54
4.31
2.88
2.35
0.50
0.20
0.14
0.11
寄与率
0.5
5
0.19
⁞
−0.03
共通性
⁞
0.13
−0.19
0.2
7
0.1
7
21.2
7
筆跡の4因子の解釈と命名
 うえの因子パターンからは、筆跡の4因子は
つぎ
のように解釈され命名された:
第1因子:
第2因子:
第3因子:
第4因子:
筆跡の評価因子
筆跡の力強さ因子
筆跡の滑らかさ因子
筆跡のアクセント因子
2.2節 サーストンの多因子模型
 この節では、最初に因子分析開発の歴史を
一
瞥し、伝統的な因子分析を集大成したサー
スト
ンの多因子模型を学び、同模型にかかわる
幾
つかの因子分析の基本概念の大枠を学ぶ。
 また、やはり伝統的な因子分析の解釈に際
して
基本的な因子の回転にまつわる基本的概念
因子分析の歴史と各種因子解及び
サーストンの多因子模型の確認
 千野のWEBテキスト のURL
http://www.agu.ac.jp/~chino/multivar
/chapter3/sec3-1-1.html
の第3章の冒頭部を読んで、簡単な
因
子分析の歴史(以下の5枚のスラ
イド)と
各種因子解を知ろう。
 サーストンの多因子模型を同上テキ
ス
2.2.1節 因子分析の歴史(1)
 因子分析は、もともとビネーに始まる知能検
査の
開発の歴史と共に、知能の数量的把握の方
法と
して発展したもので、スピアマン
(Spearman, C.,
1904)の 2 因子説(Spearman's two-factor
theory)、ガーネット(Garnett, J.C.M., 191920)に
始まりサーストン(Thurstone, L.L., 1931)が
因子分析の歴史(2)
 これらの理論は、いわば、現象の背後にあ
る
因子の数や構造についての大枠を示して
はい
るが、必ずしもデータを手にして、どの
ようにそ
れらの因子や構造を抽出するかを答える
もの
ではない。
因子分析の歴史(3)
 これらのうち多因子説が、最も一般的な因子
分析モデルであり、その因子数や 因子の構
造をデータから推定する方法(解法)が、
これ
まで数多く開発されてきた。
 これらの方法は、これらの方法は、推定され
る
因子相互が直交しているか否かで、大きく
直
因子の直交性とは(1)
 ここで、因子が直交して
い
る、とは何を意味するの
で
あろうか。まず、幾何学
的
には、例えば 既述の YG
性格検査の2因子では、
第1因子(抑うつ性)と
第2
因子(活動性・向性)が
活動性・向性
直角
抑うつ性
因子の直交性とは(2)
 因子が直交していると
い
うことは、第1因子(
抑うつ
性)と第 2 因子(活動
性・
向性)の間が無相関で
あ
る、ということであり
、両因
活動性・向性
抑うつ性
因子分析の歴史(4)
 直交解の1つとして良く知られているのが
主因子解 (principal factor
solution)(Hotelling, 1933) である。一方、斜
交解には、オブリマックス解(oblimax
solution)(Pinzka & Saunders, 1954)、オブリミン
解(oblimin solution)(Carroll, 1960)、クオティミ
ティミン解(quartimin solution)(Carroll, 1953)、
因子分析の歴史(5)
 因子分析は、他の多変量解析と異なり、もと
もと
心理学者が提唱した記述統計的方法であっ
た
が、ローレイ(Lawley,D.N., 1940)やヤレス
コフ
(J ö reskog,K.G., 1981)らによる 最尤解
(maximum likelihood solutions)が可能となり、
現在
2.2.2節 因子負荷量と因子パターン
 因子パターン
出力結果のところで見たように、因子分
析結
果の中核をなす因子パターンにより、我々は
得ら
れた各因子の解釈を行うことができる。因子
パ
ターンの構成要素は、因子負荷量と呼ばれる。
 因子負荷量
因子負荷量は、因子の係数とも呼ばれ、
因子
分析のモデル(模型)における各因子の重み
を表
因子負荷量のもう1つの意味
 因子負荷量は、因子分析モデルにおける各因子
の重みである、という解釈のほかに、つぎのよ
うな解釈も可能である。
 すなわち、因子相互が互いに直交(無相関)で
あるならば、
因子負荷量は、各因子ともとの尺
度間の相関係数に等しい
2.2.3節 サーストンの多因子模型での
因子パターン(1)
 伝統的な因子分析モデルは、サーストン
の多
因子模型と呼ばれる。千野のWEBテキス
ト
「データ解析/基礎と応用」の3.1.1節
http://www.agu.ac.jp/~chino/multivar
/chapter3/sec3-1-1.html
の (3.1) 式(つぎのスライド)に見るよ
うに、多
サーストンの多因子模型
第 i サンプルの
第 j 変数の得点
Zij  a j1Fi1  a j 2 Fi 2  a jr Fir  bjGij , (3.1)
共通因子
独自因子
サーストンの多因子模型での
因子パターン(2)
 多因子模型で、サンプルの添え字 i をすべて除き、
m 個の変数分の式を並べたものは、WEBテキス
トの
(3.3) 式と書け、広義の意味で因子パターン
(factor
pattern) と呼ばれる。
 一方、共通因子の因子負荷量のみをつぎの表のよ
う
に縦横に並べたものは、狭義の意味で、因子パ
ターン、
因子パターンの表示
 共通因子の係数、
すなわち共通因子
負荷量のみを、右
のように縦横に並
べ
たものを、因子パ
ターンまたは因子
行
列と呼び、各共通
因子の解釈に際し
て利用する。
, a1r 
 a11, a12, 

, a2r 
 a21, a22, A

  


 a , a ,, a 
mr
 m1 m2
YG 性格検査の因子分析結果を
千野のウエブ上で再確認しよう
 千野の以下の URL
に対応するホーム
ページの後半を見て
みよう。
 http://www.agu.ac.jp
/~chino/multivar/ch
apter3/sec3-1-4.html
2.2.4節 多因子模型における
因子間の直交性-1
 WEBテキスト の (3.1) 式で表され
るサー
ストンの多因子模型における2種類
の因
子得点、すなわち共通因子得点 Fil,
l=1,
…, r, 及び独自因子得点 Gij, j=1, …, m
間には、一般的にWEBテキストの
多因子模型における因子間の直交性-2
 ここで、行列 F
は、共通因子
各
因子の因子得
点を、被験者
を
横に、共通因
子
の番号を縦に
, F1r 
 F11, F12, 

, F2r 
 F21, F22, F
   


 F , F ,, F 
Nr 
 N1 N 2
多因子模型における因子間の直交性-3
 一方、行列 G
は、
独自因子各因
子
の因子得点を、
被験者を横に、
独自因子(項
目)
の番号を縦に
し
, G1m 
 G11, G12, 

, G2m 
 G21, G22, G 

  


 G , G ,, G 
Nm 
 N1 N 2
多因子模型における因子間の直交性-4
 多因子模型では、上記2種類の因
子得点間に、WEBテキストの 3.
1.2
節の(34)式から(36)式
までの3つ
の仮定を置く。
多因子模型における因子間の直交性-5
 これら3つの仮定を、数式でなく言葉で言い換
えれば、順に
(i) 共通因子(の因子得点)相互は、相関が
あ
っても(斜交)、なくても(直交)よ
い。
(ii) 独自因子(の因子得点)相互は、無相関
(
直交)で、独自因子同士の相関は1である。
(iii) 共通因子(の因子得点)と独自因子(の
2.2.5節 因子構造とは?
ー2種類の因子構造-1
 因子構造
因子構造とは、もとの変数(テストバッテ
リー)と
各因子間の相関関係をいう(WEB テキスト
3.1.2
節)。
 2種類の因子構造
因子構造には、多因子模型では、2種類あり、
それらは、
(1)狭義の因子構造
因子構造とは?ー2種類の因子構造-2
 狭義の因子構造
もとの変数と共通因子間の相関係数
を縦
横にならべたものを行列 P で表すものと
する。
一般に P は、共通因子の因子の係数、
別
名共通因子負荷量を縦に並べた因子パ
ター
ン A と共通因子間の相関行列 Фを用いて、
WEB テキスト3.1.2節の(3.7)式の
ように書
因子構造とは?ー2種類の因子構造-3
(3.7) 式は、もし共通因子相互がすべ
て無
相関(直交因子)の場合、つぎのよう
に書け
P

A
,
る:
( mr )
( mr )
因子構造とは?ー2種類の因子構造-4
 このことは、この条件下では、各変
数と
各共通因子間の相関(狭義の因子構
造)は、共通因子負荷量、すなわち
因
子パターンに等しくなることを意味
する。
因子構造とは?ー2種類の因子構造-5
これに対して、もとの変数と独
自因子
間の相関 D は、WEB テキスト 3.
1.2
節の (3.8) 式と書ける:
因子パターンと因子構造の再確認
 WEBテキスト 3.1.
2節
を読んで、因子パ
ター
ンの定義を再確認し
よう。
 また、サーストンの
多因
子模型における因子
相
互の関連の仮定を再
2.2.6節 共通性 (communality) とは
 WEBテキスト 3.1.3 節の (3.12) 式及び
(3.13)
式の hj2 は、第 j 変数の共通性と呼ばれる。
すな
2
2
2
s j  1  h j  b j , (3.12)
わち、
h  a  a   a . (3.13)
2
j
2
j1
2
j2
2
jr
共通性の、言葉による定義
 上記の共通性の定義を、言葉で表せば、つぎ
の
ように書ける(WEBテキストの 3.1.3 節、
(3.13)式
の下):
第 j 変数の共通性とは、第 j 変数の分散
に占める共通因子の寄与を表す。
YG性格検査の共通性の例
右の表で、例えば、
第1項目「抑鬱性」
の共通性は、つぎの
ように計算できる:
h  0.76  (0.22)
 0.63
2
1
2
1.抑鬱
性
2.気分
の変化
2
3.劣等
感
:
Fact
or1
Fact
or2
0.7
ー0.2
2
6
0.7
8
0.6
0
:
-0.0
8
-0.5
4
共通性
0.6
3
0.6
1
0.6
5
:
12.社
会的向性
-0.2
6
0.7
7
0.6
6
因子寄与
3.8
4
2.5
8
6.4
2
因子分析に先立つ共通性の推定-1
 因子分析、とりわけのちに述べる
主因子法では、因子を求めるのに
先立ち、変数間の相関行列の対角
要素の値を、データから推定する
必要がある。
因子分析に先立つ共通性の推定-2
 その理由は、のちに述べる因子分析の
代表的な解法としての主因子法では、
WEBテキストの3.2.1節
http://www.agu.ac.jp/~chino/multivar
/chapter3/sec3-21.html
の (3.18) 式の条件下で共通因子を求
める
ので、同一変数同士の相関係数は、
因子分析に先立つ共通性の推定-3
r  a  a   a ,
*
jj
2
j1
2
j2
2
jr
と書け、これは既に紹介したWEBテキ
ストの3.1.3節の (3.13) 式で定義され
た、第 j 変数の共通性 に他ならない。
因子分析に先立つ共通性の推定-3
 さらに重要なポイントは、これらの共通
性は、
本来は因子分析による因子パターンが求
まっ
てから計算できるわけであるが、主因子
法で
は因子パターンが求まる前に、この値、
すなわ
ち各変数間の相関行列における対角要素
の
値(共通性)をデータを用いて推定して
相関行列と対角要素の例(再掲載)
 2.1 節の INV 5尺度間の相関行列
INV1
INV2
INV3
INV4
INV5
INV1
1.00
0.31
0.22
0.38
0.17
INV2
0.31
1.00
0.26
0.50
0.40
INV3
0.22
0.26
1.00
0.47
0.55
INV4
0.38
0.50
0.47
1.00
0.40
INV5
0.17
0.40
0.55
0.40
1.00
共通性の推定方法
 よく知られている共通性の推定方法は、WEBテキ
ストの3.1.3節の下方にあるつぎの3つの方法で
ある:
(1) 相関行列の各列(あるいは各行)の要素の
絶
対値最大なもの(の絶対値)を、充てる。
(2) SMC (重相関係数の二乗 Rj2)を充てる。
(3) 反復近似 (iterative approximation) による。
例えば、直前の相関行列の例で、(1) の方法
を用いると、つぎのようになる:
(1)の方式による、
INV 5尺度の縮退相関行列の例
2.2 節のINV 5尺度間の相関
行列
INV2
INV3
INV4
INV1
INV5
INV1
0.38
0.31
0.22
0.38
0.17
INV2
0.31
0.50
0.26
0.50
0.40
INV3
0.22
0.26
0.55
0.47
0.55
INV4
0.38
0.50
0.47
0.50
0.40
INV5
0.17
0.40
0.55
0.40
?
縮退相関行列とは?
 縮退相関行列は、一般的に書くと、WEBテキ
スト
3.2.1節の (3.19) 式に示したものとし
て定義される。
 縮退相関行列は、先ほど示した3つの方法の
いず
れかを用いて、もとの相関行列(対角要素は
すべ
て1)の対角要素をデータから推定して求め
る。直
共通性の概念の整理(復習課題)
 WEBテキスト
の
3.1.3節を読
んで、
共通性の定義を
再確認しておこ
う。
 また、データか
ら
2.2.7節 因子寄与、寄与率とは
 因子寄与 (contribution of factor) あるい
は総寄与 (total contribution) とは、
WEB
テキスト 3.1.4 節の (3.15) 式にも
2
2
2
あるように
V  a  a   a . (3.15)
p
1p
2p
mp
因子寄与(総寄与)の
言葉による定義
 因子寄与(総寄与)を言葉で定義すれば
、
因子寄与とは、全(変数の)分散に占める、
第 p 共通因子の寄与を示す。
YG性格検査の因子寄与の例
右の表で、例えば、
第2因子「向性・活動
性」の因子寄与は、
つぎのように計算で
きる:
V2  (0.22)  (0.08)
2
  (0.77)2
 2.58
1.抑鬱
性
2.気分
の変化
2
3.劣等
感
Fact
or1
Fact
or2
0.7
ー0.2
2
6
0.7
8
0.6
0
:
-0.0
8
-0.5
4
:
共通性
0.6
3
0.6
1
0.6
5
:
12.社
会的向性
-0.2
6
0.7
7
0.6
6
因子寄与
3.8
2.5
6.4
4
8
2
寄与率あるいは共通性のパーセント
 因子寄与に近い概念に、寄与率あるいは
共通性のパーセントという概念がある。
これらはWEBテキストの (3.1.4)節
の (3.16) 式または (3.17) 式で定義
されるもので、
100Vp / m, 変数の漸分散
m
100Vp /  h . j 1
(3.16)
2
j
共通性のトータ
ル
(3.17)
寄与率の、言葉による定義
 寄与率を、言葉で定義すれば、
寄与率とは、変数の全分散に占める各因
子の因子寄与の比率、もしくは、共通性の
トータルに占める因子寄与の比率である。
YG性格検査の因子の寄与率の例
右の表で、例えば、
第2因子の因子寄
与は V2=2.58.
そこで、第2因子の
因子寄与率は、
2.58/6.42≈0.40
共通性
Fact
or1
Facto
r2
0.7
ー0.22
0.63
0.7
-0.08
0.61
0.6
-0.54
0.65
1.抑鬱性
6
2.気分の
変化
8
3.劣等感
0
:
12.社会
的向性
:
:
-0.2
6
0.77
0.66
3.8
2.58
6.42
0.6
0.40
1.00
因子寄与
4
寄与率
0
寄与率の概念の整理(復習課題)
 WEBテキスト 3.1.4節
http://www.agu.ac.jp/~chi
no/multivar/chapter3
/sec3-1-4.html
を読んで、寄与率の定義を
再確認しておこう。
2.3節 主因子解
主因子法による主因子解 (principal factor
solution) とは、WEBテキスト3.2.1節に示
したよ
うに、因子寄与 Vp が、つぎの条件下
r  a j1ak1  a j 2ak 2   a jr akr , (3.18)
*
jk
で最大になるように因子パターン A を決定す
る
方法である。
縮退相関行列の固有値問題としての
主因子法による主因子解(参考)-1
 主因子解を求めるには、既に例を示
し
た変数間の縮退相関行列の
固有値問題(eigenvalue problem)
という数学の行列理論の中の1つの
問題
を解く必要がある。
縮退相関行列の固有値問題としての
主因子法による主因子解(参考)-2
 縮退相関行列を R* と書けば、WEBテキスト
の
3.2.1節の (3.20) 式を満たすところの
固有値 (eigenvalue) λp
に対する
固有ベクトル (eigenvector) ap
を幾つか求める必要がある。
固有値問題における固有値とは?-1
 固有値とは、相関行列を離れて、一般に任意
の正方行列に特有な、固有な値である。例え
ば、
2

1
1

2
なる数値のセット(2行2列の行列)には、固有
な値、すなわち固有値が2つあり、それらは、1と
3であることが、固有値の定義から計算できる。
固有値問題における固有値とは?-2
 ここで、正方行列とは、数字を縦横に並べ
たも
ののうち、その行数と列数が同じ行列を
さす。
 既に紹介した INV 性格検査の相関行列は
、5
行5列の正方行列の例である。
 この場合、固有値は5つ存在する。
固有値の大きさと因子数との関係
 主因子解では、固有値はWEBテキスト 3.2.
1節の (3.21) 式にあるように、因子分析にお
ける因子寄与にあたる。
 その結果、寄与の小さい因子は重要でないと
みなされるので、固有値の大きさは通常1以
上ならば意味があると考えられている。
 そのために、固有値を大きい順に並べたとき
、その値が1以上の因子を当該検査や項目を
構成する(共通)因子数とみなす。
スクリープロットとは?
 主因子法では、共通性推定後の最初の段階で
、
固有値を検査項目分計算し、その値が1以上
の
因子数を推定因子数とみなすが、これを見や
すく
するために、縦軸に固有値の値を、横軸に因
子番
号を取り、固有値のプロットを行う。
 固有値のプロット結果は、スクリープロット
スクリープロットの例-1
 それでは、まずWEBテキストの 3.1.4 節の最後の部
分
http://www.aichigakuin.ac.jp/~chino/multivar/chapter3/sec3-1-4.html
に示したYG 性格検査12尺度
の因子分析における固有値の
スクリープロット結果を見てみよ
う。共通性の初期推定法は、ここ
では、縮退相関行列の各列(各
行)の絶対値最大なものによる。
スクリープロットの例-2
 うえの YG 性格検査
の縮退相関行列から
得られる固有値の値
からは、YG 性格検
査を構成する12尺
度による検査は、何
因子から成ると言え
るか?
固有値から因子数を推定
する方法の再確認(復習課題)
 WEBテキスト3.2.
1節
の前半を読み、因
子
分析における固有
値
問題と固有値から
因
2.4節 単純構造とバリマックス回転
 一般に主因子法主因
子解は、必ずしも各
因子の解釈が心理学
的にうまくいくとは
限らない。
 既に千野のWEB頁上
の YG 性格検査の回
転前と回転後の因子
パターンを見せたが
、再度これらを見て
みよう。
2.4.1節 バリマックス回転とは
 この節では、バリマックス回転の持
つ意味を、既出の YG 性格検査を例
にとり、図式化して示す。
 これにより、バリマックス回転の持
つ幾何学的な正確が理解できよう。
回転前のYG 検査の2因子の
因子パターンと項目の布置(1)
因子パターンの回転という
問題を理解するために、ま
ず回転前の因子パターンを
ホームページから転記した
ものが、右の行列である。
この行列の第1列(第1
因子)及び第2列(第2因
子)のそれぞれの因子負荷
量を、順に x、y 軸の座標値
とみなしてみよう。すると、
 0.76

 0.69

A 

  0.70
  0.64

0.23

0.37



0.49

0.50
回転前のYG 検査の2因子の
因子パターンと項目の布置(2)
各列に対応する YG 検査
の12の下位尺度のうち、
例えば第1尺度の座標値は
x1=0.76, y1=0.23、
また、第2尺度の座標値は
x2=0.69, y2=0.37
のように表せるので、12の
尺度は平面上の12個の点
として表すことができる。こ
れを項目の布置という。
 0.76

 0.69

A 

  0.70
  0.64

0.23

0.37



0.49

0.50
回転前のYG 検査の2因子の
12項目の布置(3)
y軸
1112
8
9 0.37
7
6
2
51
4
x軸
0.69
-1.0
10
3
1.0
YG 性格検査の回転前と回転後の
因子パターンのプロット
 ここで、 YG 性格検査の回転前と回転後
の因子パターンにおける因子負荷量を
実際に座標値と見てプロットして、バ
リマックス回転により具体的にどれほ
ど座標軸の回転がなされているかをチ
ェックしてみよう。
 これを図示したのが、つぎの図である
:
回転後のYG 検査の2因子の
因子パターンと12項目の布置(4)
y軸
x軸
1112
8
9
7
6
座
標
軸
の
回
転
0.78
2
51
4
-1.0
-0.08
10
3
1.0
回転後のYG 検査の2因子の
因子パターンと項目の布置(1)
つぎに、回転後の因子
パターンを、ホームペー
ジから転記したものが、
右の行列 A* である。
この行列の第1列(第
1因子)及び第2列(第2
因子)のそれぞれの因
子負荷量を、順に x、y
軸の座標値とみなして
みよう。すると、
 0.76

 0.78

A*  

  0.31
  0.26

 0.22

 0.08



0.80 

0.77 
回転後のYG 検査の2因子の
12項目の布置(2)
11
12
8
y軸
9
7
10
6
x軸
0.78
52
-0.08
1
4
-1.0
3
1.0
単純構造とバリマックス回転
 そのため、YG 性格検査の例にあるように、
因子パターンの各列(各因子)を各座標軸と
みなし、因子パターンを構成する各因子負荷
量を座標値とみなし、各因子の心理学的解釈
がしやすくなるように、うえの例で示したよ
うな座標軸(系)の回転を行うことが多い。
 そのための便利な方法に、カイザーによるバ
リマックス回転 (varimax rotation) などがあ
る。
バリマックス回転における
バリマックス基準(参考)
 バリマックス回転では、WEBテキスト の3.2.1節
の (3.25) 式で与えられるバリマックス基準、
r
m
r
m
Q  m(c jp / hj )4  (c2jp / h2j )2 , (3.25)
p1 j 1
p1 j 1
を定義し、この値が最大になるように、因子パターンを
決定する方法である。
バリマックス回転の意味
 (3.25)式を言葉で表現すると、つぎのよう
になる:
バリマックス回転は、共通性 h 2 j で基準
化された因子負荷量の二乗の分散
(variance)を最大(maxmize)化する
ような回転である。
2.4.2節 サーストンの単純構造の原理
 因子パターンを構成する因子負荷量を、因子の
解釈
がしやすくなるように座標回転をするための原
理とし
て、サーストンの単純構造の原理
(Thurstone’s principles of simple structure) と
いうものがある。カイザー (Kaiser, 1958) のバリ
マック
ス法 (the varimax method) によるバリマックス
回転
サーストン (Thurstone, 1947) の
単純構造の原理
 サーストンの単純
構造の原理は、以
下に見るように、
回転後の因子パタ
ーンに5つの条件
を設定している。
これらを、具体例
{YG及び筆跡デー
タ)で1つ1つチ
ェックしながら見
サーストン (Thurstone, 1947) の
単純構造の原理(参考1)
 (1) 回転後
の因子パターン
(因子行列)の
各行では、少な
くとも1個ゼロ
がなければなら
ない。
サーストン (Thurstone, 1947) の
単純構造の原理(参考2)
 (2) 回転後の
因子パターン(
因子行列)の各
列では、少なく
とも r 個(共通
因子数)のゼロ
がなければなら
ない。
サーストン (Thurstone, 1947) の
単純構造の原理(参考3)
 (3)回転後の因
子パターン(因子
行列)の列の各対
について、一方の
列ではゼロで他方
の列ではゼロでな
い変数が、幾つか
なければならない。
サーストンの単純構造の原理(参考4)
 (4)回転後の因子
パターン(因子行
列)の列の各対につ
いて、共通因子数が
4、または5以上の
場合には、2つの列
の因子負荷量が共に
ゼロであるような変
数がかなり多くなけ
ればならない。
サーストンの単純構造の原理(参考5)
 (5)回転後の因
子パターン(因子
行列)の列の各対
について、2つの
列の因子負荷量が
共にゼロではない
変数は、ほんのわ
ずかであることが
望ましい。
バリマックス回転と
サーストンの単純構造(復習課題)
 WEBテキストの3.2.
1 節の後半を読み、因
子分析におけるバリ
マックス回転とサース
トンの単純構造の考え
方を整理しておこう。
2.5節 因子得点
 この節では、2.1節で既に学んだ「似通った人
同士をグルーピングする」因子得点をデータから
どのように推定するのかについて学ぶ。
 最初に2.2節で学んだサーストンの多因子模型
と2種類の因子得点について復習する。
 つぎに、因子得点を用いて検討可能な心理検査の
妥当性の概念の定義にふれる。
 最後に、2つの代表的な因子得点の推定方法につ
いて学ぶ。
2.5.1節 因子得点の復習
 ここでは、まず2.1節で学んだサーストンの多因
子模
型を復習し、その模型(モデル)の中で因子得点
がど
のような位置づけであったかを再確認する。サー
ストン
の多因子模型によれば、因子得点にも(1)共通
因子の
因子得点と(2)独自因子の因子得点の2種類が
あった
ことを以降の3枚のスライドを見て思いだそう。
サーストンの多因子模型における
因子負荷量と因子得点の違い(復習)
 伝統的な因子分析モデルは、サーストンの多因
子模型と呼ばれる。以下に見るように、多因子
模型の主要な部分は、因子負荷量 ajlと因子得点
Filから成り立っている:
第 i サンプルの
第 j 変数の得点
共通因子得点
共通因子
負荷量
Zij  a j1Fi1  a j 2 Fi 2  a jr Fir  bjGij
共通因子
独自因子
共通因子の因子得点
(共通因子得点)(復習)
 ここで、行列 F
は、共通因子
各因子の因子
得点を、被験
者を横に、共
通因子の番号
を縦にして並
べたもので、
ある。
, F1r 
 F11, F12, 

, F2r 
 F21, F22, F
   


 F , F ,, F 
Nr 
 N1 N 2
独自因子の因子得点
(独自因子得点)(復習)
 一方、行列 G
, G1m 
 G11, G12, は、独自因子


各因子の因子
, G2m 
得点を、被験 G   G21, G22,  
者を横に、独



自因子(項


 G , G ,, G 
目)の番号を
Nm 
 N1 N 2
縦にして並べ
たものである。
共通因子の因子得点の推定
 上記2種類の因子得点のうち、われわれが通常
関心があるのは、共通因子得点のみである。
 因子得点は、因子分析で抽出され命名される各
因子上の個人差(WEBテキスト 3.2.3節中
程)を表す。
 因子得点を推定すると、因子分析の対象となっ
た検査項目以外の得点に対する基準関連妥当性、
予測的妥当性(WEBテキスト 3.2.3節中程)
や一種の構成概念妥当性の検討が可能になる。
 ここで、一般に心理検査の妥当性とは?
2.5.2節 検査の妥当性
 心理検査の妥当性とは、一般に検
査が測定しようとする内容をどれ
ほど測定出来ているかをいう。一
般に、検査の妥当性には以下のよ
うないろいろなものがある:
(参考)検査の妥当性とは?
(1)構成概念妥当性 (construct validity)
(2)内容妥当性 (content validity)
(3)基準関連妥当性 (criterion-related
validity)
(4)予測的妥当性 (predictive validity)
(5)併存的妥当性 (concurrent validity)
(参考)基準関連妥当性とは?
 検査得点が、それとは独立な他の基準変数
(criterion variable) とどの程度関連している
かをいう。
 例えば、のちに紹介する筆跡と性格との関
連についての藤井 (1983) の分析では、筆跡
の各因子(例えば筆跡の滑らかさ因子)が
その人の性格のどの側面と関連するのかを
見る場合、筆跡の性格との基準関連妥当性
を見ることになる。
(参考)予測的妥当性とは?
 基準関連妥当性のうち、検査得点を
他の基準変数の値を予測するために
用いる場合を、予測的妥当性という。
 例えば、藤井(1983) の分析で、性格
で人の筆跡を予測することができる
とする仮説を立てるならば、性格で
もって筆跡を予測することができる
かを分析することは、性格による筆
跡の予測的妥当性の検討と言える。
(参考)構成概念妥当性とは?
 多くの場合、心理検査が測定しよう
とする内容(例えば、知能や向性な
ど)は仮説的構成概念 (hypothetical
construct) であり、抽象的な仮のもの
である。そのような概念を、当該心
理検査が実際どの程度測定している
かを、構成概念妥当性と呼ぶ。
(参考)構成概念妥当性とはー続き1
 従来は、構成概念妥当性は、行動レ
ベルで定義された何らかの外的基準
との相関係数で評価したり、当該構
成概念から理論的に予想される、条
件間での検査得点の差の検討などに
より評価されてきた。
(参考)構成概念妥当性とはー続き2
 構成概念妥当性の検討に際して、当該構成
概念に関して妥当性の高い検査や基準とな
る測定が既に存在するときに、それらを含
めた変数間の相関行列を用いて因子分析を
行い、当該構成概念を表す因子上での因子
負荷量を計算し、それを当該検査の構成概
念妥当性係数とすることもある。このよう
な場合における妥当性は、因子的妥当性と
呼ばれる。
2.5.3節 (共通)因子得点の推定方法
 共通因子の因子得点の推定方法には、WEBテキス
トの3.2.3節に示した2つの方法がよく知られて
いる。それらは、
(1)独自性最小化による方法
サーストンの多因子模型の独自性の部
分を最
小にするような共通因子得点を求める
方法。
(2)完全推定法
共通因子の因子得点は、もとの尺度(
変数)の
(共通)因子得点の推定方法-1
 (1)独自性最小化による推定の場合、最終的
にはWEBテキストの3.2.3節の (3.63) 式を用
いて、共通因子得点 F の推定値を求める:
因子
得点
もとのデー
タ
因子パター
ン
t
1
ˆ
F  ZA( A A) . (3.63)
この方法では、結局、共通因子得点は、もとの
データを各変数ごとに基準化したもの Z、と因子
パターン A を用いて計算できることがわかる。
(共通)因子得点の推定方法-2
 (1)完全推定法の場合、最終的には、WEBテ
キスト の3.2.3節の (3.69) 式(直交因子の場
合、(3.70) 式)を用いて、共通因子得点 F の推
定値を求める:
因子
得点
もとの
データ
相関
行列
因子パター
ン
1
ˆ
F  ZR A. (3.70)
この方法では、結局、共通因子得点は、もとの
データを基準化したもの Z、変数間相関行列 R と
因子パターン A を用いて計算できることがわかる。
因子得点の推定方法
を整理しよう(復習課題)
 WEBテキスト 3.2.
3節
を読み、因子得点は
、データからどのよ
うにして推定できる
かを整理しておこう
。