第六章SPSS的参数检验

Download Report

Transcript 第六章SPSS的参数检验

第六章
SPSS的参数检验
§6.1 统计推断的基本方法
一. 什么是统计推断?
统计推断是根据已经收集到的样本数
据推断样本来自的总体的分布或总体均值、
方差等总体统计参数。
统计推断的内容:
1.参数估计
(1)点估计
(2)区间估计
2.假设检验:
(1)参数检验
总体分布已知,推断总体的统计参数。
(2)非参数检验
总体分布未知,推断总体的分布或者总
体的统计参数。
例如:
对“休闲调查.sav”中的“住房面积”
变量进行检验,要求根据文件中的数
据推断出城市居民户均住房面积是否
为38平方米。
2.SPSS中假设检验一般步骤:
(1)根据检验的目标,提出原假设和备择
假设。
(2)确定适当的统计量,并计算其值;
(3)根据该统计量的值,得到对应的P值。
(4)作出判断。根据用户给定的显著水平,
若P值<=显著水平,则拒绝原假设;否则,
不能拒绝原假设。
二. 假设检验的基本方法
1.假设检验的思路:
小概率原理认为:小概率事件在一次试验中
几乎不可能发生。
首先假设H0为真,考虑在H0成立的条件下观
测到的样本信息出现的概率。如果这个概率很小,
说明一个小概率事件在一次试验中发生了。这时
我们就有理由怀疑原定假设H0的正确性,从而拒
绝H0;否则不能拒绝H0 。
§6.2 单样本t检验
一.什么是单样本t检验
SPSS单样本t检验是检验单个变量的
均值与指定的检验值之间是否存在显著
差异。
前提:样本来自的总体应服从正态分布。
§6.2 单样本t检验
一.什么是单样本t检验
SPSS单样本t检验是检验单个变量的
均值与指定的检验值之间是否存在显著
差异。
前提:若是小样本,则样本来自的总体
应服从正态分布。
二.单样本t检验的基本实现思路
2
N
(
μ
,
σ
), 从这个总体中
设总体X服从正态分布
抽取样本 ( x1 , x2 ,
, xn ) ,而总体方差未知,
要求检验 μ  μ0 是否成立。
(1)提出原假设 H0:  0
(2)构造t统计量:t 
x  0
s
n
~ t (n  1)
(3)SPSS自动计算t值,并给出相应的P值
(4)根据用户给定的显著性水平  ,作出推断。
三.SPSS单样本t检验的操作步骤
菜单:
Statistics
——Compare means
——one-sample t test
四.实例
对“休闲调查.sav”中的“住房面积”
变量进行单个样本的T检验,
原假设(零假设)为:城市居民户均
住房面积为38平方米。
结论:
从表1看出,被调查的283户居民的平均住房
面积为38.417平方米,标准差为13.708平方米,
均方误差为0.815平方米。
从表2可以看出,检验值为38,样本均值与检
验值的差为0.417,t统计量的值为0.512,对应的
P值为0.609。差值的95%的置信区间跨0,为
(-1.187,2.021),表示有95%的样本差值将落
在这个区间内。
若给定的显著水平为0.05,由于概率P值=
0.609>0.05,故不能拒绝H0,即认为城市居民户均
住房面积为38平方米。
§6.3 两独立样本t检验
一. 什么是两独立样本t检验?
两独立样本t检验就是根据样本数据
对两个样本来自的两独立总体的均值是否
有显著差异进行推断。
进行两独立样本t检验的前提条件:
1.两样本应该是相互独立。
2.样本来自的两个总体应该服从正态分布。
二.两独立样本t检验的基本实现思路
设总体X1服从正态分布 N ( μ1 , σ12 ), 总体X2服
从正态分布 N ( μ2 , σ2 ) ,分别从这两个总体中
2
抽取样本 ( x11 , x12 ,
x1n1 )和( x21 , x22 ,
x2n2 ),
且两样本相互独立。要求检验 μ1和μ2 是否有
显著差异。
第一步,建立零假设 H 0 : μ1  μ2
第二步,判断两总体方差是否相等
采用Levene F检验方法,SPSS自动进行检验
零假设为两者方差相等。
若F值所对应的P值<显著水平,则认为两
总体方差不等
若F值所对应的P值>显著水平,则认为两
总体方差相等
第三步:构造t统计量
分两种情形:
1.两总体方差未知且相等。
x1  x2
t
S
2
p
n1  S
2
p
~ t ( n1  n2  2)
n2
(n1  1) S  (n2  1) S
其中 S 
n1  n2  2
2
p
2
1
2
2
2.两总体方差未知且不等。
t
x1  x2
S n1  S n2
2
1
2
2
~ t ( n)
2
1
2
2 2
S
S
(  )
n1 n2
n
2
2
S1 2
S2 2
( ) ( )
n1
n2

n1
n2
第四步,SPSS自动计算t值和对应的P值
第五步,作出推断:
若P值<显著水平  , 则拒绝零假设,
即认为两总体均值存在显著差异
若P值>显著水平  , 则不能拒绝零假设,
即认为两总体均值不存在显著差异
三.SPSS独立样本t检验的操作步骤
菜单:
Statistics
——Compare means
——Independent-sample T test
注意:在独立样本t检验的数据文件,两样
本的数据都是放在同一个变量中的,而另
外再用一个变量来标志样本所属的组别。
四.实例
两种激励方法A与B,对同样的工种
的A和B班组进行激励后,业绩增加
率见“独立激励实验.sav”, 检验两
种方法的平均激励效果有无显著差异
。
表1 两种激励法的独立样本T检验计算所得统计量值
Group Statistics
两法的 激励效果
(业绩增 长%)
AB两种激 励方法
A法
B法
N
7
7
Mean
17.0143
16.5143
Std. Deviation
.63095
.50474
Std. Error
Mean
.23848
.19077
从表1看出,两种方法的被调查人数均为7人,
A法的激励效果为业绩平均增长17.0143%,B
法的激励效果为业绩平均增长16.5143 %。
表2 两种激励法的独立样本T检验结果
Independent Samples Test
Levene's Test for
Equality of Variances
F
两 法的 激 励 效果
(业 绩 增 长 %)
Equal variances assumed
Equal variances not
assumed
.121
Sig.
.734
t-test for Equality of Means
12
Sig. (2-tailed)
.128
Mean
Difference
.5000
Std. Error
Difference
.30539
11.448
.129
.5000
.30539
t
1.637
df
1.637
95% Confidence
Interval of the
Difference
Lower
Upper
-.16540
1.16540
-.16897
1.16897
根据表2,Levene’s Test中F统计量的概率P值
=0.734>0.05,故不能拒绝方差相等的零假设,
可以认为两组数据的方差无显著差异,应该选
择方差相等假设下的T检验。对应第一行的T检
验结果。T统计量的值为1.637,对应的概率P值
=0.128>0.05,故不能拒绝原假设,认为激励
效果无显著差异。
§6.4 两配对样本t检验
配对样本是指对同一样本进行两次测试所获
得的两组数据,或对两个完全相同的样本在
不同条件下进行测试所得的两组数据。
一. 什么是两配对样本t检验?
两独立样本t检验就是根据样本数据
对两个配对样本来自的两配对总体的均值
是否有显著差异进行推断。
两配对样本t检验的前提条件:
1.两样本应该是配对的。
(两样本的观察值数目相同,
两样本的观察值的顺序不能随意更改)
2.样本来自的两个总体应该服从正态分布。
二.两配对样本t检验的基本实现思路
设总体X1服从正态分布 N ( μ1 , σ12 ), 总体X2服
从正态分布 N ( μ2 , σ2 ) ,分别从这两个总体中
2
抽取样本 ( x11 , x12 ,
x1n )和( x21 , x22 ,
x2n ),
且两样本相互配对。要求检验 μ1和μ2 是否有
显著差异。
第一步,引进一个新的随机变量 Y  X1  X 2
对应的样本值为( y1 , y2 ,
yi  x1i  x2i (i  1, 2,
yn ), 其中,
, n)
这样,检验的问题就转化为单样本t检验问题。
即转化为检验Y的均值是否与0有显著差异。
第二步,建立零假设 H0 : μY  0
第三步,构造t统计量
t
y
sy
n1
~ t ( n  1)
第四步,SPSS自动计算t值和对应的P值
第五步,作出推断:
若P值<显著水平  , 则拒绝零假设,
即认为两总体均值存在显著差异
若P值>显著水平  , 则不能拒绝零假设,
即认为两总体均值不存在显著差异
三.SPSS配对样本t检验的操作步骤
菜单:
Statistics
——Compare means
——Paired-sample T test
四.实例
将20名女性分成10对,每对中随机抽
取一人服用新药,另一人服用安慰剂
,测量血清胆固醇含量见pair.sav,
问新药是否影响血清胆固醇含量。
表1 服用两种药物的配对样本T检验计算所得统计量值
Paired Samples Statistics
Pair 1
NEWDRUG
PLACEBO
Mean
5.0800
5.5100
N
10
10
Std. Deviation
.61968
.64023
Std. Error
Mean
.19596
.20246
从表1看出,服用新药和和安慰剂的实验人
数分别有10人,其中服用新药后10人的平均血
清胆固醇含量为5.08;而服用安慰剂后10人的
平均血清胆固醇含量为5.51。
表2 服用两种药物的配对样本的相关系数
Paired Samples Correlations
N
Pair 1
NEWDRUG & PLACEBO
10
Correlation
.020
Sig.
.956
表2列出了两个变量之间的相关系数,即配
对变量的相关系数为r=0.02,对应答概率P值为
0.956>0.05通过了检验,可以认为两配对变量
无相关关系。
表3 服用两种药物配对样本T检验结果
Paired Samples Test
Paired Differences
Pair 1 NEWDRUG - PLACEBO
Mean
Std. Deviation
-.4300
.88198
Std. Error
Mean
.27891
95% Confidence
Interval of the
Difference
Lower
Upper
-1.0609
.2009
t
-1.542
df
Sig. (2-tailed)
9
.158
根据表3,两配对样本的配对差的均值为-0.43,
T统计量的值为-1.542,对应的概率P值
P=0.158>0.05,故不能拒绝原假设,可以认
为新药对胆固醇含量无影响。
独立样本与配对样本T检验的区别:
前者要求两样本相互独立,后者要求
两样本相互配对。
2. 两者的统计量不一样。
3. 前者需要考虑两总体方差相等和不等
两种情况,后者则不需要考虑方差是
否相等,通常来说方差是不等的。
1.