教育统计的理论与实践入门

Download Report

Transcript 教育统计的理论与实践入门

教育统计的理论与实践入门
徐宪斌
QQ:284021317
研究主题



能不能单纯利用算术平均数来比较不同班
级某科目成绩的高低?
怎么判断一个学生成绩的好坏?
学生数学成绩和物理成绩有没有关系,若
有,又是什么关系?
班级
能不能单纯利用算术
平均数来比较两个班
某科目成绩的高低?
初三(1)
两个班的平均成绩相同
但两者分布情况却不同
初三(2)
姓名
语文成绩
汪博文
120
孙运玺
121
王慧
124
刘太洲
90
黄圆美
87
闫家才
86
张宁
93
仲金
118
李玉洁
115
刘玉帅
108
徐志超
110
于绪禄
102
袁洪梅
99
于绪豹
105
吴召玲
100
仲其坤
100
结论

描述两个样本的水平至少需要两个指标!
①
集中变量:对一组数据集中趋势的度量,就是确定
描述这种数据特点的代表性的统计量。算术平均数
是最为常用的集中变量。总体平均数用  来表示;
样本平均数用M来表示。
②
离散变量: 描述数据的离中(集中特征,例如算术
平均数)趋势。常常用标准差来表示。
总体标准差:
样本标准差:

S(SD)
结论
 需要综合集中变量和离散变量两个指标进
行两样本成绩高低的比较,(事实上主要
还是要考虑抽样的误差)统计学中就是利
用t检验来实现这种比较的。
实例演练一
 研究问题:已知某初中2004-2005学年度
第二学期期末考试,初二(1)班的平均总
分为425分,初二(2)班的平均总分为
422分。请问:两个班的成绩哪个好?
 最常见的反应:初二(1)班好。×
 原因:样本大小/离散程度/单次测验的代表
性.
科学的比较:两独立样本t检验
 这种检验是通过对两个独立样本的平均数
的比较,看其来自的两个独立总体的平均
数是否有显著性差异。
 操作过程:Analyze/compare means/
Independent sample T test
有无差异性的判断:假设检验
 假设检验中的假设通常都认为比较双方没有
差异性,例如,认为初二(1)和初二(2)
班总成绩是一模一样的,然后计算出这种假
设出现的可能性,可能性用p来表示。
p
<0.05 显著*
<0.01 非常显著**
<0.001 极其显著***
>0.05
不显著
显著
拒绝假设
不显著
接受假设
延伸一
 研究问题:某数学老师对某班级进行了教学方法
的改革,已知在改革前,其班学生的数学全市统
考标准分为82.1分,改革三个星期后,学生的数
学全市统考标准分为86.8分。试问:改革前后学
生数学成绩有没有变化?
 分析:这里同样不能简单地认为改革后学生数学
成绩提高了!需要进行 t 检验,但是这里涉及的
仅仅是一个班级,因此也就不能用两独立样本 t
检验了,而需要运用配对样本 t 检验。
Paired sample T test (配对样本T检验)
 这种检验是通过对两个配对或相关独立样本的平
均数的比较,看其来自的两个配对或相关总体平
均数是否有显著性差异。
 操作过程:Analyze/compare means/ Paired
sample T test
延伸二
 研究问题:已知某初中2004-2005学年度第二学
期期末考试中,全校数学平均分为74.6分,大市
的统考平均分为76分,请问:该校的数学成绩处
在大市的什么水平?
 分析:这个问题涉及到一个样本和一个总体的比
较,需要用到进行单样本t检验,这种检验是把一
个样本平均数与总体平均数比较,检验其是否有
显著性差异。
 操作过程:Analyze/compare means/ Single
sample T test
延伸三:比较对象是两个以上时怎么办?
 研究问题:已知三个班的数学期末考试成
绩,试问:三个班的成绩有没有差异性?
 分析:这里所涉及的比较对象超出了两个,
因此不能运用t检验,三个及以上对象的
差异性比较需要运用F检验(方差分析)。
 操作过程:Analyze/compare means/
one-way ANOVA
方差分析结果怎么看?
F值是不是显著?
不显著:p>0.05
说明三个班
显著*:
中至少两个
p<0.05
班学生成绩
有差异性
多重事后比较:两两对象比较
1班和2班比
显著*:
p<0.05
1班和3班比
显著*:
p<0.05
2班和3班比
显著*:
p<0.05
阐述比较结果:例如,1班比2班好,3班比1班好,3班比2班好
三个班
级成绩
没有差
异性。
延伸四:频数差异怎么比较?
研究问题1:研究人员随机抽取了50名高三学生为样本,测
查他们对于高考改革的态度(赞成或者反对)。作“赞成”
回答的有22人,作“反对”回答的有28人。问,在对高考
改革的态度上是“赞成”人数和 “反对”人数是否平均分
配?
研究问题2:研究人员随机抽取了170名高三学生为样本,
测查他们对于高考改革的态度(赞成或者反对)。发现
这批学生中60名女生作“赞成”回答的有18人,作“反
对”回答的有42人;而在110名男生中,作“赞成”回
答的有22人,作“反对”回答的有88人。问,对待高考
改革态度上,有无性别差异性?



2
2
检验简介
检验解决两类问题:一是通过实际调查与观测
所得到的一批数据,其次数分布是否服从理论上
所假定的某一概率分布;二是对一批观测数据进
行双向多项分类后,检验这两类特征之间是独立
无关的还是具有相依相从、连带相关。例如性别
与对某个问题的态度是否有关系…,这里性别是
一个因素,可分男女两个类别,态度又是一个因
素,可分为赞同、不置可否、反对等多种类别。
(一)总体分布的假设检验(拟合良度检验)
 总体分布的假设检验(拟合良度检验)即
解决“从实际调查与观测所得到的一批数
据,某次数分布是否服从理论上所假定的
某一概率分布”的问题。
研究实例
 研究人员随机抽取了50名高三学生为样本,测查
他们对于高考改革的态度(赞成或者反对)。作
“赞成”回答的有22人,作“反对”回答的有28
人。问,在对高考改革的态度上是“赞成”人数
和 “反对”人数是否平均分配?
 操作:Analyze/Nonparametric Test/ Chi-square
test(卡方检验)。
(二)列联表的卡方检验(独立性检验)
——以2×2列联表为例
 2×2列联表就是把样本数据同时按两种特
征进行双向分类后形成两行两列的四格数
据列联表。2×2列联表下的检验就是利用
统计指标来检验特征A和特征B之间是独立
无关的还是相依相从连带相关。
研究实例
 研究人员随机抽取了170名高三学生为样本,测
查他们对于高考改革的态度(赞成或者反对)。
发现这批学生中60名女生作“赞成”回答的有18
人,作“反对”回答的有42人;而在110名男生
中,作“赞成”回答的有22人,作“反对”回答
的有88人。问,对待高考改革态度上,有无性别
差异性?
 操作:Analyze/descriptive Statistics/Crosstabs。把性别变量
送入rows框、把态度变量送入columns框中
小结
单样本:初二(1)班成
绩与大市成绩比
两对象
(t检验)
两独立样本:初二(1)
与初二(2)比较
连续性数值
配对样本:初二(1)班改
革前成绩与改革后成绩比较
数值
类型
三对象及以上:初二(1)、(2)、(3)班比
(F检验)
非连续数值:如
次数,人数。
分布检验:“赞成”与“反对”人数是否相
当。
列联表检验:态度有无性别差异性。
怎么判断一个学生成绩的好坏?
 总分100分的卷子,小明考了90分,请问
小明考得怎么样?
 小明政治考了90分,数学考了65分,请问
哪一门考得好?
 小明期中考试物理考了88分,期末考试考
了70分,请问小明进步还是退步?
注意:由于各考试的难易度不同,所以分值的价
值就不同,因此不能简单地运用粗分进行比较!
这就需要将粗分转化为标准分。
标准分数

①
它是一种以平均分数为参考点,以标准差为单位的,表示
一个分数在团体中所处位置的量数,常见的标准分数由
以下两种:
Z分数:
Z分数会出现负数和小数。
Z分数计算在SPSS中的实现: Analyze/descriptive
Statistics/descriptive。选中save standardized values as variables.
②
T分数:将原始分数转化为Z分数后,为了使用方便,再进
行一次线性变换,即转化为标准T分数,这样既体现了标
准分数的优越性又消除了负数和小数。例如广东省的高
考分值转化为
实例分析
 下表是两位高考考生的考试成绩,按传统卷面分
数累加的方法决定录取分数应录取乙同学,但考
试成绩除受到考生主观因素影响外,还受到难度,
区分度等客观因素影响。如果按标准分数求和,
录取结果是否一致?哪种方法更科学?
结果
学生数学成绩和物理成绩有没有关系,若有,又是什么关系?
 这种探求两变量之间关系的统计手段被称为相关
分析,相关分析是研究变量间关系密切程度的一
种统计方法。变量间关系的数量指标通常用相关
系数r来表示,其取值范围为[-1,+1],表明变量
间的密切程度,越接近1表明变量间相关密切程
度越高。正负号表明两变量发展变化的方向,如
果变化方向一致则为正相关(如身高与体重的关
系);变化方向不一致则为负相关(如吸烟与肺
功能的关系)。
 但是要注意相关关系并不是因果关系!
两种基础的相关
 Pearson积差相关(皮尔逊积差相关):
处理连续变量,例如数学成绩和物理成绩的关系。
操作过程:Analyze/Correlate/Bivariate,选中
Pearson(默认)。
 Spearman相关(斯皮尔曼等级):
处理非连续变量,例如求学生学习成绩排名与德
育排名的关系。
操作过程:Analyze/Correlate/Bivariate,选中
Spearman 。
谢谢!