第3章分析化学中的误差与数据处理

Download Report

Transcript 第3章分析化学中的误差与数据处理

第3章
分析化学中的误差与数据处理
3.1 分析化学中的误差
分析的核心是准确的“量”的概念, 凡是测量就
有误差, 减少测量误差是分析工作的重点之一.
3.1.1 误差和偏差
1. 真值 T (True value)
某一物理量本身具有的、客观存在的真实值。
真值是未知的、客观存在的量。在特定情况下认为是已知
的:
(1) 理论真值(如化合物的理论组成)
(2) 计量学约定真值(如国际计量大会确定的长度、质
量、物质的量单位等等)
(3) 相对真值(如高一级精度的测量值相对于低一级精度
的测量值)
• 2.误差(Error):
测定结果(x)与真实值(xT )之间的差值,用 E 表示.
• 1) 绝对误差(absolute error- Ea)
Ea = 测定值-真实值 = x - xT
• 2) 相对误差(relative Error)
表示误差在真实值中所占的百分率,分析结果的
准确度常用相对误差表示。
Ea
x  xT
Er 
100% 
100%
xT
xT
如:对于1000kg和10kg ,绝对误差相同(±1kg),但产生的相
对误差却不同。
1
Er 
100%  0.1%
1000
1
E r  100%  10%
10
• 绝对误差和相对误差都有正负之分。
• 3. 偏差
• 1) 算术平均值
• 对同一种试样,在同样条件下重复测定n次,结果分
别为:x1, x2,  xn
x1  x2   xn  xi
x

n
n
• 2) 偏差(devoation)
单次测量值与平均值之差绝对偏差。
di  xi  x
3) 算术平均偏差(mean deviation)
d
d1  d 2    d n
n
d


i
n
• 通常以单次测量偏差的绝对值的算术平均值即平均
偏差 d 来表示精密度。
4) 相对平均偏差(relative mena deviation)
d
d r  100%
x
注意:d 不计正负号,di则有正负之分。
例1:测定钢样中铬的百分含量,得如下结果:1.11,
1.16, 1.12, 1.15和1.12。计算此结果的平均偏差及相
对平均偏差。
• 解:
x

x
i
n
d

d
n
i
 1.13(%)
0.09

 0.02(%)
5
d
0.02
相对平均偏差‰  1000‰ 
1000‰  18‰
x
1.13
用 d 表示精密度比较简单。
该法的不足之处是不能充分反映大偏差对精密度的影响。
当测定 次数较多时,常使用标准偏差或相对标准偏
差表示一组平行测定值的精密度。
• 单次测定的标准偏差:
n
s
2
(
x

x
)
 i
i 1
n 1
• 相对标准偏差亦称变异系数(RSD 或sr):
s
sr   100%
x
•
标准偏差:通过平方运算,能将较大的偏差更显著
地表现出来,能更好地反映测定值的精密度。
4. 中位数(xM)-Median value
一组测量数据按大小顺序排列,中间一个数据即为中
位数xM,当测量值的个数位偶数时,中位数为中间相临两
个测量值的平均值。
优点:是能简单直观说明一组测量数据的结果,且不受两
端具有过大误差数据的影响;
缺点:是不能充分利用数据,因而不如平均值准确。
5. 极差(R)
极差(Range):衡量一组数据的分散性。一组测量数据
中最大值和最小值之差,也称全距或范围误差。
R = x max — x min
相对极差:
R
 100%
x
3.1.2 准确度与精密度
1、准确度 Accuracy
准确度表征测量值与真实值相符合的程度。
准确度用误差表示。反映测定的正确性,是系统
误差大小的量度。
2、精密度 precision
精密度表征平行测量值的相互符合程度。精密度
用偏差表示。有时用重复性(repeatability)和再现性
(reproducibility)表示不同情况下分析结果的精密度。
准确度与精密度的关系
D
例:A、B、C、D 四个分析工作者对同一铁标样
(WFe=37.40%)中的铁含量进行测量,得结果如图示,
比较其准确度与精密度。
表观准确度高,精密度低
(不可靠)
C
准确度高,精密度高
B
准确度低,精密度高
A
准确度低,精密度低
36.00
测量点
36.50
37.00
平均值
37.50
真值
38.00
• 结论:
1、精密度是保证准确度的前提。
2、精密度高,不一定准确度就高;
准确度高,精密度一定高。
3.1.3. 系统误差和随机误差
• 由于各种原因导致的误差,根据性质不同可区分为:系统
误差和随机误差两大类
• 1. 系统误差(systematic error)
• 由一些固定的原因所产生,其大小、正负有重现性,也叫
可测误差。
• 1)方法误差  分析方法本身所造成的误差。
• 2)仪器误差
• 3)试剂误差
• 4)操作误差  操作不当
系统误差的性质可归纳为如下三点:
• 1)重现性
• 2)单向性
• 3)可以校正。
2. 随机误差(random error)
• 随机误差由偶然因素引起的误差,所以又称偶然误差
• 如,同一坩埚称重(同一天平,砝码),得到以下克数:
•
29.3465,29.3463,29.3464,29.3466
对于天秤称量,原因可能有以下几种:
• 1)天平本身有一点变动性
• 2)天平箱内温度有微小变化
• 3) 坩埚和砝码上吸附着微量水分的变化
偶然误差的性质:
• 误差的大小、正负都是不固定的。
• 偶然误差不可测误差。
• 在消除系统误差后,在同样条件下多次测定,可发现
偶然误差服从统计规律。
系统误差与随机误差的比较
项目
系统误差
随机误差
产生原因
固定因素,有时不存在 不定因素,总是存在
分类
方法误差、仪器与试剂 环境的变化因素、主
误差、主观误差
观的变化因素等
性质
重现性、单向性(或周 服从概率统计规律、
期性)、可测性
不可测性
影响
准确度
精密度
消除或减
小的方法
校正
增加测定的次数
8. 公差
→公差:生产部门对于分析结果允许误差表示法,超出
此误差范围为超差,分析组分越复杂,公差的范围也大
些。
3.1.5 误差的传递
1.系统误差的传递
(1). 加减法
若 R = A + B - C,则
ER = EA + EB - EC
即分析结果的绝对误差是各测量步骤绝对误差的代数和
若 R = A + mB - C
则 ER = EA + mEB - EC
在误差计算中含相关系数 m
(2) .乘除法
A B
A B
若:R 
或 Rm
C
C
ER E A EB EC
则:



R
A
B
C
在乘除法的误差计算公式中,不考虑系数m
(3).指数关系
若:R  mA
n
ER
EA
则
n
R
A
(4).对数关系
EA
若:R  m lg A 则 ER  0.434m
A
2. 随机误差的传递
(1). 加减法
若:R  A  B  C,则:SR2  S A2  SB2  SC2
分析结果的标准偏差的平方是各测量步骤标准偏差的平方和。
若带有系数,则系数也相应平方
即:R  aA  bB-cC,则:SR2  a2 S A2  b2 SB2 +c2 SC2
(2). 乘除法
A B
A B
若:R 
或 Rm
C
C
S R2 S A2 S B2 SC2
则: 2  2  2  2
R
A B C
在乘除法的误差计算公式中,不考虑系数m
(3).指数关系
若:R  mAn 则 (
SR 2
S
S
S
)  n 2( A ) 2 或 R  n A
R
A
R
A
(4).对数关系
SA
若:R  m lg A 则 SR  0.434m
A
例 设天平称量的标准偏差S=0.1mg,求称量试样时的标准偏差Sm
解:称取试样时,无论是用差减法,或固定称量法,都需要称量
两次,读取两次平衡点,试样质量是两次称量所得质量之差,即
m=m1-m2
故:
Sm2  S22  S12
Sm  S  S  2S  0.14 (mg )
2
1
2
2
2
例:用移液管移取NaOH溶液25.00mL,用0.1000mol/L HCl标准溶
液滴定,用去30.00mL,已知用移液管移溶液时的标准偏差
S1=0.02mL,滴定管读数每次S2=0.01mL
设HCl溶液浓度准确,计算标定NaOH溶液浓度时的标准偏差
解:
CNaOH
由误差传递
CHClVHCl 0.1000  30.00


 0.1200 mol / L
VNaOH
25.00
Sc2
2
CNaOH

SV21
V12

SV22
V22
SV22  S22  S22
V1  25.00, V2  30.00
SC  CNaOH
滴定管要读两次
0.02 2
0.01 2
(
)  2(
)  0.0001 mol / L
25
30
仅最后一位相差1,所以偏差极小
3. 极值误差
即:考虑在最不利的情况下,由各步骤带来的误差相互叠加。
(也有相互抵消)
若:R  aA  bB  cC,则:ER aEA+bEBcEC
例如:滴定时读滴定管两次,极值误差±0.02mL
所以,在滴定时,为了使读数误差<0.1%,一般体积>20mL
天平称量两次读数,极值误差±0.0002mg
所以,在称量时,为了使读数误差<0.1%,一般质量>0.2mg
A B
A B
若:R 
或 Rm
C
C
则极值相对误差
E
ER
E
E
 A  B  C
R
A
B
C
例:用间接法测定Cu含量,若测量相对误差均为0.1%,问Cu的
质量分数的极值相对误差为多少?
解:计算公式为:
CNa2 S2O3 
mK2Cr2O7  6 1000
若误差0.1%
M K2Cr2O7  VNa2 S2O3
则:CNa2S2O3的极值相对误差为0.2%
0.2% 0.1%
Cu % 
CNa2 S2O3VNa2 S2O3 103  M Cu
mS
100%
0.1%
则:Cu%的极值相对误差为0.4%
有时误差可相互抵消
3.2 有效数字及其运算规则
3.2.1
有效数字
有效数字—significant figure
分析工作中实际能测量到的数字,包括全部
可靠数字及一位不确定数字在内。
有效数字位数由仪器准确度决定,它直接影
响测定的相对误差。
有效数字位数的确定
a 数字前0不计,数字后计入 : 0.03400
b 数字后的0含义不清楚时, 最好用指数形式表示 : 1000
(1.0×103, 1.00×103, 1.000 ×103)
c 自然数和常数可看成具有无限多位数(如倍数、分数关系)
d 不能因为变换单位而改变有效数字的位数。
0.0345g=34.5mg=3.45×104μg
e 对数 (如pH, pM, lgK等)的有效数字位数按尾数计,如
pH=10.28, 则[H+]=5.2×10-11
f 误差只需保留1~2位
m ◇分析天平(称至0.1mg):
12.8228g(6) ,
0.2348g(4) ,
0.0600g(3)
◇千分之一天平(称至0.001g): 0.235g(3)
◇1%天平(称至0.01g):
◇台秤(称至0.1g):
4.03g(3), 0.23g(2)
4.0g(2), 0.2g(1)
V ☆滴定管(量至0.01mL):
26.32mL(4), 3.97mL(3)
☆容量瓶: 100.0mL(4), 250.0mL (4)
☆移液管: 25.00mL(4);
☆量筒(量至1mL或0.1mL): 25mL(2), 4.0mL(2)
1.0008
43.181
5位
0.1000
10.98%
4位
0.0382
1.98×10-10
3位
54
0.0040
2位
0.05
2×105
1位
3600
100
位数比较模糊
3.2.2有效数字的修约规则
“四舍六入,五后有数就进一,五后无数(或是0)看
单双”
修约数字时,只允许对原测量值一次修约到所需要的
位数,不能分次修约。
有效数字的修约:
0.32554 (修为4位) → 0.3255
0.036236 (修为4位) → 0.03624
10.2150 (修为4位) → 10.22
150.65 (修为4位) → 150.6
75.55496 (修为4位) → 75.55
16.0851 (修为4位) → 16.09
22.4450 (修为4位) → 22.44
禁止分次修约
0.57
0.5749
×
0.575
0.58
运算时可多保留一位有效数字进行
3.2.3 运算规则
• 加减法:当几个数据相加减时,有效数字位数,应以小
数点后位数最少的数据为准,因小数点后位数最少的数
据的绝对误差最大。
• 例:
0.0121+25.64+1.05782=?
绝对误差
±0.0001 ±0.01
±0.00001
在加合的结果中总的绝对误差值取决于25.64。
0.01+25.64+1.06=26.71
* 乘除法:当几个数据相乘除时,有效数字位数,应以有
效数字位数最少的数据为准,因有效数字位数最少的数
据的相对误差最大。
例:
相对误差
0.0121 × 25.64 × 1.05782=?
±0.8%
±0.4%
±0.009%
结果的相对误差取决于 0.0121,因它的相对误差最大,
所以
0.0121×25.6×1.06=0.328
乘除法运算中,若遇到9以上的大数,如9.00,9.86
等,通常将其作四位有效数字处理。
NaOH
例
CaCO3  2HCl  CaCl 2  H2CO3  HCl(过量)
H2O+CO2
w  CaCO 3  =
1
 0.1000  25.00  0.1000  24.10  M ( CaCO3 )
2
ms  103

 0.1000  25.00  0.1000  24.10  100.1/ 2
0.2351  10
 0.0191599  ?0.0192
3
在计算分析结果时,高含量(大于10%)组分的测定,
一般要求四位有效数字;含量在1%~10%的组分一般要求
三位有效数字;含量小于1%的组分一般要求两位有效数字。
→分析中各类误差的通常取1 至 2位有效数字
3.3 分析化学中的数据处理
总体(或母体):所考查对象的某特性值的全体。
样本(子样):自总体中随机抽出的一组测量值
样本大小(或容量):样本中所含测量值的数目
若样本容量为n,平均值
1
x 
n
x
对无限次测定,平均值即为总体平均值
lim 1
 
n n

x
n  时, x  
没有系统误差时,µ 就是真实值 xT
单次测量的平均偏差
当 n < 20
x


n
 xx 

d
n
用统计方法处理数据时,广泛采用标准偏差来衡量
数据的分散程度.
标准偏差
1、总体标准偏差
当测量次数为无限多次时,各测量值对总体平均值μ
的偏离,用总体标准偏差σ表示。

 (x  )
2
n
避免单次测量偏差相
加时正负抵消;大偏差能
更显著地反映出来。
2、样本标准偏差
S
2
(
x

x
)

n 1
测量值不多, μ不知
时,用来衡量数据的分散
程度。
当n  ,x  
lim
n
2
(
x

x
)

n 1

2
(
x


)

n
此时, S  
3、相对标准偏差
单次测量的相对标准偏差(亦称变异系数,sr或RSD %)为:
s
sr  100%
x
例:甲乙两组测量数据,各10次测定,偏差分别为:
甲:+0.3
-0.2
-0.4 +0.2
+0.1
+0.4
0 -0.3
+0.2
-0.3
乙:0 +0.1 -0.7﹡ +0.2 -0.1 -0.2 +0.5﹡ -0.2 +0.3 +0.1
甲的平均偏差:
d甲  0.24
乙的平均偏差:
d 乙  0.24
用标准偏差表示:
S甲 
d
2
n 1
  0.28
S乙 
2
d

n 1
数据平方后较大的偏差可显示出来

 0.33
4、标准偏差与平均偏差的关系
当 n > 20 时,
=0.7979  0.80
δ:测定次数非常多时的平均偏差
4  3
当 n < 20,则用
d
表示
3.3.1 随机误差的正态分布
1
频数分布
例: 在相同条件下对某样品中镍的质量分数(%)进行重
复测定,得到90个测定值如下:
1.60
1.59
1.65
1.70
1.53
1.49
1.66
1.60
1.60
1.67
1.64
1.70
1.63
1.56
1.56
1.63
1.63
1.64
1.67
1.74
1.63
1.67
1.58
1.57
1.54
1.62
1.65
1.64
1.65
1.62
1.70
1.60
1.61
1.66
1.61
1.59
1.58
1.64
1.70
1.70
1.58
1.61
1.64
1.65
1.58
1.64
1.61
1.65
1.63
1.59
1.61
1.64
1.61
1.59
1.67
1.65
1.68
1.57
1.61
1.50
1.64
1.64
1.60
1.62
1.69
1.66
1.59
1.62
1.53
1.62
1.63
1.67
1.57
1.64
1.69
1.62
1.55
1.53
1.62
1.54
1.68
1.60
1.63
1.70
1.60
1.52
1.59
1.65
1.61
1.69
分组:容量大时分为10-20组,容量小时(n<50)分为5-7组,
本例分为9组;
极差:R=1.74%-1.49%=0.25%;
组距:组距= R/9=0.25%/9=0.03%。
每组内两个数据相差0.03%即:1.48-1.51,1.51-1.54等等。
为了使每一个数据只能进入某一组内,将组界值较测定值
多取一位。即:1.485-1.515,1.515-1.545,1.545-1.575等等。
统计频数:测定值落在每组内的个数(称为频数),
相对频数:计算出数据出现在各组内的频率(即相对频数)。
分组(%)
1.485-1.515
1.515-1.545
1.545-1.575
1.575-1.605
1.605-1.635
1.635-1.665
1.665-1.695
1.695-1.725
1.725-1.755
∑
频数
频率
2
6
6
17
22
20
10
6
1
90
0.022
0.067
0.067
0.189
0.244
0.222
0.111
0.067
0.011
1.00
平均值:1.62
特点:
1.离散特性(σ)
2.集中趋势(μ)
频率分布的直方图
2
正态分布
正态分布,又称高斯分布,它的数学表达式即正态分布函
数式为:
y  f ( x) 
1
 2

e
( x )2
2 2
y  f ( x) 
1
 2

e
( x )2
2 2
μ决定曲线的位置,
σ决定曲线的形状
(是从μ到曲线拐点的距离)
μ
0
x
x -μ 随机误差的正态分布曲线
正态分布曲线(μ相同,σ2>σ1)
综上所述,一旦μ和σ确定后,正态分布曲线的位置和形
状也就确定,因此μ和σ是正态分布的两个基本参数,这种正态
分布用 N(μ,σ2)表示。
正态分布曲线具有以下特点:
1.集中趋势
当 x =μ时,y值最大,说明零误差出现的概
率最大。即:大多数测量值集中在算术平均值附近。
2.对称性
曲线以 x =μ这一点的垂直线为对称轴,表明绝
对值相等的正负误差出现的概率相等。
3.有界性 当 x 趋向-∞或+ ∞时,曲线以 x 为渐近线,说明小
误差出现的概率大,大误差出现的概率小。
4、当x=μ时,概率密度
y( x   )
1

 2
σ越大,精密度越差,分布曲线越平
σ越小,精密度越高,分布曲线越陡
计算某区间变量出现的概率,也即计算某取值范围的误
差出现的概率:
y  f ( x) 

1
( x )2
e
 2
2 2
-∞< x <+∞
1
P(<x <+) 
 2



计算与μ和σ有关,计算麻烦。

e
( x   )2
2 2
dx  1
令:
代入:
得:
由于:
则:
故:
u
x

y  f ( x) 
u: 以σ为单位的随机误差
 2
1
y  f ( x) 
e
 2
du 
dx


1
e
( x )2
2 2
u2

2
 dx   du
u2

2
1
f ( x)dx 
e du  (u )du
2
u2

1
y   (u ) 
e 2
2
1
y   (u ) 
e
2
u2

2
标准正态分布曲线,符号 N(0,1)
经过上述变换,总体平均值为μ的任一正态分布均可化
为μ=0,σ2=1 的标准正态分布,以N(0,1)表示。标准正态
分布曲线的形状与μ和σ的大小无关。
标准正态分布曲线
3
随机误差的区间概率
正态分布曲线与横坐标之间所夹的总面积,就等于概率密
度函数从-∞至+∞的积分值。它表示来自同一总体的全部测定值
或随机误差在上述区间出现概率的总和为100%,即为1。
P


 (u )du 
1
2



e
u2

2
du  1
欲求测定值或随机误差在某区间出现的概率P,可取不同
的 u 值对上式积分求面积而得到。
例如随机误差在±σ区间(u=±1),即测定值在μ±σ区间
出现的概率是:
P(1  u  1) 
1
u2
1 
2
1

2
e
du  0.683
1
2
概率 = 面积 =
u

u
0
e
u2

2
du
P57
x

随机误差出现的区间 测定值出现的区间
概率
u=±1
x=μ±σ
0.3413×2=0.683
u=±2
x=μ±2σ
0.4773×2=0.955
u=±3
x=μ±3σ
0.4987×2=0.997
|u|
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
正态分布概率积分表 P57
面积
|u|
面积
|u| 面积
0.0000 1.1
0.3643
2.2 0.4821
0.0398 1.2
0.3849
2.2 0.4861
0.0793 1.3
0.4032 2.3 0.4893
0.1179 1.4
0.4192
2.4 0.4918
0.1554 1.5
0.4332
2.5 0.4938
0.1915 1.6
0.4452
2.58 0.4951
0.2258 1.7
0.4554
2.6 0.4953
0.2580 1.8
0.4641
2.7 0.4965
0.2881 1.9
0.4713
2.8 0.4974
0.3159 1.96
0.4950 3.0 0.4987
0.3413 2.0
0.4773
∞ 0.5000
以上概率值表明,对于测定值总体而言,随机误差
在±2σ范围以外的测定值出现的概率小于0.045,即20次
测定中只有1次机会。随机误差超出±3σ的测定值出现的
概率更小。平均1000次测定中只有3次机会。通常测定仅
有几次,不可能出现具有这样大误差的测定值。如果一旦
发现,从统计学的观点就有理由认为它不是由随机误差所
引起,而应当将其舍去,以保证分析结果准确可靠。
概率积分面积表的另一用途是由概率确定误差界限。例
如要保证测定值出现的概率为0.95,那么随机误差界限应为
±1.96σ。
例1 经过无数次测定并在消除了系统误差的情况下,测得某
钢样中磷的质量分数为0.099%。已知σ=0.002%,问测定值
落在区间0.095%-0.103%的概率是多少?
解:由
u
x

0.103  0.099
u1 
2
0.002
0.095  0.099
u2 
 2
0.002
|u|=2,由表3-1查得相应的概率为0.4773,则
P(0.095%≤x≤0.103%)=0.4773×2=0.955
例2 对烧结矿样进行150次全铁含量分析,已知结果符合
正态分布(0.4695,0.00202)。求大于0.4735的测定值可能出
现的次数。
解:
u
x

0.4735  0.4695

2
0.0020
查表,P=0.4773,故在150次测定中大于0.4773的测定值出
现的概率为:
0.5000-0.4773=0.0227
150×0.0227≈3
例3:一样品,标准值为1.75%,测得 = 0.10, 求结果落在(1)
1.750.15% 概率;(2)测量值大于2 %的概率。
(1)解:
u
x

0.15

 1.5
0.10
查表:u=1.5 时,概率为:2  0.4332 = 0.866 = 86.6 %
(2)解:
2  1.75
u
 2.5
0.10
0.40
查表:u >2.5 时,概率为:
0.30
y
0.5 – 0.4938 = 0.0062
=0.62%
86.6%
P
0.20
0.10
0.00
-3
-2
-1
0
u
1
2
3
0.62%
3.3.2 总体平均值的估计
1. 平均值的标准偏差
设有一样品,m 个分析工作者对其进行分析,每人测 n 次,
计算出各自的平均值。
试样总体
样本1
样本2
……
样本m
x11, x12 , x13,......x1n  x1
x21, x22 , x23,......x2 n  x2
......
xm1 , xm 2 , xm3 ,......xmn  xm
x1 , x2 , x3 .......xm  x
平均值的总体标准偏差:
x 

n
对有限次测量:
sx 
s
n
纵座标为
sx
的相对值
在实际分析工作中,一般测定3~4次,由图知:当n>5,
偏差已较小,所以对要求准确度较高的分析,可测定5~9次,
当n>10,偏差改变已很小了。
同理,平均值的平均偏差
无限多次测定
有限次测定
x 

n
d
dx 
n
例:某试样中铝的质量分数4次测定值为:1.62%,1.60%,
1.30%,1.22%。计算平均值的平均偏差及平均值的标准偏差
解:
1.62  1.60  1.30  1.22
x
 1.44 (%)
4
x

d
i
4
 x
 0.18%
S
d
0.18%
dx 

 0.09%
n
4
S
0.20%
Sx 

 0.10%
n
4
2
d
 i
4 1
 0.20%
2. 少量实验数据的统计处理
在实际工作中,通过有限次的测定是无法得知μ和σ的,
只能求出平均值和S。而且当测定次数较少时,测定值或随机
误差也不呈正态分布,这就给少量测定数据的统计处理带来了
困难。此时若用S代替σ从而对μ作出估计必然会引起偏离,而
且测定次数越少,偏离就越大。如果采用另一新统计量tP,f取
代 u (仅与P有关),上述偏离即可得到修正。
(1)t分布曲线
定义:
x 
t
Sx
t:置信因子
以 t 为统计量的分布称为 t 分布,
说明 n不大时(n<20) 随机误差的分布规律。
t分布曲线
f <10时,与正态分布曲线差别较大;
f >20时,与正态分布曲线很接近;
f→∞时,与正态分布曲线严格一致。
t值 P
f(n-1)
1
2
3
4
5
6
7
8
9
10
20
30
60
120
∞
表3-3 tP,f值表(双边)
90%
95%
99%
6.31
2.92
2.35
2.13
2.02
1.94
1.90
1.86
1.83
1.81
1.72
1.70
1.67
1.66
1.64
12.71
4.30
3.18
2.78
2.57
2.45
2.36
2.31
2.26
2.23
2.09
2.04
2.00
1.98
1.96
63.66
9.92
5.84
4.60
4.03
3.71
3.50
3.35
3.25
3.17
2.84
2.75
2.66
2.62
2.58
99.5%
127.32
14.98
7.45
5.60
4.77
4.32
4.03
3.83
3.69
3.58
3.15
(3.01)
(2.87)
2.81
2.81
表中置信度用P表示,它表示在某一 t 值时,测定值落在
(μ± ts)范围内的概率。显然,落在此范围之外的概率为(1-P),
称为显著性水准,用α表示。
(2)平均值的置信区间
如前所述,只有当测定次数n 无穷大时,才能得到最可靠的
分析结果。显然这是做不到的。平均值 x 总带有一定的不确定性,
只能在一定置信度下,根据 x 值对
由定义:
u

可能存在的区间作出估计。
x  

当用单次测量结果(x)来表示总体平均值时,其表达式为:
  x  u
对 n 次测定,若以样本平均值来估计总体平均值可能存在的区间:
则,置信区间
  x  u x  x  u

n
对于少量测量数据,必须根据 t 分布进行统计处理:
置信区间
ts
  x  tsx  x 
n
上式表示在一定置信度下,以平均值 x 为中心,包括总体平
均值
的范围
该范围越小,测定的准确度越高。由该式可知,当P一定时,
置信区间的大小与tP,f、S、n均有关,而且tP,f与S实际也都受 n 的
影响,即 n 值越大,置信区间越小。
例:对某试样Cl-的质量分数4次测定结果如下:(%)47.64
47.69
47.52
47.55,计算置信度为90%、95%、99%时总体平均
值 µ 的置信区间。
解:
47.64  47.69  47.51  47.55
x
 47.60%
4
S
 ( x  x )  0.08%
4 1
置信度为90%,t0.10,3=2.35
ts
2.35  0.08
x
 47.60 
 47.60  0.09%
n
4
置信度为95%,t0.05,3=3.18
ts
3.18  0.08
x
 47.60 
 47.60  0.13%
n
4
置信度为99%,t0.01,3=5.84
ts
5.84  0.08
x
 47.60 
 47.60  0.23%
n
4
计算结果可以理解为:通过4次测定,有90%、95%、99%的
把握,认为真实值在…….范围之内。
由上例可知,置信度越高,置信区间越宽。
实际工作中,置信度不能定的过高或过低。分析化学中,
一般将置信度定在95%或90%。
例、测定某试样中SiO2 质量分数得s=0.05%。若测定的
精 密 度 保 持 不 变 , 当 P=0.95 时 , 欲 使 置 信 区 间 不 超
过 0.05% ,问至少应对试样平行测定多少次?
解:根据
x    t P , f
已知s=0.05%,故:
s
 0.05%
n
t
0.05

1
0.05
n
查表3-3得知,当 f = n – 1 = 5时,t0.95,5 = 2.57,
此时 2.57 / 6  1
即至少应平行测定6次,才能满足题中的要求。
3.4 显著性检验
为什么进行显著性检验?
在分析工作中,对样品进行分析往往会得到下列情况:
a.测定结果的平均值与标准值不完全一致
b.两种分析方法或不同分析人员对同一试样进行分析时,所得
两组平均值有一定差异。
为了判断测定值的差异是由系统误差引起的还是由偶然误差
引起的,所以要进行显著性检验
什么叫显著性检验?
用统计的方法检验测定值之间是否存在显著性差异,以此
推断它们之间是否存在系统误差,从而判断测定结果或分析方
法的可靠性,这一过程称为显著性检验。
定量分析中常用的有t检验法和F检验法。
3.4.1
t 检验法
1. 平均值与标准值的比较
先计算统计量t
根据平均值的置信区间的定义
ts
  x  tsx  x 
n
t
x 
sx

x 
s
n
计算t 值与表3-3中的 tα,f 进行比较
(查表时,一般取95%的置信水平的 ta,f 值)
若 t > tα,f ,测定结果存在显著性差异,(有系统误差)
若 t < tα,f ,测定结果不存在显著性差异,(无系统误差)
•例如:用某种新方法测定分析纯NaCl中氯的百分比含量。10次
测试结果为60.64,60.63,60.67,60.66,60.70,60.71,60.75,
60.70,60.61,60.70 。已知试样中氯的真实值为60.66%。问这
种方法是否准确可靠?
解:
n  10,
Sx
t 
f  9, x  60.68%
S

 0.014
n
x 
Sx

60.68  60.66
0.014
 1.43
置信度为95%时,f = n-1 = 9,
查表: t 0.05,9 = 2.26
t < t a,f
故:可以认为此方法没有系统误差。也即这种新方法准确可靠。
2. 两组平均值的比较
设两组分析数据为:
n1 s1 x1
n2 s 2 x 2
如 F 检验法证明两精密度之间无显著性差异,可认为S1≈S2
求合并标准偏差
偏差平方和
s
=
总自由度
或
s
2
2
(
x

x
)

(
x

x
)
 1i 1  2i 2
 n1  1  (n2  1)
s12  n1  1  s22 (n2  1)
 n1  1  (n2  1)
x1  x2
计算 t 值: t 
s
n1  n2
n1  n2
总自由度:f = n1+n2-2,查表3-3,95%置信水平 t 值
若 t > tα,f ,可认为存在显著性差异,(有系统误差)
若 t < tα,f ,无显著性差异。(无系统误差)
3.4.2
F 检验法
F检验法主要是比较两组数据的方差S2,
以确定它们的精密度是否有显著的差异。
用于在 t 检验中两个样本的S1和S2合并前,确
定他们的精密度有无显著性差异。再进行 t 检验。
步骤:
•首先计算出两个样本的标准差S大
和S小,然后计算F值。
F
2
大
2
小
s
s
•如果两组数据的精密度相差不大,F 值趋近于 1。相反,如果他
们两者之间存在显著性差异,则 F 值一定很大,在一定的置信度
及自由度的情况下,
•若:F > F表,则认为它们之间存在显著性差异。
注意:
表中 F 值属单边检验值,检验某组数据的精密度是否大于
或等于另一组数据的精密度,置信度为95%,
若判断两组数据之间是否有显著性差异,则表中F 值属双
边检验值,置信度为90%。
置信度95%时部分F值(单边)
置信度90%时部分F值(双边)
f大
2
3
4
5
6
2
19.00
19.16
19.25
19.30
19.33
3
9.55
9.28
9.12
9.01
8.94
4
6.94
6.59
6.39
6.16
6.09
5
5.79
5.41
5.19
5.05
4.95
6
5.14
4.76
4.53
4.39
4.28
f小
例:在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,
得S1=0.055,用一台新仪器测定4次,得S2=0.022,问:
(1)两种方法的精密度之间有无显著性差异?
(2)新仪器精密度是否显著优于旧仪器的精密度?
解:
n1  6 S1  0.055 S  0.055  0.0030
2
大
2
n2  4 S2  0.022 S  0.022  0.00048
2
小
2
F
查表7-4,
2
大
2
小
s
s
0.0030

 6.25
0.00048
f大:6 1=5
f小:4 1=3
交界:F表=9. 01
F < F表
判断:(1)两种分析方法精密度间无显著性差异,置信度为90%。
(2)新仪器的精密度不能显著地优于旧仪器的精密度,置信
度为95%。
3.5
异常值的取舍
平行测定的数据中,有时会出现个别与其结果相差较
大的测定值,称为可疑值或异常值。对于为数不多的测定数据,
可疑值的取舍往往对平均值和精密度造成相当显著的影响。
为什么取舍可疑值?
实质是区分可疑值与其它测定值之间的差异到底是由
过失、还是随机误差引起的。如果已经确证测定中发生过失,
则无论此数据是否异常,一概都应舍去;而在原因不明的情况
下,就必须按照一定的统计方法进行检验,然后再作出判断。
根据随机误差分布规律,在为数不多的测定值中,出现
大偏差的概率是极小的,因此通常就认为这样的可疑值是由过
失所引起的,而应将其舍去,否则就予以保留。
3.5.1 4d 法
根据正态分布规律,偏差超过3σ的个别值的概率小于
0.3%,故这一测量值可以舍去。
由3σ≈4δ,则偏差超过4 δ的测量值可舍去。
对少量测定数据:
S 代替,d 代替,则偏差大于4d 可舍去
步骤:
求出除异常值外的其余数据的平均值和平均偏差。
可疑值- x 4d , 可舍去
可疑值- x 4d , 则保留
为什么取绝对值?
该方法简便,但误差较大
例:测定某药物中钴的含量得结果如下:
1.25、1.27、1.31、1.40 (μg/g),问1.40是否应保留?
解:1.40除外,求平均值
1. 25+1. 27+1. 31
x=
=1.28,d  0.023
3
- 1. 28   d (0.092) 1.40应舍去
问:是否还要检验1.25呢?
3.5.2 Grubbs法
步骤
将结果从小到大排列为: x1 x2, x3……, xn-1, xn,
其中 x1 或 xn可能为异常值
计算出该组数据的平均值 ( x )和标准偏差 ( s ) 。
计算统计量T,
设x1是可疑值, 则
x  x1
T 
s
若xn是可疑值, 则
xn  x
T 
s
查表:P.67表3-5
Tα,n值表
该方法的准确度较Q法高
若 T >T(表) ,则异常值应舍去
若T <T(表) ,则异常值应保留
例:测定某药物中钴的含量得结果如下:
1.25、1.27、1.31、1.40 (μg/g),问1.40是否应保留?
解:
1. 25+1. 27+1. 31+1. 40
x=
=1.31,S  0.066
4
xn  x 1.40  1.31
T 

 1.36
s
0.066
应保留
T 表:  0.05,n=4, T=1. 46
4d法检验应舍去,以Grubbs法为准
3.5.3 Q 检验法
1、将测定值由小至大排列,其中可疑值为x1或xn。
2、计算舍弃商Q 值
x2  x1
xn  x n 1
Q
或 Q
xn  x1
x n  x1
3、查表3-6,Q 值表:
若Q > Q(表),舍弃
若Q < Q(表),保留
分析化学中通常取 90% 置信度的Q值。
表3-6 QP,n值表
n
P
Q0.9
Q0.95
3
4
5
6
7
8
9
10
0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41
0.97 0.84 0.73 0.64 0.59 0.54 0.51 0.49
例:测定某药物中钴的含量得结果如下:
1.25、1.27、1.31、1.40 (μg/g),问1.40是否应保留?
解:
1. 40-1. 31
Q=
=0.60
1. 40- 1. 25
n=4, Q表=0.76,Q<Q表 , 1.40应保留
上述讲了三种异常值的取舍方法,平时做实验,如
遇到偏差较大的数据,也可用这种方法检验。
3.6 回归分析法
A=KC
No.
标样浓度
吸收值
g / L
标准工作曲线
0.400
5.00
0.045
0.300
2
10.0
0.093
0.200
3
20.0
0.140
0.100
4
30.0
0.175
0.000
5
40.0
0.236
6
试样
0.200
A
1
y = 0.0056x + 0.0161
R 2 = 0.984
0.0
10.0
20.0
30.0
40.0
50.0
浓度(ug / mL)
问题: 1、每个测量值都有误差,标准曲线应怎样作才合理?
2、应怎样估计线性的好坏?
3.6.1 线性回归 Linear regression
1、每个测量值都有误差,标准曲线应怎样作才合理?
——线性回归问题
最小二乘法 method of least squares
设对y作n次独立的观测,得到一系列观测值。
i  1, 2, n
一元线性回归方程表示为: y  a  bx
( xi , yi ),
根据最小二乘法的原理,最佳
的回归线应是各观测值yi 与相
对应的落在回归线上的值之差
的平方和(Q)为最小。
Q
n
(y
i 1
i
 a  bxi )
y
yi
x
2
Q
n
2
(
y

a

bx
)
 i
i
i 1
n
Q
 2 xi ( yi  a  bxi )  0
b
i 1
n
Q
 2 ( yi  a  bxi )  0
a
i 1
令:
解得:
a
n
n
i 1
i 1
 yi  b xi
n
n
 y  bx ,
b
 ( xi  x )( yi  y )
i 1
n

i 1
n
其中: y
1
  yi ,
n i 1
n
1
x   xi
n i 1
( xi  x ) 2
3.6.2 相关系数 Correlation coefficient
应怎样估计线性的好坏?——相关系数的问题
判断一元回归线是否有意义,可用相关系数来检验。
相关系数的定义为:
n
r b
n
 (x
 x)
(y
 y)
i 1
n
i 1
i
i
 (x
2

2
i 1
i
 x )( yi  y )
n
n
i 1
i 1
2
2
(
x

x
)
(
y

y
)
 i
 i
相关系数的物理意义如下:
a. 当所有的数据值都在回归线上时,r = 1。
b. 当 y 与 x 之间完全不存在线性关系时,r =0。
c. 当 r 值在 0 至 1 之间时,表示 y 与 x 之间存在相关关系。
r 值愈接近1,线性关系就愈好。
相关系数的临界值表 P71
若 r> r表,则表示两变量间是显著相关的,所求直线
有意义;反之,则无意义。
相关系数的临 界值表(部分)P71

f = n-2
0.10
0.05
0.01
0.001
1
0.988 0 .997 0.9998
0.999999
2
0.900 0.950
0.990
0.999
3
0.805 0.878
0.959
0.991
例:做了一条工作曲线,测量次数 n = 5, r = 0.920, 因
变量与自变量之间有无相关性(置信度95%)?
解:
f = 5 – 2 = 3,  = 0.05, 查表 r表 = 0.878,
r > r表, 有相关性
3.7 提高分析结果准确度的方法
以上讲了误差及分布规律,在分析工作中,就要尽量减少误
差,以提高分析结果的准确度。
1.选择合适的分析方法
常量组分>1%,选择滴定分析法、重量分析法
特点:准确度高,灵敏度低。
40.20%铁,Er:±0.2% ,则质量范围(40.12 ~ 40.28)%
微量组分<1%,选择分光光度分析、仪器分析
特点:灵敏度高,准确度低。
0.40%铁,Er:±2% ,Ea=0.008%
2、 减小测量误差
称量
分析天平的绝对误差
一次称量
常量分析 Er < 0.1%,
Ei= 0.0001 g
Ea = 0.0002 g
Ea 0.0002
样品重 

 0. 2 g
Er
0.1 %
光度分析 Er < 2%, 则称0.5g样,用千分之一分析天平即可。
Ea  样品重 E  0.5g  2%  0.01g
滴定
体积读数
一次滴定
Ei = 0.01 mL
Ea = 0.02 mL
Ea
 0.02  20mL
常量分析 Er < 0.1%, 滴定体积 
E r 0.1%
3、减小随机误差
增加平行测定次数。
采用多次测定:平时测定3~4次
若存在系统误差,即使分析工作者再细心,也得不出正确
结果,因此,必须设法消除测量过程中的系统误差,提高分析结
果的准确度。
对照试验
空白试验
4、消除系统误差
校准仪器
校正测量方法
标准样品对照:看测定值是否与标准值一
致,加以校正
标准方法对照:用国标方法对照分析,看
结果是否与测定值一致,
a. 对照试验
不同人员分析对照
不同实验室分析对照
加入回收:
加入一定质量样品,再测
定,看结果回收率如何
b. 空白试验
空白实验是在不加试样的情况下,按照与试样测定完全
相同的条件和操作方法进行试验,所得的结果称为空白值,
从试样测定结果中扣除空白值,就起到了校正误差的作用。
空白试验的作用是检验和消除由试剂、溶剂和分析仪器中某
些杂质引起的系统误差。
c. 校准仪器和量器
移液管与容量瓶的配套,滴定管体积校正,砝码校正等,
精确的分析可在计算结果中采用校正值,允许测定结果的相
对误差大于0.1%时,一般不必校准仪器。
d. 校正分析方法
重量法测Si H2SiO3↓→SiO2称重
滤液中的Si,分光光度法测定
结果相加