一、学习要求、重点和难点

本章学习要求:

1、掌握系统误差、偶然(随机)误差的概念和产生原因。掌握误差(绝对误差、相对误差)、偏差(绝对偏差、相对偏差、平均偏差、相对平均偏差、标准偏差、相对标准偏差、平均值的标准偏差)的概念及计算式;

2、掌握准确度与误差的关系、精密度与偏差的关系,准确度与精密度的关系。

3、掌握正态分布、标准正态分布的特点和规律;

4、掌握随机误差区间概率的计算方法和应用。置信度与置信区间的概念和关系(已知总体标准偏差和已知样本标准偏差两种情况);

5、掌握一组数据中可疑值的取舍(Q检验法、G检验法);显著性检验(样本平均值与真值间比较,两组数据间比较)。

6、掌握有效数字的意义和位数确定;有效数字修约规则;有效数字运算规则。

7、了解提高分析结果准确度的方法。

 

本章的重点:

1、误差是定量分析化学中的基本概念,也是分析化学中的重要的贯穿全书各章的概念,所以要重点理解和掌握其定义以及运算,在实际分析工作中,由于真值未知,一般用测量数据的算术平均值进行计算,所以引入了偏差的定义及计算。

2、数据的统计计算:平均值、标准偏差、相对标准偏差、绝对误差、相对误差的计算等。       

3、三种异常值的取舍方法,显著性检验(t检验法和F检验法),平均值的置信区间的求取。

4、有效数字的记录、修约及运算规则。

本章的难点:

1、误差与偏差的区别。误差是表示测量数据与真值之间的差值,偏差表示测量数据与算术平均值之间的差值。

2、系统误差和随机误差的区别。

3、置信度和置信区间的概念和关系。

4、总体和样本的关系;总体和样本的各种统计量的差别。

5、显著性检验的目的和意义。

 

二、基本术语

1、系统误差与偶然误差

 

系统误差(determinate error)

偶然误差(random error)

   

因分析过程中某些固定因素造成的误差。对分析结果的影响恒定,具有重现性,或偏高或偏低,可预测性。

由不定因素引起的,可变的,时大时小,时正时负。又称随机误差。

产生原因

方法误差、仪器误差、试剂误差、主观误差

偶然的因素(定量分析中外界条件的改变及工作中难于估计的因素)

   

恒定性、单向性、重现性

不恒定、难以校正,服从正态分布

减免方法

对照试验、空白试验和校正仪器

增加平行测定次数

多次测定的偶然误差遵循正态分布规律。正态分布曲线的纵坐标代表相对频数,横坐标代表随机误差的值(x-μ)/σ,这种正态分布曲线称为标准正态分布曲线。如图。

偶然误差存在如下规律:

1)对称性:正负误差出现的几率相等。

2)单峰性:小误差出现的几率大,大误差出现的几率小。误差分布曲线只有一个峰值,有明显的集中趋势。

3)有界性:很大的误差出现的几率几乎为零;也就是说误差值有一定的实际极限。

4)抵偿性:误差的算术平均值的极限为零。

 

2、误差和偏差

1)误差:分析结果和真实值之间的差值称为误差。

2)偏差指个别测定值xi与几次测定值的平均值x 之间的差别。

 

3、真值、平均值和中位数

1真值xT:某一物理量本身具有的客观存在的真实数值。有理论真值;计量学约定真值;相对真值。

2平均值n次测量数据的算术平均值。

3中位数xM:一组测量数据按大小顺序排列,中间一个数据即为中位数xM。当测量数据为偶数时,中位数为中间相邻两个测量值的平均值。

 

4、准确度与精密度

1准确度(accuracy)是指测定结果的平均值与真值接近程度,常用误差大小表示。误差小,准确度高。

2精密度(precision)是指在确定条件下,平行测定多次,所得结果之间的一致程度。精密度的大小常用偏差表示。

3准确度与精密度的关系:准确度好的结果要求精密度好,精密度好的结果准确度不一定好。所以,有好的精密度才可能有好的准确度。

 

5、重复性与再现性

1重复性repeatability)同一操作者,在相同条件下,获得一系列结果之间的一致程度

2再现性(reproducibility)不同操作者,在不同条件下,用相同的方法获得单个结果之间的一致程度。

 

6、正态分布、标准正态分布与t分布

1正态分布又称高斯分布图。

 

   1

μσ确定后,正态分布曲线的位置和形状也就确定了。因此μσ是正态分布的两个基本参数,正态分布可用N(μ,σ2)

2标准正态分布

若将正态分布的横坐标用u表示(以为单位表示随机误差)

 

 

 

 


u为标准正态变量,此时式(1)变为只有变量u的函数表达式

 

 


经上述变换后,总体平均值为μ,总体标准偏差为σ的任一正态分布均可转换为μ =0σ2 =1的标准正态分布,以N(0,1)表示。曲线的形状与μσ无关。

3t分布

实际工作中,有限次测定无法得知μσ,只能求S而当测定次数有限时,测定值或随机误差也不符合正态布,而是符合t 分布。

 


tp,f 是随置信度P和自由度 f 而变化的统计量。t 分布曲线的形状随 f ( f = n-1 )而变化。

    与正态分布曲线一样,t 分布曲线下面某区间的面积也表示随机误差在此区间的概率。但 t 值与标准正态分布不同,它不仅与概率还与测定次数有关。

 

7、置信度与置信区间

1置信度或置信水平:某一定范围的测定值(或误差值)出现的概率

2置信区间:真实值在指定的概率下,分布的某一个区间。

置信度高,置信区间就宽。

 

8、有效数字

有效数字:既表示测量数值大小,又能正确反映测量数据精确程度的数,称之为有效数字。

 

三、基本公式和运算

1、误差(error)

1绝对误差        

2相对误差       

 

对于多次测定,结果的平均值为

 

 


2、偏差(deviation)

1)单个数据:

绝对偏差di

 


相对偏差dr

 

绝对误差和相对误差都有正负,正值表示分析结果偏高,反之偏低。实际工作中,真值并不知道,常把多次测定结果的平均值看作真值。

 

2单次测定数据(一组数据)

算术平均偏差di一组数据中各个偏差的绝对值的平均值

 

 


相对算术平均偏差

 

可以用平均偏差表示一组数据的精密度。但它反映不出少数大偏差测定值的影响。使其存在一定局限性。

3)统计学中偏差表示

n为无限大时,设μ为无限次测定结果的平均值,也称总体平均值。

总体标准偏差(均方根偏差):

 

 

对于一组具体的数据,n是有限的。

标准偏差(S)

 

 

 


或:

 

式中 n-1 称为自由度,是指独个变量的个数。

       平均偏差与标准偏差相比,前者计算简便,但标准偏差能更好地反映出小或大的偏差,能更清楚地说明数据分散程度。

相对标准或偏差变异系数(RSDCV)

 

 

4)平均值的标准偏差

如对同一样品测定了n 组数据,由此可得到n个平均值,这些平均值间的差别,可用平均值的标准偏差表示。

对于无限次测定

 

对于有限次测定

 

增加测定次数可以减小测定值的偏差,提高测定的精密度。

 

3、随机误差的区间概率

3-4所对应的区间概率总和为100%,即为1

 


则随机误差在±σ区间(u= ± 1),即测定值在μ±σ区间出现的概率是:

 

 

 


随机误差出现区间

测定值出现的区间

概  率

u=±1

x=μ±σ

0.6826

u=±2

x=μ±2σ

0.9548

u=±3

x=μ±3σ

0.9974

 

 

4、置信度与μ的置信区间

随机误差的分布规律表明,测定值总是在以为μ中心的一定范围内波动,并有着向μ集中的趋势。如何根据有限的测定结果来估计μ可能存在的范围(称为置信区间)该范围越小,说明测定值与μ愈接近,即测定的准确度愈高。但由于测定次数一般较少,由此计算出的置信区间也不可能有100% 把握将μ包括在内,只能以一定的概率(置信度)进行判断。

置信度或置信水平某一定范围的测定值(或误差值)出现的概率

置信区间真实值在指定的概率下,分布的某一个区间。

      如真值在95.5%的概率下出现的范围(置信区间)μ±2σ

置信度高,置信区间就宽。

1己知总体标准偏差σ

 

 


由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。

 

 

上两式分别表示在一定置信度时,以单次测定值x或以平均值 为中心的包含真值μ的取值范围,即μ的置信区间。在置信区间内包含μ的概率称为置信度,它表明对所作判断有把握的程度,用 P 表示。

 

2己知样本标准偏差S

实际工作中,有限次测定无法得知μσ,只能求xS。而当测定次数有限时,测定值或随机误差也不符合正态布,而是符合t 分布。

 

 


tp,f 是随置信度P和自由度 f 而变化的统计量。t 分布曲线的形状随 f ( f = n-1 )而变化。

      与正态分布曲线一样,t 分布曲线下面某区间的面积也表示随机误差在此区间的概率。但 t 值与标准正态分布不同,它不仅与概率还与测定次数有关。

     不同 P n 对应的 t 值见表 3-2.

3-2   t 值表  t. 某一置信度下的几率系数)

 

 


或:

 

上式是计算有限次测定,置信区间公式。当P一定时,置信区间的大小与tp,fs n有关,且tp,f s实际也受n的影响,即n 值越大,置信区间越小。

 

5可疑测定值的取舍

1Q 检验法

1951年由迪安(Dean)和犾克逊(Dixon)提出。

基本步骤:

     (1) 数据排列               X1  X2  ……  Xn

     (2) 确定可疑值:       X1 Xn (一般是极值)

     (3) 求极差                   Xn X1

     (4) 求可疑数据与相邻数据之差  Xn Xn-1     X2 X1

     (5) 计算:

 

(6) 根据测定次数和要求的置信度,(如90%)查表:

(7) Q计与Q (如 Q90 )相比,

             Q> Q 舍弃该数据, (过失误差造成)

             Q < Q 保留该数据, (偶然误差所致)

             当数据较少时舍去一个后,应补加一个数据。

3-3  不同置信度下,舍弃可疑数据的Q值表

测定次数

Q90

Q95

Q99

3

0.94

0.98

0.99

4

0.76

0.85

0.93

8

0.47

0.54

0.63

 

2格鲁布斯(Grubbs)检验法

基本步骤

1)排序:X1, X2, X3, X4……Xn

2)求X和标准偏差S

3)设X1 Xn为可疑值,计算G值:

4)由测定次数和要求的置信度,查表得G

5)比较:若 G计算> G表,弃去可疑值,反之保留。

        由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q 检验法高。

 

 

 

3-4  G值表

n

置信度(P)

95%

97.5%

99%

3

4

5

6

7

8

9

10

11

12

20

1.15

1.46

1.67

1.82

1.94

2.03

2.11

2.18

2.23

2.29

2.56

1.15

1.48

1.71

1.89

2.02

2.13

2.21

2.29

2.36

2.41

2.71

1.15

1.49

1.75

1.94

2.10

2.22

2.32

2.41

2.48

2.55

2.88

3)四倍法

基本步骤

(1)    确定可疑值 Xi

(2)    先计算 (不包括可疑值)的其它数据的平均值(X)和平均偏差(d)

(3) 计算出可疑值与平均值之差(Xi – X )

   (4)

 

如果上式≥4,可疑值(Xi )就应弃去,反之应予以保留。此法适用每组48个数据的数据组

 

6、显著性检验

1平均值与标准值(m)的比较(t检验法)

为检验一个分析方法是否可靠?是否有足够的准确度?常用已知含量的标准试样进行试验,用t 检验法将测定的平均值与已知值(标样值)比较计算出t值,再与t表进行比较,从而来判断方法是否可靠。

主要步骤为:首先计算s;然后计算或者;最后比较ttα,f,若t > tα,f ,则存在系统误差;若 t tα,f ,则不存在系统误差。

 

2两组数据的平均值比较(同一试样)

当需要对两个分析人员测定相同试样的结果进行评价,或需对两种方法进行比较,检验两种方法是否存在显著性差异?即是否有系统误差存在?也可选用t 检验法进行判断。

 


(1)首先判断两组数据的精密度是否有较大的差别,用F检验法。又称方差比检验:

 

S大和S 分别代表两组数据中标准偏差大的和小的数值。

若:F计算 < F,再继续用t 检验法判断x1x2是否有显著性差异

若:F计算 > F,说明这两组数据的精密度存在显著性差异,其准确度值得怀疑,不必再对两个平均值进行比较。F表见表3-5

(2)求两组数据合并后的标准偏差:

 

 

 

 


(3)计算值:

 

 

(4)查表3-2,得t,比较:

 若:t t,表示两组数据间存在显著性差异;

     t t  两组数据间没有显著性差异。

3-5    置信度为95%F

   fs

fs

2

3

4

5

6

7

2

3

4

5

6

7

19.00

9.55

6.94

5.79

5.14

4.74

3.00

19.16

9.28

6.59

5.41

4.76

4.35

2.60

19.25

9.12

6.39

5.19

4.53

4.12

2.37

19.30

9.01

6.26

5.05

4.39

3.97

2.21

19.33

8.94

6.16

4.95

4.28

3.87

2.10

19.36

8.88

6.09

4.88

4.21

3.79

2.01

19.50

8.53

5.63

4.36

3.67

3.23

1.00

 

7. 有效数字及其运算规则

1有效数字概念:

2有效数字记录。分析数据记录时,要根据分析方法和测量仪器的精度来决定数据的有效数字位数。记录的数据中只有最后一位是可疑的。pHpK等对数表示的数据,其有效数字取决于小数部分数字的位数。

3有效数字的修约原则。对分析数据进行处理时,要按照四舍六入五留双的规则合理保留各步计算中的有效数字位数。

4有效数字的运算规则。分析数据计算时,对数据要先修约再计算。

加减法运算中,以小数点后位数最少的(即绝对误差最大的)那个数为根据,来修约其他各个数据的位数,然后再计算。

乘除法运算中,以有效数字位数最少的(即相对误差最大的)那个数为根据,来修约其他各个数据的位数,然后再计算。