有限数据的统计处理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
tS
tS
二、 置信区间与置信概率
2. 置信概率
把测定值在置信区间内出现的概率称为置 信概率(P),也称置信度 。
二、 置信区间与置信概率
结论: (1)根据平均值 x ,查t可求出μ可能存在的范 围即置信区间 。
(2)测定次数越多、精密度越高、S越小,置信 区间就越小,算术平均值和总体平均值μ越接近,算 术平均值的可靠性就越大。因此用置信区间表示分 析结果更合理。
3
一、有效数字及运算规则
运算中还应注意: ①对计算经常会遇到的分数、倍数、常数根据它们来确定计算结果的有效 数字的位数。 ②对数尾数的有效数字位数应与真数的有效数 字位数相同,在有关对数和反对数的运算中应加 以注意。 例如: lg339=2.530,而不应是2.53。
三、可疑值的取舍 2.Grubbs检验法(G检验法)
(1)排序:x1, (2)求 x2, x 3, x4…… 和标准偏差S
S (4)由测定次数和要求的置信度,查表得G 表若G计 算> G 表,弃去可疑值,反之保留。
由于G检验法引入了标准偏差,故准确性比Q 检 验法高。
(3)计算G计值:G计 x
一、有效数字及运算规则 2. 有效数字位数
(3) 科学计数法 有效数字取决于10n前的数据 例如:1.65×10-6 三位有效数字 (4) 对于pH ,lgKθ等 其有效数字的位数取决于小数部分数字的位数。 例如: pH=4.75 lg10.2 (5) 遇到倍数、分数关系 由于不是测量所得的,可视为无限多位有效数字。
信 度 95% 99% 12.71 63.66 4.30 9.93 3.18 5.84 2.78 4.60 2.57 4.03 2.45 3.71 2.37 3.50 2.31 3.36 2.26 3.25 2.23 3.17 2.09 2.85 1.96 2.58
二、 置信区间与置信概率
n=6
注意:置信度不变时, n 增加t 变小,置信区 间变小;n不变时,置 信度增加,t 变大,置 信区间变大
0.1048 0.1043 Q计 0.62 0.0008
三、可疑值的取舍
查Q值表,当n=5时,Q0.90 =0.64 0.62<0.64,所以0.1048应予保留。
若再增加一次测定,Q计仍为0.62,当n=6时, Q0.90=0.56;Q计>Q0.90,那么0.1048 应予舍弃。
为了提高判断的准确度,有时当Q计与Q表比较 接近时,最好再做一次测定,以决定取舍。
一、有效数字及运算规则
举例:
用万分之一分析天平称取试样质量记录为 1.3056g,为5位有效数字;而相同质量改用台秤称 取则应记为1.3g。 用滴定管量取体积应记录为28.07mL,而相同体 积改用50mL量筒量取,则应记为28mL 。
一、有效数字及运算规则 2. 有效数字位数
(1) 带小数点数字 a. 以非零数字开头,则所有数字全部为有效数字。 例如:1.2104 25.315 24.13 5.0 b. 以零开头时,从第一个非零数字开始往后为有效数字。 例如: 0.1000 0.0120 0.0030 0.001 (2) 整数 a. 以非零数字结尾时,则所有数字全部为有效数字。 b. 以零结尾时,有效数字位数较含糊,应在记录数据时 根据测量精度写成科学计数法形式。 例如:100 位数含糊
n t (x ) S
则
x
tS n
二、 置信区间与置信概率
总体平均值μ将包括在
x
tS n
,x
tS n
区间内,即包括在 x 平均值附近的某区间内。
因此称μ在 x n , x n的区间为置信区间.
置信区间 :在一定置信度下,以测定结果 x 为中心的、包括总体平均值μ在内的可靠性范围。
4. 有效数字运算规则 (*先计算后修约)
(1)加减法:几个数据相加或相减时,它们的和或 差的有效数字位数的保留,应以小数点后位数最少 的数据为根据,即取决于绝对误差最大的那个数据。
例如: 0.0121 + 25.64 + 1.05782 =? 绝对误差 ±0.0001 ±0.01 ±0.00001 先计算得 26.70992,后修约为26.71。
测定次数 n 3 置信概率 P 0.90 0.95 0.94 1.53 0.76 1.05 0.64 0.86 0.56 0.76 0.51 0.69 0.47 0.64 0.44 0.60 0.41 0.58 4 5 6 7 8 9 10
三、可疑值的取舍
例:某标准溶液的五次测定值(单位为mol∙L-1)为 0.1041,0.1048,0.1042,0.1040,0.1043 。问其中 的0.1048是否舍弃(置信概率90%)?若第六次测 定值为0.1042,则0.1048如何处置? 解:将数据依次排列: 0.1040,0.1041,0.1042,0.1043,0.1048 R=0.1048-0.1040=0.0008 则
一、有效数字及运算规则
例题:
下列数字的有效数字位数是几位?
0.002810 4 lgK=11.61 2 12.96% 4 2500 位数含糊
3.2050×104 5 pH=1.20 2
一、有效数字及运算规则 3. 有效数字的修约规则
① “四舍六入五成双”, 将下列数字修约为两位 3.249 3.2 “四舍” 8.361 8.4 “六入” 6.550 6.6 “五成双” 6.250 6.2 “五成双” 6.2501 6.3 “五后有数需进位” ②修约要一次完成。
21.12% ~21.48%
n=10 时, 有99%的把握认为,铵盐的含氮量在
21.24% ~21.36%
二、 置信区间与置信概率
注意:例题结果说明 (1) 置信概率的高低反映测定值的可靠程度。 置信概率并非越高越好!因为P增大,t增大,置 信区间增大,测定值的精密度降低,100%置信概率就 意味着置信区间无限大,肯定会包含总体平均值,但 此置信区间毫无意义。
一、有效数字及运算规则
例: 将5.5491修约为2位有效数字。 修约为5.5。 修约为5.549→5.55→ 5.6
√
×
例:将下列数字修约为4位有效数字。 3.1124 3.1126 3.1115 3.1125 3.11251 3.112 3.113 3.112 3.112 3.113
一、有效数字及运算规则
一、有效数字及运算规则
2008年农学门类考研试题: 由计数器计算 (6.626×8.3145)÷ (9.11×0.1000)的结果为 60.474069,按有效数字运算规则 ,其结果应 表示为 A. 60 B. 60.5 C. 60.47 D. 60.474 答案:B
二、 置信区间与置信概率
在实际测定分析中,为了评价测定结果的可靠
(1)将数据从小到大排列,计算极差R。 (2)算出可疑值与其最邻近数据之间的差。 (3)按下式计算舍弃商Q计:
Q计
x可疑 x相邻 R
x可疑 x相邻 x n x1
三、可疑值的取舍
(4) 根据测定次数n和指定置信概率P查Q值 表, 可得Q表。 (5) 比较Q计与Q表。若Q计≥Q表,则舍弃可疑值, 否则应保留。 舍弃可疑值Q值表
§6-4 有限数据的统计处理
一、有效数字及运算规则
二、置信区间与置信概率
三、可疑值的取舍
四、显著性检验
一、有效数字及运算规则
1. 有效数字
有效数字是指仪器实际能够测到的数字。
组成:由准确数字加一位欠准确数字组成。
如 0.3628g:在0.3627g和0.3629g之间,8 是估计值。 特点:不仅表示数值的大小,而且反映测量仪 器的精密程度以及数字的可靠程度。
当n=10,P=99%时,查t值分布表,t=3.25,所以
3.25 0.06% 21.30% (21.30 0.06)% 10
二、 置信区间与置信概率
n=4时,有95%的把握认为,铵盐的含氮量在
21.20% ~21.40%
n=4时,有99%的把握认为,铵盐的含氮量在
(3) t越小,置信区间越小。校正系数t与自由 度有关,f = n-1,测定次数越多,t越小,当n→∞, t分布曲线为正态分布曲线。
二、 置信区间与置信概率
t 值分布表
测量次数 n 2 3 4 5 6 7 8 9
10 11 21
∞
置 90% 6.31 2.92 2.35 2.13 2.02 1.94 1.90 1.86 1.83 1.81 1.73 1.65
三、可疑值的取舍
•
在一组平行测定数据中,有时会有个别数据 偏离其他数据较远,这些偏离较远的数据称 为可疑值(或异常值、离群值) 可疑值不能随意舍弃,可疑值的取舍影响分 析结果,必须用统计方法进行检验,决定取 舍。常用Q检验法及Grubbs法检验可疑值的 取舍。
•
三、可疑值的取舍
1. Q 检验法(适于测定次数3~10次)
置信概率也不可太低!因为虽然P减小会使置信区 间减小,但测定值的可靠程度降低。
分析化学中置信概率通常选90%或95%。
二、 置信区间与置信概率
(2)置信区间的大小反映测定值的精密度。 相同置信概率时,测定次数n增大,置信区间 减小,分析结果的精密度将提高。
(3)比较多个测定值的准确程度,应在同一置信 概率下进行,否则没有可比性。
一、有效数字及运算规则
(2)乘除法:几个数据相乘除,所得结果的有效数 字的位数取决于各数中有效数字位数最少、相对误 差最大的那个数据。 例如:3.261×10-5×1.78=? 相对误差/% 3.261×10-5 0.03 × 1.78 0.6 5.80458×10-5 0.0002 所以其结果应修约为 5.80×10-5 0.2 有效数字位数 4 3
二、 置信区间与置信概率
(4)t值随测定次数的增加而减小,随置信概率 的提高而增大。 当测定次数较少时,可适当增加测 定数,缩小置信区间,从而使测定值的平均值与总 体平均值μ更接近。
(5)比较两个或多个测定结果的准确程度,应在 同一置信概率下进行。
二、 置信区间与置信概率
例:某铵盐含氮量的测定结果 x =21.30%, S=0.06%,n=4。求 置信概率为95%和99%时平均值的置信区间?若n=10(假 定其他数据不变 ),置信概率为99%时平均值的置信区间 为多少?结果说明了什么?
一、有效数字及运算规则
③在重量分析和滴定分析中,一般要求有四位 有效数字;对相对原子质量、相对分子质量等的 取值应与题意相符;各种分析方法测量的数据不 足四位有效数字时,应按最少的有效数字位数保 留。 ④有关化学平衡的计算(如平衡时某离子的浓度 等),一般保留二或三位有效数字。 ⑤表示偏差和误差时,通常取1~2位有效数字即 可。
性,人们总希望能够估计出实际有限次测定的平均
值与真实值的接近程度,即在测量值附近估计出真
实值可能存在的范围以及试样含量落在此范围内的 概率,从而说明分析结果的可靠程度。由此引出置 信区间与置信概率的问题。
二、 置信区间与置信概率 1. 置信区间
无限多次测定中才有总体平均值μ和总体标准 偏差σ,而实际测定为有限次测定,μ与σ不知道, 只能用有限次测定的平均值及标准偏差S来估计。 用S代替σ引起的误差可用校正系数t来补偿。
x可疑 x
三、可疑值的取舍
Grubbs 检验法的临界值
测定次数 置 信 概 率 测定次数 置 信 概 率
95% 3 4 5 6 7 8 9 10 11 12 13 14 1.15 1.48 1.71 1.89 2.02 2.13 2.21 2.23 2.36 2.41 2.46 2.51
99% 1.15 1.50 1.76 1.87 2.14 2.27 2.39 2.48 2.56 2.54 2.70 2.76 15 16 17 18 19 20 21 22 23 24 25
解:当n=4,P=95%时,查t值分布表,t=3.18,则
3.18 0.06% 21.30% (21.30 0.10)% 4
二、 置信区间与置信概率
当n=4,P=99%时,查t值分布表,t=5.84,所以
21.30%
5.84 0.06% 4 (21.30 0.18)%