少量次测量数据的统计处理概要

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的 t 值。
( 3)
s
x
-平均值的标准偏差
统计量 t的表达式中:
t Hale Waihona Puke Baidu
x
s
x
s
x 称为平均值的标准偏差(平均值
X 与总体
平均值μ相符的程度), 与样本容量n有关,即:
s
x

s n
(4)平均值标准偏差与测量次数的关系
从图中可见,当测 定次数n>10时, x 的值降低己不明显。 所以,一般的测定 平行做3~4次,要 求较高的5~6次, 要求更高的 测定 做10~12次也足够 了。
表示的意义:有68.3%把握认为本钢样磷含
量的真值落在0.0087±0.0011(%)范围内。
例:磷含量的第二种报告
0.0022 (%) 0.0087 2 0.0087 0.0022(%) 4
同理,但本式的表示的意义为:有 95.5%把握认为本钢样磷含量的真值落
在0.0087±0.0022(%)范围内。
表示为:tα,f 。
t值表(双边)
置信度P,显著性水准α P=0.90 P=0.95 P=0.99 f=n-1 α=0 .10 α=0.05 α =0.01 置信度P,显著性水准α P=0.95 P=0.90 P=0.99 f=n-1 α=0.05 α=0 .10 α=0.01
1 2 3 4 5 6
2) 平均值±2标准误差
3) 平均值±3标准误差
2、两个概念:置信度与显著水平
1) 置信度(P):例中有68.3%把握、 95.5%把握和99.7%把握)称为置信度 也称置信水平;
2) 显著性水平( α ):在上面三个区间外 的概率称为显者性水平。
置信度(P)与显著性水平(α)的关系
• 两者的关系为:α=1-P
3.50 3.36 3.25 3.17 2.84 2.58
t 值表的意义
• 前表为最常用的 t 值表。表中的 P 称为置信 度,表示随机测定值落在(μ±ts)区间内的 概率,称为显著性水准,用 α 表示,即
α=1-P。应用表时须加脚注,注明显著性水
准和自由度,例如:t0.05, 9是指:置信度为
95%(显著性水准为0.05),自由度为9时
3. 少量次测量数据的统计处理
• 分析测试工作中,通过样本研究总体, 由于测量次数有限, σ和μ无从知道,如 何处理和评价少量次数测定结果的数据? 而对多次测定的结果平均值又如何评价? 在前面己讨论的基础上,讨论下面的问 题:
几个基本概念
• • • • • • (1)统计量t值 (2)t 分布曲线 (3)平均值的标准偏差 (4)平均值标准偏差与测量次数的关系 (5)平均值的置信区间 (6)置信度与置信水平
• 英国的统计学兼化 学家Gosset用笔名 “Student”发表论 文提出t分布,故 得名。 t分布曲线展示:

a. T 分布曲线随自由 度 f 变化; b. 当 f =∞时,t 分布 则为正态分布,
t 分布曲线
c. t 分布曲线与横坐标 t 某区间所夹面积, 与正态分布曲线一样,表示测量值落在 该区间的概率。显然,若选定某一概率 和一定的自由度f,则 t 值也就一定。 d. 由于t 值与置信度及自由度有关,故其
例:磷含量的第三种报告
0.0022 (%) 0.0087 3 0.0087 0.0033(%) 4
同理,但本式的表示的意义为:有
99.7%把握认为本钢样磷含量的真值落
在0.0087±0.0033(%)范围内。
三种结果报告式的小结
1. 三种表达式区别在:
1) 平均值±1标准误差
6.31 2.92 2.35 2.13 2.02 1.94
12.71 63.66 4.30 9.92 3.18 5.84 2.78 4.60 2.57 4.03 2.45 3.71
7 8 9 10 20 ∞
1.90 1.86 1.83 1.81 1.72 1.64
2.36 2.31 2.26 2.23 2.09 1.96
式中
称为置信区间,其大小
取决于测定的标准偏差、测定次数和置信 度的选择,置信区间愈小平均值 X 愈接 近总体平均值 μ 。( X → μ )
(6)置信度与显著水平
• 例:对某一钢样含磷量平行测定了四次, 平均值为0.0087%。己知标准误差 σ=0.0022,下面有三种结果报告,第一 种报告:
0.0022 (%) 0.0087 1 0.0087 0.0011 (%) 4
• 例:α(显著性水平)= 0.05时,
则 p(置信度)=1-0.05=0.95 即等于 95% • 置信度的选择应合适,一般的判断若有90% 或95%把握,则以为这种判断基本正确。在 统计学中通常取95%置信度。处理分析测试 的数据时,也取95%的置信度。 • 当然并非绝对,根据具体的情况有时也取 90%或99%。
4、可疑数据的取舍
• 一组数据中,可能有个别数据与其他数据 差异较大,称为可疑值。除确定是由于过 失所造成的可疑值可以舍弃外,可疑值是 否要保留,应用统计学的方法来判断,不能 任凭主观意愿决定取舍。常用的可疑值取 舍方法有:
– 4d法
– Q检验法
– 格鲁布斯法
4d 检验法
• 若一总体服从正态分布,x- μ大于±3 σ 的测 量值出现的概率很小,其误差往往不是随机 误差所致,应舍去。当然,其条件是在校正了 系统误差之后。又总体的标准偏差σ与总体 平均偏差δ 两者的关系是δ≈0.8 σ,用样本平均 偏差 d代替δ,则 4d ≈ 3 σ。 • 这样, 便可将可疑值与 •
s
(5)平均值与真值的关系 ——平均值的置信区间
• 用样本研究总体时,样本均值x并不等于总体 均值μ,但可以肯定,只要消除了系统误差, 在某一置信度下,一定存在着一个以样本均值 x为中心,包括总体均值 μ 在内的某一范围,称 为平均值的置信区间。由t的定义式得:
ts X n
置信区间
ts n
显著性水平α 测定次 数, n 0.05 0.025 0.01 3 1.15 1.15 1.15 4 1.46 1.48 1.49 5 1.67 1.71 1.75 6 1.82 1.89 1.94 7 1.94 2.02 2.10
1 2 n 1 n n
n 1
)
Q
x x x x
n n
n 1 1
Q检验法
• 上式的分母是极差,分子是可疑值与最临 近值之差,Q与 Q表值比较,若 Q Q表 , 可疑值 n 应舍弃,否则保留,若 1是可 疑值,Q从下式求出:
x
x
Q

x x
2 n

x x
1 1
Q • 值与置信度和测量次数有关,如表所 示。
Q检验法
Q值表
测定次数 3 4 5 6 7 8 9 10 n 90% 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 Q 0.90 ) (
置 96% 0.98 0.85 0.73 0.64 0.59 0.54 0.51 0.48 信 ( Q0.96 ) 度 99% 0.99 0.93 0.82 0.74 0.68 0.63 0.60 0.57 Q 0.99 ) (
• 把T与 T a,n表值比较,若 T T a,n,可疑值 舍弃,否则保留,若 X n为可疑值,T由 下式求出:
T X
X
1
S
• X n 值与测定次数和显著性水准有关,如 表所示。
格鲁布斯法
T
,n
值表
测定次 数, n 8 9 10 15 20 显著性水平α 0.05 0.025 0.01 2.03 2.13 2.22 2.11 2.21 2.32 2.18 2.29 2.41 2.41 2.55 2.71 2.56 2.71 2.88
格鲁布斯法
• 该法用到正态分布中反映测量值集中与 波动的两数 X 和 S,因而可靠性较高。 应用此法时,在计算了X 和S后,将测量 值从小到大排列,同Q检验法一样,应 按测量次数多少,确定检验X 1或 X n ,若 两个都做检验,设X1为可疑值,由下式 求统计量T: X X1 T S
格鲁布斯法
(1)统计量t
• 分析化学中通过样本研究总体,由于测量次 数有限, σ和μ无从知道。英国统计学与化 学家Gosset提出用t分布解决了这一问题。使 不致因为用 s 代替σ而引起对正态分布的偏 离。 • (1) t分布和t分布曲线,统计量t,定义为:
t
x
s
x
(2)t 分布曲线 f=1,5,∞
__
x
之差是否大于
4d作为可疑值取舍的根据。
4 d检验法
应用 4d 法时,可先把可疑值除外,求出余 下测量值的 x 和 d,若可疑值与 x之差 的绝对值大于 4d ,可疑值舍弃,否则保 留。
Q检验法
• 此法是将数据从小到大排列,如: • 设 n 为可疑值,按下式求统计量Q, Q称为舍弃商。
x
x , x ,, x , x ( x x
相关文档
最新文档