实验设计与数据处理L2-有限数据统计处理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Data Processing
注意事项
计算平均值及标准偏差s 时,应包括可疑值在内 可疑数据应逐一检验,不能同时检验多个数据
首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数 ,应重新计算平均
值及标准偏差 能适用于试验数据较少时
例3-4
2.4 异常样本值的判断和处理 Experiment Design and
(2)4d法 由于 δ≈0.8 ,所以 3 ≈4 δ 若用d近似代替 δ,则可以认为“离群值偏差大于4d者舍去”
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
注意事项
可疑数据应逐一检验,不能同时检验多个数据
首先检验偏差最大的数
剔除一个数后,如果还要检验下一个数 ,应重新计算相 关参数。
x
计算t值,t S n 查t-分布表得到统计值ta,f 若t计算 > t表,则有显著差异,否则无
2.3 显著性检验 Experiment Design and
Data Processing
2.3.1 t检验
例: 难产儿出生体重n=35, x =3.42, S =0.40, 一般婴儿出 生体重μ0=3.30(大规模调查获得),问相同否?
Data Processing
例:分析某尾矿中铁含量得如下结果:x =15.78%,s=0.03,n= 4,求(1)置信度为95%时平均值的置信区间;(2)置信 度为99%时平均值的置信区间。
t0.01, 3
置信度越高,置信区间越大。
2.3 显著性检验 Experiment Design and
Data Processing
Data Processing
2.4.1 异常值
样本异常值是指样本中的个别值,其数值明显偏离它所 在样本的其余观测值。
异常值可能仅仅是数据中固有的随机误差的极端表现, 也可能是过失误差。
异常值检验的显著性水平,推荐的值为1%。
2.4 异常样本值的判断和处理 Experiment Design and
过低,应予剔除。 当 C0.05<C<C0.01,则可疑方差为偏离方差。 若 C≤C0.05 则可疑方差为正常方差。
*以上 Cochran 最大方差检验法可用于剔除多组测定中精密 度较差的一组数据,也可用于多组测定值的方差一致性检验。
Experiment Design and Data Processing
α的取值越小,此假设检验的显著性水平越高。 1-α 为置信度或置信水平,用于表示假设检验的可靠
性。
2.2 测量结果的区间估计 Experiment Design and
Data Processing
样本平均值不可能完全等于总体平均值,不能用点估计; 要以一个区间来估计总体平均值; 要以一定的概率来估计总体均值含在某个区间之中,则
Data Processing
(3)Q检验法
步骤:
① 将一组数据由小到大排列,x1,x2……xn-1, xn,设xn或x1 为可疑值;
② 计算统计量
(xn为可疑值时)或
(x1为可疑值时);
③ 比较Q和Q表的大小,若Q >Q表,则对应的疑值舍去,否则 保留。
2.4 异常样本值的判断和处理 Experiment Design and
2.3 显著性检验 Experiment Design and
Data Processing
2.3.2 F检验
目的:判断两组数据的精密度是否存在显著性差异。 方法步骤: 计算F值, 查F-分布表得到F表; 若F计算>F表,有显著差异。
2.3 显著性检验 Experiment Design and
拉伊达原则计算平均值及标准差s时,应包括可疑值在内;而4d法在 计算平均值及平均偏差时,应先去除可疑值。
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
例:有一组分析测试数据:0.128,0.129,0.131,0.133,0.135,0.138, 0.141,0.142,0.145,0.148,0.167,问其中偏差较大的0.167这一数据是 否应被舍去?
2.3.1 t检验
目的:检验服从正态分布数据的算术平均值是否与给定值 有显著差异。 适用条件: 已知一个总体均数; 可得到一个样本均数及该样本标准误; 样本含量较小 样本来自正态或近似正态总体。
2.3 显著性检验 Experiment Design and
Data Processing
2.3.1 t检验 方法步骤:
(5)格鲁布斯(Grubbs)检验法
步骤:
① 将一组数据由小到大排列,x1,x2……xn-1, xn,求出平均 值 x 与标准偏差s;
② 计算统计量T, (x1为可疑值时);
(xn为可疑值时)或
③ 比较T和Ta,n的大小,若T > Ta,n ,则对应的可疑值舍去, 否则保留。
2.4 异常样本值的判断和处理 Experiment Design and
Dataຫໍສະໝຸດ BaiduProcessing
注意事项(Q检验、Dixon检验)
适用于试验数据较少时的检验,计算量较小; 可疑数据应逐一检验,不能同时检验多个数据; 剔除一个数后,如果还要检验下一个数 ,应重新排序 。
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
D、对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计 方法。
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
2.4.3 异常值剔除原则
(1)拉依达原则 如果某个测量值x的偏差d满足: d > 3 则认为x是含有过失误差的坏值,须剔除(由概率分布可知,误差绝对 值大于3 的概率为0.26%)
Data Processing
2.3.3 配对t检验
目的:为了检验两组数据间是否存在显著性差异。
方法步骤:
计算t值,
其中
在一定置信度下,查表得到t表(f =n1+n2-2);
若t 计算> t表,则两组数据的平均值有显著差异, 否则无。
2.3 显著性检验 Experiment Design and
思考题
1. 在一项关于软塑料管的实用研究中,工程师们想估计 软管所承受的平均压力。他们随机抽取了9个压力读数, 样本均值和标准差分别为3.62kg和0.45。假定压力读 数近视服从正态分布,试求总体平均压力的置信度为0. 99时的置信区间。
2. 某药物中钴的分析结果为:1.25,1.27, 1.31,1.40µg /g,请用4d法和Dixon法分别进行判断,在显著性水准 为0.05时,数据1.40是否应保留?
Data Processing
(4)迪克逊检验法(Dixon) 步骤: ① 将一组数据由小到大排列,x1,x2……xn-1, xn,设xn或x1
为可疑值; ② 用不同的公式计算r值(表3-2),并查表得到相应的临界
值; ③ 比较r和r表的大小,若r >r表,则对应的疑值舍去,否则保
留。
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
例:用两种不同的方法测得合金中铝的含量,其结果如下:
方法1:
方法2:

判断两种方法是否存在显著性差异。
由于f=5+4-2=7, P=95%,查表得: t表=2.36,则 t < t 表,因此,无显 著差异。
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
2.4.2 异常值的处理原则
A、在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠 正错误;
B、试验结束后,在分析试验结果时,如发现异常数据,则应先找出产 生差异的原因,再对其进行取舍;
C、在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据 进行统计处理;若数据较少,则可重做一组数据;
这一区间称为置信区间,一般为95%的置信度。
置信区间是一个随机区间 ( , ), 它覆盖未知参
数具有预先给定的概率(置信水平), 即对于任
意的 , 有 P{ } 1 .
Experiment Design and Data Processing
2.2 测量结果的区间估计 Experiment Design and
Data Processing
(6)多组测量值方差的离群数据检验 ——Cochran最大方差检验法
① 将 m 个组测定的每组标准差按大小顺序排列1, 2 …… m ,最大
记为 max,按下式计算统计量 c:
C
2 m ax
m
2 i
i 1
其中:
2 m
ax
——m
个组中方差最大的值;
m
2 i
——m
个组测定结果的方差之和。
i1
2.4 异常样本值的判断和处理 Experiment Design and
Data Processing
②根据给定的显著性水平 a 及测定组数 m ,每组测定数 n, 查 Cochran 最大方检验临界值 Cr 表查得 Ca 值。
③判断 当 C>C0.01,则可疑方差为离群方差,说明该组数据精密度
Experiment Design and Data Processing
第2章 有限数据统计处理
2.1 显著性水平与置信度 Experiment Design and
Data Processing
显著性水平:在统计假设检验中,估计总体参数 落在某一区间内,可能犯错误的概率为显著性 水平,记为α。
解:(1)计算 x , s x 0.140, s 0.01116
(2)计算偏差
xp x 0.167 0.140 0.027
(3)比较 3s=3×0.01116=0.0335>0.027
故按拉依达准则,0.167这一可疑值不应舍去
2.4 异常样本值的判断和处理 Experiment Design and
相关文档
最新文档