5-1常用的显著性检验方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章-1 常用的显著性检验方法
§1.可疑值的检验
1.1 可疑值和异常值 可疑值:当对同一样品进行重复测定时,一组数据中有 一、两个测定值明显地偏大或偏小,称之为可疑值; eg.酸碱滴定检测中,获得下列数据: 5.38, 5.38, 5.39, 5.40,5.41, 5.51
可疑值的处理: 1. 经分析,是属于技术上的失误,不论是否属于可疑值, 均应舍弃; 2. 若不能确定是技术上的失误,则应进行统计假设检验.
为 x = 11.99%。试问,能否由这30个醋样的平均
数 x 判断新曲种好于原曲种?
食醋醋酸含量的差异是由于采用新曲种引起 的还是由于试验误差引起的?
例2:A,B两种肥料,在相同条件下各施用于5个小区的
水稻上,水稻产量平均分别为 xA=500kg,xB=520kg ,二
者相差20kg.
那么20kg差异究竟是由于两种肥料的不同而造成的 还是由试验的随机误差造成的?
然备择假设被否定;反之,否定了无效假设,说明差异显 著,也就是接受了备择假设。
如前例,原假设H0:= 0=9.75%,即假设由新曲种酿
造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等, 这个假设表明: 采用新曲种酿造食醋对提高醋酸含量是无 效的,试验的表面效应是随机误差引起的。
对应的备择假设为 0=9.75% ,即表明: 采用新曲
无效假设:
假设总体参数(μ )与某一定值(μ 0)相等,记作 H0:μ =μ 0
或两个总体参数(μ 1,μ 2)相等,记作 H0:μ 1=μ 2,或H0:μ 1-μ 2=0,
即假设处理间没有效应, 无显著差异。
备择假设:
与无效假设相对应的另一种统计假设,记作
HA:μ ≠μ 0或HA:μ 1≠μ 2; 如果测验结果接受了无效假设,说明无显著差异,当
通过试验测定得到的每个观测值 xi ,既由被测个体所属
总体的特征决定,又受其它诸多无法控制的随机因素的影响。
所以观测值 xi 由两部分组成,即
xi = + i
总体平均数 反映了总体特征,i 表示试验误差。
若样本含量为n ,则样本平均数:
x xi n ( i)/ n
n
由样本值计算统计量u值,
u x 0 x 0 2 / n
n = 0.119 0.0975=2.315 0.053 / 30
由正态分布双侧分位数(uа)可知
P u 1.96=0.05 P u 2.58=0.01
本例计算出的统计量u=2.315, 1.96< u <2.58,所以可推知其概率
3s (或2s) 作为极限误差,则认为xi是异常数据,予以剔除。
选择 3s 还是 2s 作为极限误差,取决于检验的显著性水平α , 或者可信度1- α .
3s相当于显著性水平α =0.01, 2s相当于显著性水平α =0.05. 注:计算平均值和标准差时可疑值包括在内.
3. t-检测准则
实验数据按大小顺序排列:
可以看出,样本平均数并非总体平均数,它还包含试验误 差的成分。
试验表面效应为:
x 0= 0=( 0)
试验的 处理效
应
试验误 差
如果处理效应不存在(即( 0)=0 ),则表面效应
仅由误差造成,此时可以说两总体平均数无显著差异;如果 处理效应存在,则表面效应不仅由误差造成,更主要由处理 效应影响。
1.2 几种常用可疑值的检出方法
1. 利用算术平均误差δ 检查 • 除去可疑值后,求出δ
x可疑
• 计算可疑值与平均值之差d =| x可疑 - x |
• 若d≥2.5 δ 时, 可疑值舍去;反之,保留.
2 拉衣达准则
对于实验数据x1,x2,…xn,先计算出平均值 x 和标准差s,
若某个可疑值的离均差满足|di|=|xi - x |>3s(或 2s),
所以,判断处理效应是否存在是假设检验的关健。
2.2 统计假设检验的基本思想 小概率事件实际不可能性原理 α = 0.05 0.01 0.001称之为小概率事件。
小概率事件不是不可能事件,但在一次试验中出现的可能 性很小,不出现的可能性很大,以至于实际上可以看成是 不可能发生的。
小概率事件实际不可能性原理是统计学上进行假设检验 (显著性检验)的基本依据。
以上这几种问题的判断均是由样本去推断总体的,属 于统计假设检验问题,均是来判断数据差异、分布差异是 由处理引起,还是仅仅由于随机误差引起的。
样本虽然来自于总体,但样本平均数并非是总体平均 数。由于抽样误差的影响(随机误差总是存在),样本平 均数与总体平均数之间往往有偏差,并把该偏差称为表面 效应 x 0 。
种酿造食醋能够改变醋酸含量,试验的处理效应存在。
对前例分析,无效假设H0: = 0=9.75% 成立,试
验的表面效应是随机误差引起的。那么,可以把试验中所
x 获得的
看成是从 0 总体中抽取的一个样本平均数,
由样本平均数的抽样பைடு நூலகம்布理论可知,
x ~ N(μ0,σ2/n)。
构造统计量:
u x 0 x 0 ~ N(0,1) (4-1) 2 / n
小概率事件在一次试验中被认为是不可能发生的。
2.3 统计假设检验的基本原理
1. 对研究总体提出假设 H0: 无效假设、原假设、零假设(null hypothesis)
是被检验的假设,通过检验可能被接受,也可能被否定。
HA: 备择假设(alternative hypothesis)
与H0对应的假设,只有是在无效假设被否定后才可接 受的假设。无充分理由是不能轻率接受的。
异常值可能出现在极端值
Xmin=x1 或 Xmax = xn ,若有
则可以判断Xmin 或 Xmax为异常值,予以剔除. 注: 计算平均值和标准偏差时可疑值不包括在内.
K(n,α )为t检验系数,可从下表中查得
§2 统计假设检验
2.1 统计假设检验的意义
例1:某一酿造厂新引进一种酿醋曲种,以原曲种为 对照进行试验。已知原曲种酿出的食醋醋酸含量平 均为μ 0=9.75%,其标准差为σ =5.30%。现采用 新曲种酿醋,得到30个醋样,测得其醋酸含量平均
§1.可疑值的检验
1.1 可疑值和异常值 可疑值:当对同一样品进行重复测定时,一组数据中有 一、两个测定值明显地偏大或偏小,称之为可疑值; eg.酸碱滴定检测中,获得下列数据: 5.38, 5.38, 5.39, 5.40,5.41, 5.51
可疑值的处理: 1. 经分析,是属于技术上的失误,不论是否属于可疑值, 均应舍弃; 2. 若不能确定是技术上的失误,则应进行统计假设检验.
为 x = 11.99%。试问,能否由这30个醋样的平均
数 x 判断新曲种好于原曲种?
食醋醋酸含量的差异是由于采用新曲种引起 的还是由于试验误差引起的?
例2:A,B两种肥料,在相同条件下各施用于5个小区的
水稻上,水稻产量平均分别为 xA=500kg,xB=520kg ,二
者相差20kg.
那么20kg差异究竟是由于两种肥料的不同而造成的 还是由试验的随机误差造成的?
然备择假设被否定;反之,否定了无效假设,说明差异显 著,也就是接受了备择假设。
如前例,原假设H0:= 0=9.75%,即假设由新曲种酿
造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等, 这个假设表明: 采用新曲种酿造食醋对提高醋酸含量是无 效的,试验的表面效应是随机误差引起的。
对应的备择假设为 0=9.75% ,即表明: 采用新曲
无效假设:
假设总体参数(μ )与某一定值(μ 0)相等,记作 H0:μ =μ 0
或两个总体参数(μ 1,μ 2)相等,记作 H0:μ 1=μ 2,或H0:μ 1-μ 2=0,
即假设处理间没有效应, 无显著差异。
备择假设:
与无效假设相对应的另一种统计假设,记作
HA:μ ≠μ 0或HA:μ 1≠μ 2; 如果测验结果接受了无效假设,说明无显著差异,当
通过试验测定得到的每个观测值 xi ,既由被测个体所属
总体的特征决定,又受其它诸多无法控制的随机因素的影响。
所以观测值 xi 由两部分组成,即
xi = + i
总体平均数 反映了总体特征,i 表示试验误差。
若样本含量为n ,则样本平均数:
x xi n ( i)/ n
n
由样本值计算统计量u值,
u x 0 x 0 2 / n
n = 0.119 0.0975=2.315 0.053 / 30
由正态分布双侧分位数(uа)可知
P u 1.96=0.05 P u 2.58=0.01
本例计算出的统计量u=2.315, 1.96< u <2.58,所以可推知其概率
3s (或2s) 作为极限误差,则认为xi是异常数据,予以剔除。
选择 3s 还是 2s 作为极限误差,取决于检验的显著性水平α , 或者可信度1- α .
3s相当于显著性水平α =0.01, 2s相当于显著性水平α =0.05. 注:计算平均值和标准差时可疑值包括在内.
3. t-检测准则
实验数据按大小顺序排列:
可以看出,样本平均数并非总体平均数,它还包含试验误 差的成分。
试验表面效应为:
x 0= 0=( 0)
试验的 处理效
应
试验误 差
如果处理效应不存在(即( 0)=0 ),则表面效应
仅由误差造成,此时可以说两总体平均数无显著差异;如果 处理效应存在,则表面效应不仅由误差造成,更主要由处理 效应影响。
1.2 几种常用可疑值的检出方法
1. 利用算术平均误差δ 检查 • 除去可疑值后,求出δ
x可疑
• 计算可疑值与平均值之差d =| x可疑 - x |
• 若d≥2.5 δ 时, 可疑值舍去;反之,保留.
2 拉衣达准则
对于实验数据x1,x2,…xn,先计算出平均值 x 和标准差s,
若某个可疑值的离均差满足|di|=|xi - x |>3s(或 2s),
所以,判断处理效应是否存在是假设检验的关健。
2.2 统计假设检验的基本思想 小概率事件实际不可能性原理 α = 0.05 0.01 0.001称之为小概率事件。
小概率事件不是不可能事件,但在一次试验中出现的可能 性很小,不出现的可能性很大,以至于实际上可以看成是 不可能发生的。
小概率事件实际不可能性原理是统计学上进行假设检验 (显著性检验)的基本依据。
以上这几种问题的判断均是由样本去推断总体的,属 于统计假设检验问题,均是来判断数据差异、分布差异是 由处理引起,还是仅仅由于随机误差引起的。
样本虽然来自于总体,但样本平均数并非是总体平均 数。由于抽样误差的影响(随机误差总是存在),样本平 均数与总体平均数之间往往有偏差,并把该偏差称为表面 效应 x 0 。
种酿造食醋能够改变醋酸含量,试验的处理效应存在。
对前例分析,无效假设H0: = 0=9.75% 成立,试
验的表面效应是随机误差引起的。那么,可以把试验中所
x 获得的
看成是从 0 总体中抽取的一个样本平均数,
由样本平均数的抽样பைடு நூலகம்布理论可知,
x ~ N(μ0,σ2/n)。
构造统计量:
u x 0 x 0 ~ N(0,1) (4-1) 2 / n
小概率事件在一次试验中被认为是不可能发生的。
2.3 统计假设检验的基本原理
1. 对研究总体提出假设 H0: 无效假设、原假设、零假设(null hypothesis)
是被检验的假设,通过检验可能被接受,也可能被否定。
HA: 备择假设(alternative hypothesis)
与H0对应的假设,只有是在无效假设被否定后才可接 受的假设。无充分理由是不能轻率接受的。
异常值可能出现在极端值
Xmin=x1 或 Xmax = xn ,若有
则可以判断Xmin 或 Xmax为异常值,予以剔除. 注: 计算平均值和标准偏差时可疑值不包括在内.
K(n,α )为t检验系数,可从下表中查得
§2 统计假设检验
2.1 统计假设检验的意义
例1:某一酿造厂新引进一种酿醋曲种,以原曲种为 对照进行试验。已知原曲种酿出的食醋醋酸含量平 均为μ 0=9.75%,其标准差为σ =5.30%。现采用 新曲种酿醋,得到30个醋样,测得其醋酸含量平均