第四章显著性检验
显著性检验
显著性检验对所有自变量与因变量之间的直线回归关系的拟合程度,可以用统计量R2来度量,其公式如下:TSS(Total Sum of Squares)称为总平方和,其值为,体现了观测值y1,y2,…,y n总波动大小,认为是在执行回归分析之前响应变量中的固有变异性。
ESS(Explained Sum of Squares)称为回归平方和,是由于y与自变量x1,x2,…,x n的变化而引起的,其值为,体现了n个估计值的波动大小。
RSS(Residual Sum of Squares)称为残差平方和,其值为。
R2称为样本决定系数,对于多元回归方程,其样本决定系数为复决定系数或多重决定系数。
回归模型的显著性检验包括:①对整个回归方程的显著性检验;②对回归系数的显著性检验。
对整个回归方程的显著性检验的假设为“总体的决定系统ρ2为零”,这个零假设等价于“所有的总体回归系数都为零”,即:检验统计量为R2,最终检验统计量为F比值,计算公式为:F比值的意义实际上是“由回归解释的方差”与“不能解释的方差”之比。
检验回归方程是否显著的步骤如下。
第1步,做出假设。
备择假设H1:b1,b2,…,b k不同时为0。
第2步,在H0成立的条件下,计算统计量F。
第3步,查表得临界值。
对于假设H0,根据样本观测值计算统计量F,给定显著性水平α,查第一个自由度为k,第二个自由度为n-k-1的F分布表得临界值F(k,n-k-1)。
当F≥Fα(k,n-k-1)时,拒绝假设H0,则认为回归方程α显著成立;当F<Fα(k,n-k-1)时,接受假设H0,则认为回归方程无显著意义。
对某个回归参数βi的显著性检验的零假设为:H0:βi=0,检验的最终统计量为:具体步骤如下。
(1)提出原假设H0:βi=0;备择假设H1:βi≠0。
(2)构造统计量,当βi=0成立时,统计量。
这里是的标准差,k为解释变量个数。
(3)给定显著性水平α,查自由度为n-k-1的t分布表,得临界值。
显著性检验
二、显著性检验方法
(一) t检验法——检验准确度的显著性差异
• 1.标准样品对照试验法:选用其组成与试样相近的标准试样, 或用纯物质配成的试液按同样的方法进行分析对照。如验证新 的分析方法有无系统误差。若分析结果总是偏高或偏低,则表 示方法有系统误差。 • 2.标准方法对照试验法:选用国家规定的标准方法或公认的可 靠分析方法对同一试样进行对照试验,如结果与所用的新方法 结果比较一致,则新方法无系统误差。
12.71
4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26 2.23 2.09 1.96
63.66
9.92 5.84 4.60 4.03 3.71 3.50 3.36 3.25 3.17 2.84 2.58
2017/1/16
7
2017/1/16
ta,f值表
f P=0.90(a=0.10) 置信度(显著性水平) P=0.95(a=0.05) P=0.99(a=0.01)
1
2 3 4 5 6 7 8 9 10 20 ∞
6.31
2.92 2.35 2.13 2.02 1.94 1.90 1.86 1.83 1.81 1.72 1.64
10.79% 10.77% t 9 1.43 0.042%
当P 0.95, f 8时,t0.05,8 2.31
因t t0.05,8 x与之间无显著性差异
2017/1/16
例2:采用不同方法分析某种试样,用第一种方法测定 11次,得标准偏差s1=0.21%;第二种方法测定9次 得到标准偏差s2=0.60%。试判断两方法的精密度间 是否存在显著差异?(P=95%)
(二) F检验法—— 检验精密度的显著性差异
显著性检验.
显著性检验可能出现两种类型的错误: Ⅰ型错误 与Ⅱ型错误。
Ⅰ型错误又称为 错误,就是把非真实 的差异错判为是真实的差异,即实际上H0正 确,检验结果为否定H0。犯Ⅰ类型错误的可
能性一般不会超过所选用的显著水平 ;
上一张 下一张 主 页 退 出
Ⅱ型错误又称为 错误 ,就是把真实的 差异错判为是非真实的差异 ,即实际上HA 正确,检验结果却未能否定H0 。 犯Ⅱ类型 错误的可能性记为 ,一般是随着 0 的 减小或试验误差的增大而增大,所以 0
退 出
因为两个水稻品种平均产量 x1 、 x2 都 是从试验种植的10个小区获得,仅是两个品 种有关总体平均数 1 , 2 的估计值。由于存 在试验误差 ,样本平均数并不等于总体平均 数 ,样本平均数包含总体平均数与试验误差 二部分,即
x1 1 1
x2 2 2
上一张 下一张 主 页 退 出
上一张 下一张 主 页
退 出
如,某地进行了两个水稻品种对比试验,
在相同条件下,两个水稻品种分别种植10个
小区,获得两个水稻品种的平均产量为:
x1 510
x2 500
x1 x2 10
我们能否根据 x1 x2 10 就判定这两个 水稻品种平均产量不同?结论是,不一定。
上一张 下一张 主 页
若| u| < u ,则 不 能 在 定 H0 : 0 。
水平上否
上一张 下一张 主 页
退 出
区间 平
上的否定域,而区间 (u , u ) 称为 水平上的接受域。
, u
和
u ,
称为水 则
上一张 下一张 主 页
第四节 百分数资料差异显著性检验
第四节百分数资料差异显著性检验在第四章介绍二项分布时曾指出:由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分数资料,如成活率、死亡率、孵化率、感染率、阳性率等是服从二项分布的。
这类百分数的假设检验应按二项分布进行。
当样本含量n较大,p不过小,且np和nq均大于5时,二项分布接近于正态分布。
所以,对于服从二项分布的百分数资料,当n足够大时,可以近似地用u检验法,即自由度为无穷大时(df=∞)的t检验法,进行差异显著性检验。
适用于近似地采用u检验所需的二项分布百分数资料的样本含量n见表5-8。
表5-8适用于近似地采用u检验所需要的二项分布百分数资料的样本含量n(样本百分数)(较小百分数的次数)(样本含量)0.5 0.40.30.20.10.051520244060703050802006001,400与平均数差异显著性检验类似,百分数差异显著性检验分为样本百分数与总体百分数差异显著性检验及两样本百分数差异显著性检验两种。
1.样本百分数与总体百分数差异显著性检验在实际工作中,有时需要检验一个服从二项分布的样本百分数与已知的二项总体百分数差异是否显著,其目的在于检验一个样本百分数所在二项总体百分数p是否与已知二项总体百分数p0相同,换句话说,检验该样本百分数是否来自总体百分数为p0的二项总体。
这里所讨论的百分数是服从二项分布的,但n足够大,p不过小,np和nq均大于5,可近似地采用u检验法来进行显著性检验;若np或nq小于或等于30时,应对u进行连续性矫正。
检验的基本步骤是:(一)提出无效假设与备择假设,(二)计算u值或值u值的计算公式为:(5-8)矫正u值u c的计算公式为:(5-9)其中为样本百分数,为总体百分数,为样本百分数标准误,计算公式为:(5-10)(三)将计算所得的u或的绝对值与1.96、2.58比较,作出统计推断若(或)<1.96,p>0.05,不能否定,表明样本百分数与总体百分数差异不显著;若<2.58,0.01<p≤0.05,否定,接受,表明样本百分数与总体百分数差异显著;若,,否定,接受,表明样本百分数与总体百分数差异极显著。
第四章显著性检验
(三)统计推断
根据小概率事件实际不可能性原理作出否定或接受无效假设的 推断。
显著水平:用来否定或接受无效假设的概率标准,记作 在生物学研究中常取 =0.05,称为5%显著水平; 或 =0.01,称为1%显著水平或极显著水平。
u 两尾概率为0.05的临界值 0.05=1.96,两尾概率为0.01的临界
比较两个样本所在的总体是否有差异?
例4.2 某地进行了两个水稻品种对比试验,在相同条件下, 两个水稻品种分别种植10个小区,获得两个水稻品种的平均
产量为: x1 510 x2 500 ,判定这两个水稻品种平均产
量是否相同?
比较:1 2
估计:x1 1 1
x2 2 2
表明表面差异是抽样误差的可能性非常小,
表述为两个总体间差异极显著。记作u:**
0.5
f (u)
0.4
0.3
0.2
0.1
0.0
-3
-2
否定域
-1
0
1
接受域
2
3
否定域
图5.1 5%显著水平假设测验图示
区间 , u 和 u , 称为 水平上的否定域,
而区间 (u , u ) 则称为 水平上的接受域。
2. 计算t值
x = x = 32.5 28.6
n
9
29.7 =29.255
S x2 ( x)2 / n n 1
32.52 28.62 29.72 (263.3)2
9
9 1
53.542 9 1
2.587
S 2.587
Sx =
= n
=0.862
0.5
0.4
第四章 显著性检验 《生物统计学》课件
上一张 下一张 主 页 退 出
P(| u |>2.58) = P( u >2.58)+ P( u <-2.58) =0.01
根据样本数据计算所得的 u 值为2.526,
介于两个临界 u 值之间,即:
u0.05 <2.526< u0.01
上一张 下一张 主 页 退 出
0
0
因而,不能仅凭统计推断就简单 地作出绝对肯定或绝对否定的结论。
“有很大的可靠性,但有一定的
错误率” 这是统计推断的基本特点。
上一张 下一张 主 页
退 出
为了降低犯两类错误的概率,一般从选取 适当的显著水平 和增加试验重复次数 n 来考 虑。因为选取数值小的显著水平 值可以降低 犯Ⅰ类型错误的概率,但与此同时也增大了犯 Ⅱ型错误的概率,所以显著水平 值的选用要 同时考虑到犯两类错误的概率的大小。
u
差异显著 ”,在计算所得的 值的右
上一张 下一张 主 页 退 出
上方标记“*”;
若| u |≥2.58,则说明试验的表面差异 属于试验误差的概率 p 不超过 0.01 ,即 p ≤0.01 ,表面差异属于试验误差的可能性更 小,应否定H0: 计学上把这一检验结果表述为: “总体平均
0 ,接受HA: 0 。统
x
一已知正态总体中抽样所获得的样本平均数
x
的分布。
上一张 下一张 主 页 退 出
第三章已述及,若 x 平均数x
N ( x , )
2 x
将其标准化,得
u x x
N (, ) ,则样本 , , , x x n
2
《显著性检验》课件
方差分析
1 原理
通过比较多个样本的均值之间的差异,判断 差异是否显著。
2 单因素方差分析
用于比较一个因素对多个组之间的差异是否 显著。
3 多因素方差分析
用于比较多个因素对多个组之间的差异是否 显著。
4 实例演示
以不同培训方法的绩效评估数据为例,演示 如何进行方差分析。
卡方检验
1 原理
通过比较观察频数与期望 频数之间的差异,判断差 异是否显著。
2 展望
显著性检验在未来的发展中将更加精确和高效。
2 步骤
建立假设、计算卡方值、 查找卡方分布临界值、判 断显著性。
3 实例演示
以实际调查数据为例,演 示如何进行卡方检验。
F检验
1 原理
通过比较不同组之间的方差之间的差异,判 断差异是否显著。
2 单因素F检验
用于比较一个因素对多个组之间的方差差异 是否显著。
3 多因素F检验
用于比较多个因素对多个组之间的方差差异 是否显著。
2 步骤
3 实例演示
确定假设、计算t值、查找 t分布临界值、判断显著性。
以一个医疗研究的样本数 据为例,演示如何进行单 样本t检验。
双样本t检验
1 原理
通过计算两个独立样本的 均值之间的差异,判断差 异是否显著。
2 步骤
3 实例演示
确定假设、计算t值、查找 t分布临界值、判断显著性。
以两组产品的销售数据为 例,演示如何进行双样本t 检验。
《显著性检验》PPT课件
在这个PPT课件中,我们将介绍显著性检验的定义、目的和基本要求,以及不 同类型的显著性检验的原理、步骤和实例演示。
引言
1 定义
显著性检验是一种统计方法,用于判断样本数据是否与期望值存在显著差异。
统计4:显著性检验
统计4:显著性检验在统计学中,显著性检验是“假设检验”中最常⽤的⼀种,显著性检验是⽤于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。
⼀,假设检验显著性检验是假设检验的⼀种,那什么是假设检验?假设检验就是事先对总体(随机变量)的参数或总体分布形式做出⼀个假设,然后利⽤样本信息来判断这个假设是否合理。
在验证假设的过程中,总是提出两个相互对⽴的假设,把要检验的假设称作原假设,记作H0,把与H0对⽴的假设称作备择假设,记作H1。
假设检验需要解决的问题是:指定⼀个合理的检验法则,利⽤已知样本的数据作出决策,是接受假设H0,还是拒绝假设H0。
1,假设检验的基本思想假设检验的基本思想是⼩概率反证法思想。
⼩概率思想是指⼩概率事件(P<0.01或P<0.05)在⼀次试验中基本上不会发⽣。
反证法思想是先提出原假设(记作假设H0),再⽤适当的统计⽅法确定原假设成⽴的可能性⼤⼩:若可能性⼩,则认为原假设不成⽴;若可能性⼤,则认为原假设是成⽴的。
2,假设检验的思路假设检验思路是:先假设,后检验,通俗地来说就是要先对数据做⼀个假设,然后⽤检验来检查假设对不对。
⼀般⽽⾔,把要检验的假设称之为原假设,记为H0;把与H0相对对⽴(相反)的假设称之为备择假设,记为H1。
如果原假设为真,⽽检验的结论却劝你拒绝原假设,把这种错误称之为第⼀类错误(弃真),通常把第⼀类错误出现的概率记为α;就是说,拒绝真假设的概率是α。
如果原假设不真,⽽检验的结论却劝你接受原假设,把这种错误称之为第⼆类错误(取伪),通常把第⼆类错误出现的概率记为β;就是说,接受假假设的概率是β。
因此,在确定检验法则时,应尽可能使犯这两类错误的概率都较⼩。
⼀般来说,当样本容量固定时,如果减少犯⼀类错误的概率,则犯另⼀类错误的概率往往增⼤。
如果要使犯两类错误的概率都减少,除⾮增加样本容量。
⼆,显著性检验什么是显著性检验?在给定样本容量的情况下,我们总是控制犯第⼀类错误的概率α,这种只对犯第⼀类错误的概率加以控制,⽽不考虑犯第⼆类错误的概率β的检验,称作显著性检验。
第四章 显著性检验.ppt
本章主要内容及难点
1.首先介绍显著性检验的基本原理和步骤; 2.其次介绍显著水平、两类错误、一尾检验、
两尾检验的概念; 3.单个样本平均数的t检验 4.配对资料t检验,非配对资料t检验 5.百分数资料的u检验 难点:显著性检验基本原理理解,t检验、u
检验的使用条件。
第一节 显著性检验 的基本原理
总体
抽样 分布
样本 样本 样本 样本 样本
统计 推断
总体
图 抽样分布与统计推断的关系
第四章 显著性检验
统计推断 假设检验 参数估计
显著性检验 点估计 区间估计 t, u, F,χ2检验
第一节 显著性检验基本原理 第二节 单个样本平均数的显著性检验 第三节 两个样本平均数差异的显著性检验 第四节 百分数资料的显著性检验 率五节 参数的区间估计
布规律,计算表面差异(x 0 )全
由抽样误差造成的概率有多大。也就是 计算无效假设成立这个事件的概率有多 大。
x
本例是在无效假设H0: 0 成立的前
提下,研究从N(300,9.52)总体中以n=9
抽样所得样本平均数 x 的分布。由抽样分
布结论知:
x~N(,x2)~N0,2/n
正态分布概率计 是算 对首 变x标 先 量准化
一、显著性检验的意义
显著性检验的意义在于:区分样本统计 数与所在总体参数的差异是由试验误差 引起,还是二者本质不同。
例如,大豆籽粒蛋白质含量高于45%(记为 μ0)的品种为高蛋白品种。某种子公司对一大 豆新品种随机抽取5个样品进行测定。我们
0.05,即表面差异属于试验误差的可能 性大。统计学上把这一检验结果表述为: “总体平均数μ与μ0差异不显著”;
能否根据1.5%就认定该大豆新品种就是高蛋白 品种?
显著性检验
原理
无效假设
显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的几率(P)水平的选择。所谓“无效假 设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无 效。经统计学分析后,如发现两组间差异是抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实 验处理无效)。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处 理有效) 。
抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结 论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。
含义
显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方 法。
常把一个要检验的假设记作H0,称为原假设(或零假设) (null hypothesis),与H0对立的假设记作H1,称 为备择假设(alternative hypothesis)。
“无效假设”成立的机率水平
检验“无效假设”成立的机率水平一般定为5%,其含义是将同一实验重复100次,两者结果间的差异有5次以 上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为p>0.05。若两者结果间的 差异5次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为显著,常记为p≤0.05。如果 p≤0.01,则认为两组间的差异为非常显著 。
显著性检验是针对我们对总体所作的假设做检验,其原理就是 “小概率事件实际不可能性原理”来接受或否 定假设。所谓 “显著”,就是指两种或多种处理试验结果之间,本身确实存在差异。如果是 “不显著”,就说 明它们之间的差异是由抽样或偶然的因素引起的,不是真正有实际差异存在。
第四章-显著性检验
具体到这个例子,备择假设意味着喷洒 增产素的玉米单穗重总体平均数μ与原来 的玉米单穗重总体平均数μ 0 之间存在真实 差异。
(二)计算概率
在无效假设成立
前提下,根据所检验的统计数的抽样分 布规律,计算表面差异( x
0
)全
由抽样误差造成的概率有多大。也就是 计算无效假设成立这个事件的概率有多 大。
Ⅱ型错误又称β错误,本来无效假设
H0是错误的,但检验结果却接受H0。就是把
真实差异当成试验误差。 犯Ⅱ型错误,一般是随着
0
的减小或试验误差的增大而增大。犯Ⅱ型 错误的原因是原假设下的抽样分布与真实 分布发生部分重叠。
为了降低犯两类错误的概率,一 般从选取适当的显著水平α和增加试验 重复次数n来考虑。 β
0
成立的可能
0)全由
抽样误差造成的概率在0.01~0.05之间。
(三)统计推断 根据小概率原理作出否 定或不能否定无效假设的推断。 若随机事件的概率很小,例如小于0.05, 0.01,0.001,称之为小概率事件。 在统计学上,把小概率事件在一次试验 中看成是实际不可能发生的事件,称为小概 率事件实际不可能原理。
又如,某地做了两个水稻品种对比试验, 在相同条件下,两个水稻品种分别种植10个 小区,获得两个水稻品种的平均产量为
x1 =510㎏/666.7㎡、 x 2 =500㎏/666.7㎡。
x1 x 2 =10㎏/666.7㎡。仅凭这个表面差值
我们照样不能判断两个水稻品种生产潜力本 质上不同。
由 x
若1.96≤|u|<2.58,则说明试验的 表面差异属于试验误差的概率p在 0.01——0.05之间,即0.01<p≤0.05, 表面差异属于试验误差的可能性较小。 统计学上把这一检验结果表述为:“总 体平均数μ与μ0差异显著”,u值右上 方标记 *;
第四章显著性检验1016
32.5、28.6、28.4、24.7、29.1、 27.2、29.8、33.3、29.7(g) 问新育成品种的千粒重与汕优63有无显 著差异?
1.提出假设
H0 : 0 27.5
H A : 27.5g 。
2、 计算t值 t值计算公式为
客观实际
H0 成立 H0 不成立
检验结果
否定 H0 Ⅰ型错误( )
接受 H0 推断正确(1- )
推断正确(1- ) Ⅱ型错误( )
• 为了降低犯两类错误的概率,一般从选取
适当的显著水平 和增加试验重复次数n 来考 虑。因为选取数值小的显著水平 值可以降低
犯Ⅰ类型错误的概率,但与此同时也增大了犯
第四章 显著性检 验
1.1.2 统计假设检验的基本原理
小概率事件实际不可能性原理
在统计学上,把小概率事件在一次试验中看成 是实际不可能发生的事件称为小概率事件实际不 可能性原理,亦称为小概率原理。
小概率事件实际不可能性原理是统计学上进行 假设检验(显著性检验)的基本依据。
概率小于0.05称之为小概率事件。
• 四、两尾检验与一尾检验
在【例4·1】中,对应于无效假设 H0:
0的备择假设为HA: 0。 HA实际
上包含了 0或 0 这两种情况。此时,
在水平上否定域为 , u 和 u , ,对
u 称地分配在 分布曲线的两侧尾部,每侧尾部
的概率为 / 2 。这种利用两尾概率进行的检
验叫两尾检验. u 为 水平两尾检验的临界
1.提出假设
H0 : 0 216.5g
H A : 216.5g
2. 确定显著水平 α=0.05 3、 计算 u 值 u 值计算公式为
数据的评价-显著性检验
02
常见显著性检验方法
t检验
用于比较两组数据是否有显著差异的 统计方法。
t检验主要用于比较两组数据的均值是 否存在显著差异。它基于假设检验原 理,通过计算t值和对应的p值来判断 两组数据的差异是否具有统计学上的 显著性。
Z检验
用于检验两组比例或比率是否有显著差异的统计方法。
Z检验基于大样本近似正态分布的原理,通过计算Z值和对应的p值来判断两组比例或比率是否存在显著差异。它常用于检验 两组比例或比率是否有显著差异,如市场调查中的样本比例比较。
如果数据不满足正态分布,可以考虑对数据进行适当的 转换或采用非参数检验方法,以获得更可靠的检验结果 。在选择适当的统计方法时,应根据数据的分布特征和 研究目的进行综合考虑。
多重比较的问题
在进行多重比较时,如多个样本间的两两比较,应谨慎处理显著性水平。由于多重比较会增加假阳性错误的风险,因此应采 用适当的统计方法控制假阳性率,如Bonferroni校正或Fisher最小显著差异法等。
03
显著性检验的目的是确定观察到的数据变化是否可 以归因于因素的作用,而不是随机误差。
显著性检验的目的
验证假设
通过显著性检验,可以验证某一 假设是否成立,即观测到的数据 是否支持该假设。
决策依据
显著性检验的结果可以为决策提 供依据,例如在实验或调查中判 断某处理或因素是否有效。
控制误差
显著性检验有助于控制误差,排 除随机因素对观测结果的影响, 从而更准确地解释数据。
市场细分
02
通过显著性检验对市场进行细分,识别不同细分市场的特征和
需求,为营销策略提供依据。
产品测试与评估
03
显著性检验用于评估新产品或服务的市场接受度、竞争力和潜
第四章_t检验原理
概率,它是判断H0成立与否的依据。
确定P值的方法主要有两种
⑴查表法 根据检验水准、样本自由度
直接查相应的界值表求出P值。
⑵计算法 用特定的公式直接求出P值
。
推论
若,本P则是>结来α论自,为于就不该没拒总有绝体理H的0由结,怀论做疑,出H也不0即否的差定真别此实无样性
二、假设检验的基本步骤
例题:根据大量调查,已知健康成年 男子的脉搏均数为72次/分。某医生在 某医院随机调查30名脾虚男子,求得 脉搏均数为74.2次/分,标准差为7.5 次/分。脾虚病人的脉搏是正态分布, 问脾虚男子的脉搏均数与一般成年男 子的脉搏均数是否相等?
分析:
把一般成年男子的脉搏均数看作一个总 体均数,脾虚男子的脉搏均数为样本 均数。
1.单因素分析亦称一元分析,是在主要的非处理因素相同 的条件下,不管影响结果的处理因素(如病人年龄、病 情、辩证分型、病理类型、药物剂型、用药途径、疗程 等)有多少,每次仅分析一个处理因素与效应之间关系 的统计方法。
2.多因素分析亦称多变量分析或多元分析,是研究多因素 和多指标之间的关系以及具有这些因素的个体之间关系 的一种统计分析方法。
学意义。
假设检验有双侧检验和单侧检验
若目的是推断两总体均数是否不等,应选用双侧检验。
H0:=0,H1:0 若从专业知识已知不会出现0 (或0)的情况,则
选用单侧检验。
H0:=0,H1:0 (或0)
确定检验水准
检验水准亦称显著性水准,符号为α,
指由假设检验做出推断结论时发生假阳 性错误的概率。
α常取0.05或0.01。
非参数检验是一类不依赖总体分布的具体形式的统 计方法。如Ridit分析、秩和检验、符号检验、中 位数检验、序贯试验、等级相关分析等。
显著性检验
显著性检验显著性讨论显著性之前,先介绍一个法学史上著名的案件:辛普森杀妻案。
辛普森是美国著名的橄榄球运动员,其妻子在1994 年夏天的某个夜晚被杀害,警察在调查案件的过程中将辛普森定为唯一的嫌疑人。
在美国是适用无罪推定的,所以当这个案件开庭审理时,辛普森是被假设无罪的(零假设),检方(提起诉讼的检察院)需要提供证据证明其有罪(对立假设)。
在诸多证据中,一个很有力的间接证据是警察在凶案现场找到了辛普森的血迹,单从这一点看似乎已经能证明辛普森至少在案发现场出现过,甚至可以间接证明他就是凶手,可谓是铁证如山。
到这里,似乎已经可以给辛普森定罪了,因为有了很可靠的证据证明零假设是不成立的。
不过,检方有个强大的对手,由六名顶尖律师组成,被称为“梦之队”的辩方律师团。
辩方律师考察了警察调查凶案中的每一个过程,发现采集血样的流程不符合规范。
按照正常程序,在采集血迹时应当先用棉花沾起血迹样本,待自然风干后才能放入证据袋中,可是警方检验人员在血迹尚未风干时就已将样本放入证据袋。
在刑事诉讼的证据认定环节,血迹和 DNA 检验结果是毋庸置疑的铁证,但是,如果血迹受到污染、不当处理、草率采集或有人故意栽赃,那么它的可信度会大幅降低。
由于警方的操作失误,检方最重要的“铁证”被认定无效。
辛普森案中的血迹证据是能推翻零假设的有力证据。
但是,这个证据要具备一定的可靠度才能有效。
诉讼中的证据的可靠性,就是假设检验中证明零假设无效证据的显著性。
在该案中,检方收集了很多其他证据,包括毛发、带血迹手套等,都因辩方质疑其可靠性而无效。
显著性检验证据要达到某一个显著性水平才可以推翻零假设。
在通常经验中,统计学家喜欢用 5%作为显著性水平的门槛,这意味着如果零假设的成立概率不到 5%,就可以推翻零假设,反过来说,如果对立假设成立的概率超过 95%,也可以推翻零假设。
95% 这个数字看起来是不是很熟悉,这是很重要的一个标志性节点,是 68-95-99.7 法则中的数值(请参阅 7.4.2 节)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测验假设是否正确的过程,就称为一个假设正确性的统
计证明——亦称之为统计假设测验。通过测验发现试验
结果与假设相符,就接受该假设,反之就否定该假设。
• 统计假设可分为无效假设和备择假设。
湖南大学研究生院隆平分院
统计假设的提出: • 对单个平均数的假设:一个样本是从一个具有平均数 μ 的总 体中随机抽出的,记作 H0:µ=µ0。
验方法时,应认真考虑其应用条件和适用范围。 • 选用合理的统计假设。进行显著性检验时,无效假设和备 择假设的选用,决定了采用两尾检验或是一尾检验。
湖南大学研究生院隆平分院
• 两尾检验与一尾检验:
在上述例题中,对应于无效假设H0:
0
的备择假设为
HA : 0 。HA实际上包含了 0 或 0 这两种情
奥玉特1号,在8个小区种植,得其鲜果穗重为:255.0
185.0 252.0 290.0 159.9 190.0 212.7 278.5
(g),试问新引入品种的鲜果穗重与苏玉糯 1号有无 显著差异?
湖南大学研究生院隆平分院
2 由于总体方差 0 已知,且新引入品种的鲜果穗重可能高
于也可能低于原品种,故采用两尾检验。 • 提出假设: H : =216.5g,即新引入品种鲜果 0 0 穗重与苏玉糯1号鲜果穗重相同。 • 计算 u 值:
湖南大学研究生院隆平分院
5、显著性检验应注意的问题 • 要有合理的试验设计和准确的试验操作,避免系统误差、 降低试验误差,提高试验的准确性和精确性。 • 选用的显著性检验方法要符合其应用条件。由于研究变量 的类型、问题的性质、条件、试验设计方法、样本大小等
的不同,所选用的显著性检验方法也不同,因而在选用检
例:晚稻良种汕优63的千粒重
= 0 27.5g。现育成一高产
品种协优辐 819 ,在 9 个小区种植,得其千粒重为:
32.5 、 28.6、 28.4 、 24.7 、 29.1、 27.2 、 29.8 、 33.3 、
29.7(g),试问新育成品种的千粒重与汕优63有无显 著差异?
湖南大学研究生院隆平分院
否定 H 0: 0 216.5g,表明新引入品种鲜果穗
重与苏玉糯1号鲜果穗重差异不显著,可以认为新引入
品种鲜果穗重与苏玉糯1号鲜果穗重相同。
湖南大学研究生院隆平分院
2 2. 总体方差 0 未知且为小样本(n≤30),则用 t 检验
法。 所谓t检验法,就是在显著性检验时利用t分布进行概 率计算的检验方法。
三、显著性检验的步骤
举例来介绍显著性检验的基本步骤。 例:已知某玉米品种单穗重x~N(300,9.52),即单穗重总体
平均数µ0=300g,标准差σ =9.5g。 在种植过程中喷洒了某
种农药的植株中随机抽取9个果穗,测得平均单穗重为308g, 试问这种农药对该玉米单穗重有无真实影响?
湖南大学研究生院隆平分院
于0.01和0.05之间,即:0.01 <p < 0.05,说明假定表面
差异( x 0)是由抽样误差造成的概率在0.01-0.05之间。
湖南大学研究生院隆平分院
• 综上所述,显著性检验,从提出无效假设与备择假设,到 根据小概率事件实际不可能性原理来否定或接受无效假设, 这一过程实际上是应用所谓“概率性质的反证法”对样本 所属总体所作的无效假设的统计推断。 • 上述显著性检验利用了u分布来估计出∣u∣≥2.562的两尾
检验方法是先按研究目的提出一个假设,然后通过试验 或调查,取得样本资料进行统计分析,检查其资料结果是否 与所做假设相符合。若两者甚相符合,则接受假设;如果两 者不符,就予以否定,作出推断。怎样推断两者是否相等? 用什么做标准呢,即怎样确定是否符合的界限呢?
湖南大学研究生院隆平分院
1、提出假设
• 统计假设——关于某一总体参数的假设。而利用样本以
提出无效假设的目的 • 目的在于可以从假设的总体里推论其平均数的随机抽样分 布,可以算出某一样本平均数指定值出现的概率,研究样 本和总体的关系,作为假设测验的理论依据。故假设测验 时直接测验的是无效假设。 • 如果首先提出的是两者有显著差异,即两者不是来自同一
个总体,就建立不起一定的关系,无从计算样本平均数来Βιβλιοθήκη x x = n=
32.5 28.6 29.7 =29.255(g) 9
S
2 2 x ( x ) /n
的可靠程度的高低。 显著性检验只是用来确定无效假设
能否被否定, 而不能证明无效假设是正确的。
湖南大学研究生院隆平分院
统计假设检验的基本步骤
• 提出H0,HA • 规定α 。 • 计算u值(t值, F值等)或划出接受区域,查表得uα (tα ,Fα )值的相应概率。
• 推断:α 值与u值概率比较|u|<uα 就接受H0,|u|>uα
有无差异,而不考虑两 0
图4-2 一尾检验
湖南大学研究生院隆平分院
• 正确理解显著性检验结论的统计意义。显著性检验结论
中的“差异显著”或“差异极显著”不应该误解为相差
很大或非常大,也不能认为在实际应用上一定就有重要或 很重要的价值。“显著”或“极显著”是指表面差异为 试验误差可能性小于0.05或0.01,已达到了可以认为存 在真实差异的显著水平。显著水平的高低只表示下结论
况。此时,在 水平上否定域为 , u 和 u , ,对
称地分配在分布曲线的两侧尾部,每侧尾部的概率为 /2,
如图4-1所示。这种利用两尾概率进行的检验叫两尾检验 。
湖南大学研究生院隆平分院
图4-1 两尾检验 • 两尾检验的目的在于判断 与 者谁大谁小。
湖南大学研究生院隆平分院
湖南大学研究生院隆平分院
• 本例是在假定无效假设H0:µ=µ0成立的前提下,研究在 x~N(300,9.52)这一已知正态总体中抽样所获得的样本 平均数的分布。第三章已述及,若x~N(µ,σ 2),则样本
2 平均数x N (x , x ) ,
x ,
n
,将其标准化,得:
u
x x
率大于0.95。
湖南大学研究生院隆平分院
4、显著水平 • 根据“小概率事件实际不可能发生”的原理接受或否定无效 假设—显著性检验。
• 对无效假设进行统计检验的根据是实验结果由随机误差所致
的概率有多大,但究竟其概率值多大才能接受或否定H0?这 必须定出一个显著性的概率标准,用来否定或接受无效假设 的概率标准就称之为显著水平,记作。
x=
而
x
n
= 255.0 185.0 278.5 =227.887(g)
8
x
0
n
45.2 8
15.981(g)
湖南大学研究生院隆平分院
所以u值为:
u x 0
x
227.887 216.5 0.712 15.981
• 统计推断: 由于计算所得的
u
<u0.05 =1.96 ,故 p > 0.05 。不能
湖南大学研究生院隆平分院
• 在生物学试验中,一般以概率等于0.05或0.01作为标 准,记作α =0.05和α =0.01,称为显著水平或极显著 水平。规定显著水平是为了准确判断该样本是否属于
抽样误差,从而否定或肯定假设。如果实验所得结果
的概率P≤0.05, 则Ho就不可能是真的,差数是显著 的,从而否定H0; 若P≤0.01,就说这个差数极显著, 因此这种假设测验也称显著性检验。
概率,所以称为u 检验。
• 除了u检验外,还常用到t检验、F检验等方法。
湖南大学研究生院隆平分院
3、统计推断 • 根据小概率事件实际不可能性原理做出接受或否定无效假 设的推断。当表面差异是误差造成的概率小于0.05时,在 一次抽样中属于抽样误差造成的是不可能的。而当表面差 异是差异误差的概率大于0.05时,说明无效假设成立的概
湖南大学研究生院隆平分院
• 例如,某地水稻良种的常年平均产量为550kg /667m2(总 体),若一个新品种多点试验结果为600kg/667m2(样本), 试问新品种的产量是否显著高于当地良种? • 新品种产量比当地良种高50kg/667m2,这个差数50kg是表 面效应,可能是新品种产量潜力高所致,也可能是试验误 差造成。如何去判断呢?方法就是就表面效应与试验误差
x
x
x
x 0 n
湖南大学研究生院隆平分院
• 将x
0 300g、 9.5g、n=9,代入上式,得: 308g、
x 0 308 300 u 2.526 n 9.5 9
u0.01=2.58,所以,|u|≥2.526的概率P介 查表, u - 0.05 =1.96,
本例中,可假设喷洒农药对玉米果穗重无效,即喷洒农药果
穗重(µ)与不喷洒农药的果穗重(µ0)相同。 • 对两个平均数相比较的假设:两个样本是从两个具有相等平 均数的总体中随机抽出的,记为H0:µ1=µ2或H0:µ1- µ2 =0。 例如:甲乙两种肥料的肥效相等,两个新品种的产量相
等,……。
湖南大学研究生院隆平分院
湖南大学研究生院隆平分院
二、显著性检验的基本原理
显著性检验的意义:
• 一个试验相当于一个样本,样本平均数可用来估计总体
平均数。但样本平均数是因不同样本而变化的,即样本
平均数存在抽样误差。用存在误差的样本平均数来推断
总体,其结论并不是绝对正确的。
湖南大学研究生院隆平分院
• 试验研究中,试验因素或处理对所研究的性状的作用, 称之为效应。试验所得的结果属于表面效应,包括处理效应 和误差效应。处理效应是表面效应中试验因素所占的部分, 误差效应即表面效应中非试验因素所占的部分。 • 当处理效应比误差效应大、且大到一定程度时, 即表面 效应是属于因试验误差所造成的为小概率事件时,才能认为 处理效应是真实存在的,其差异是处理因素带来的。