第四章统计假设检验
人大版统计学 习题加答案第四章 假设检验
第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。
(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。
KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。
实验数据处理与分析 第四章
某罐头厂生产肉类罐头,其自动装罐机在正常工作
时每罐净重服从正态分布N(500,64)(单位,g) 。某日随机抽查10瓶罐头,得净重为:505,512,
497,493,508,515,502,495,490,510。问装
罐机当日工作是否正常?
为了降低犯两类错误的概率,一般从选取适当的
和增加试验重复次数 n来考虑。因为选取 数值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
著差异。
甲生产线(x1) 71 56 54 71 57 62 69 73 72 65 62 62 54 78 70 58 53 78 63 67 乙生产线(x2) 53 54 60 56 49 51 53 66 58 70 70 66 65 52 71 58 55 53 56 55
74 62 61 77 59
n≥30)。
【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正
常工作时每罐净重服从正态分布N(500,64)(单 位,g)。某日随机抽查10瓶罐头,得净重为:505
,512,497,493,508,515,502,495,490,510
。问装罐机当日工作是否正常?
(1) 提出假设 无效假设H0:μ =μ 0=500g,即当日装罐机每 罐平均净重与正常工作状态下的标准净重一样。 备择假设HA:μ≠μ0,即罐装机工作不正常。 (2)确定显著水平 α =0.05(两尾概率)
小或试验误差越大,就越容易将试验的真实
差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
检验结果 否定 H 0 Ⅰ型错误( ) 推断正确(1- ) 接受 H 0 推断正确(1- ) Ⅱ型错误( )
概率论和数理统计 假设检验
检验统计量T
X 0 S n
~ t ( n 1) —t检验法
H1 : ≠ 0 H1 : > 0 H1 : < 0
T t ( n 1);
2
T t ( n 1) T t ( n 1)
要问:两总体的均值是否有显著的差别? 应设 H0:1=2,H1: 1≠2——双边检验 要问:总体X的均值是否显著比总体Y的均值大? 应设 H0:1 ≤ 2,H1:1——单边检验 2
四、方法的步骤
13
回顾引例的解题过程 1、根据问题的要求,提出假设H0和备择假设H1。
(它的分布应不含任何未知参数,而且可以查出或算出它的分位点。)
原假设 8
二、常用的术语
备择假设
解: 今假设H0 :=0=0.5, 且记H1 :≠0=0.5,
由于X~N(0, 2),故 X ~ N ( 0 , 2 n) 当H0为真时, X 0 检验统计量 进而: U ~ N (0,1) 检 n 验 水 对于给定的 =0.05, 有
U X Y
21
1
n1
2
2 2
~
N (0,1)
n2
作为检验统计量——U检验法。 两总体X与Y的方差 12、22未知,但12=22= 2,用
T S X Y 1 1 n1 n2 ~ t ( n1 n2 2)
拒绝域
双侧检验的拒绝域取在两侧; 单边检验的拒绝域中不等式的取向与备择假设H1中不 等式的取向完全一致。
例2 在正常情况下,某工厂生产的灯泡的寿命X服从正态分布,今
测得10个灯泡寿命为: 19 1490,1440,1680,1610,1500,1750,1550,1420,1800,1580 问能否认为该工厂生产的灯泡寿命 0=1600 (=0.05)?
第四章 假设检验(1)
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
第4章 假设检验(田间试验与统计分析 四川农业大学)
2 2
2
s2 1
s2 2
Hale Waihona Puke s2 es2 e
df1
s2 1
df1
df
2
s
2 2
df2
s2 e
5 2.412 4 3.997 54
3.1164
1.提出假设
H0 :1=2; HA :1≠2 。
2、计算t值
t x1 x2 s x1 x2
s x1 x2
第二节 单个样本平均数的假设检验
在实际研究工作中,常常要检验某样本
所属总体平均数与已知的总体平均数 0 是 否有差异。已知的总体平均数 0 一般为一些
公认的理论数值、经验数值或期望数值。
若σ2已知
u x 0 x
x
n
u检验
s2 若σ2未知
t x 0
sx
sx
s n
x2 1 ( x)2
x x 30.3667(g) s
n
n
2.5328 (g)
n 1
sx
s 0.8443 (g) n
t x 0 30.3667 27.5 3.395
sx
0.8443
df=n-1=9-1=8
t0.05(8) =2.306 t0.01(8) =3.355 | t |=3.395 > t0.01(8)
第四章 假设检验
第一节 假设检验的基本原理 第二节 单个样本平均数的假设检验 第三节 两个样本平均数的假设检验 第四节 百分率资料的假设检验 第五节 参数的区间估计
假设检验(test of hypothesis)又叫显著性 检验 (test of significance),是统计学中的一 个重要内容 。假设检验的方法很多 ,常用的
管理统计学-第4章 假设检验
• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据
假设检验的原理和方法
第四章
do
something
第四章 统计推断
统计推断
由一个样本或一糸列样本所得的结果来推断总体的特征
假设检验
参数估计
统计推断的过程
分析误差产生的原因
任务
确定差异的性质
排除误差干扰
对总体特征做出正确判断
第四章
第一节
第二节
第三节
第四节
第五节
330
实例
?
三、假设检验的步骤
治疗前 0 =126 2 =240
N ( 126,240 )
治疗后 n =6 x =136 未知 那么 =0 ? 即克矽平对治疗矽肺是否有效?
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L), 2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
1 、提出假设
对立
无效假设/零假设/检验假设
备择假设/对应假设
0 =
0
误差效应
处理效应
H0
HA
例:克矽平治疗矽肺病是否能提高血红蛋白含量?
检验治疗后的总体平均数是否还是治疗前的126(mg/L)?
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。
可能错误
例:上例中 P=0.1142>0.05所以接受H0,从而得出结论:使用克矽平治疗前后血红蛋白含量未发现有显著差异,其差值10应归于误差所致。
P( u >1.96) =0.05
P( u >2.58) =0.01
《统计学(第二版)》电子课件 第4章 假设检验
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
第4章参数估计和假设检验
第4章参数估计和假设检验第四章参数估计与假设检验掌握参数估计和假设检验的基本思想是正确理解和应⽤其他统计推断⽅法的基础,后⾯将要学习的⽅差分析、⾮参数检验、回归分析、时间序列等统计推断⽅法都是在此基础上展开的。
需要特别指出的是,所有的统计推断都要以随机样本为基础。
如果样本是⾮随机的,统计推断⽅法就不适⽤了。
由于相关知识在先修课程中已经学习过,本章主要在回顾相关知识的基础上,补充讲解必要样本容量的计算、p值、参数估计和假设检验⽅法的软件操作和结果分析等内容。
本章的主要内容包括:(1)参数估计的基本思想和软件实现。
(2)简单随机抽样情况下样本容量的计算。
(3)假设检验的基本原理。
(4)假设检验中的p值。
(5)⼏种常⽤假设检验的软件实现。
第⼀节参数估计⼀、参数估计的基本概念参数估计是指利⽤样本信息对总体数字特征作出的估计。
例如,我们可以通过估计⼀部分产品的合格率对整批产品的合格率作出估计,通过调查⼀个样本的⼈⼝数来对全国的⼈⼝数作出估计,等等。
参数估计可以分为点估计和区间估计。
点估计是指根据样本数据给出的总体未知参数的⼀个估计值。
对总体参数进⾏估计的⽅法可以有多种,例如矩估计法、极⼤似然估计法等,得到的估计量(样本统计量)并不是唯⼀的。
例如我们可以使⽤样本均值对总体均值作出估计,也可以使⽤样本中位数对总体均值进⾏估计。
因此,在参数估计中我们需要对估计量的好坏作出评价,这就涉及到估计量的评价准则问题。
常⽤的估计量评价准则包括⽆偏性、有效性、⼀致性等。
⽆偏性是指估计量的数学期望与总体参数的真实值相等;有效性的含义是,在两个⽆偏估计量中⽅差较⼩的估计量较为有效,⽅差越⼩越有效;⼀致性是指随着样本容量的增⼤,估计量的取值应该越来越接近总体参数。
样本的随机性决定了估计结果的随机性。
由于每⼀个点估计值都来⾃于⼀个随机样本,所以总体参数真值刚好等于⼀个具体估计值的可能性极⼩。
区间估计的⽅法则以概率论为基础,在点估计的基础上给出了⼀个置信区间,并给出了这⼀区间包含总体真值的概率,⽐点估计提供了更多的信息。
统计学 第4章 假设检验
【解】研究者想收集证据予以支持的假设是该 城市中家庭拥有汽车的比率超过30%。 因此,建立的原假设和备择假设为 H0 :μ≤30% H1 :μ>30%
结论与建议
◆原假设和备择假设是一个完备事件组, 而且相互对立。在一项假设检验中,原假设和 备择假设必有一个成立,而且只有一个成立; ◆先确定备择假设,再确定原假设。因为 备择假设大多是人们关心并想予以支持和证实 的,一般比较清楚和容易确定; ◆等号“=”总是放在原假设上; ◆因研究目的不同,对同一问题可能提出 不同的假设,也可能得出不同的结论。 ◆假设检验主要是搜集证据来推翻和拒绝 原假设。
◆理想地,只有增加样本容量,能同时减小 犯两类错误的概率,但增加样本容量又受到很多 因素的限制; ◆通常,只能在两类错误的发生概率之间进 行平衡,发生哪一类错误的后果更为严重,就首 要控制哪类错误发生的概率; ◆在假设检验中,一般先控制第Ⅰ类错误的 发生概率。因为犯第Ⅰ类错误的概率是可以由研 究者控制的。
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 x = 20
二、原假设与备择假设
什么是假设?
对总体参数的具体数
值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均值、 总体比率、总体方差等 分析之前必须陈述
备择假设。
500g
【解】研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述。 因此,建立的原假设和备择假设为 H0:μ≥500 H1:μ< 500
提出假设例3
一家研究机构估计,某城市中家庭拥有 汽车的比率超过 30% 。为验证这一估计是否 正确,该研究机构随机抽取了一个样本进行 检验。试陈述用于检验的原假设与备择假设
第四章假设检验
x 0 s n
z z / 2
z z
z z
P值决策
P 拒绝H0
总体方差的检验
(检验方法的总结)
假设 假设形式 统计量
2 2 2 (n 1)
双侧检验
左侧检验
右侧检验
H0 : 2= 02 H0 : 2 02 H0 : 2 02 H1 : 2 02 H1 : 2< 02 H1 : 2> 02
第四章 参数检验
学习目标:
1、明确SPss提供了哪几种参数检验的方法 2、掌握Spss单样本t检验 3、掌握Spss两独立样本的t检验,理解t检 验和F检验的不同
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误) 原假设为真时拒绝原假设 第Ⅰ类错误的概率记为 被称为显著性水平 2. 第Ⅱ类错误(取伪错误) 原假设为假时未拒绝原假设 第 Ⅱ 类 错 误 的 概 率 记 为 (Beta)
习题2
某电脑公司2005年前4个月每天的销售量数据: 台)
234 143 187 161 159 198 160 152 187 141 214 149 155 167 168 211 172 194 173 196 183 225 178 234 182 177 184 185 177 189 209 189 163 196 176 196 158 203 188 206
《2012年中秋节国庆节假日旅游统 计报告》游客人均花费支出495元。 学生的考试成绩服从正态分布.现在 从某次《概率论与数理统计》课程 的考试中随机抽取36位学生的考试 试卷,计算得到平均成绩为65分, 标准差为15分.问在显著性水平 α=0.05下,是否可以认为这次考试 全体考生的平均成绩为70分?
似然比检验 4.1 假设检验的基本概念
第四章假设检验§4.1 假设检验的基本概念1.什么是假设检验在数理统计中,人们常常对总体分布中某些参数或分布函数的形式提出某种假设,然后利用样本的有关信息对所作假设的正确性进行推断,这类统计问题称为假设检验。
2. 假设检验的分类:假设检验可分为两大类:(1)参数的假设检验(Parametric test), 当总体分布形式已知,只对某些参数做出假设,进而做出的检验称为参数假设检验;(2)非参数假设检验(Nonparametric test)。
对分布假设做出的检验为非参数假设检验。
3. 假设检验的例子例4.1 某厂有一批产品,共一万件,须经检验后方可出厂。
按规定标准,合格品率需达99%以上。
今在其中抽取100件产品进行抽样检查,发现有4件次品,问这批产品能否出厂?设产品的合格率为1p−,次品率为p,假设检验要解决的问题是:如何根据样品的次品率(4/100)来推断整批产品的次品率是否超过了1%,问题归结为对假设:0H :整批产品的次品率p 不超过1%.作出接受或拒绝的判断。
一、 零假设与备选假设设ℱ为一分布族,ℱ0为ℱ的子分布族,总体的分布为F .一般地,一个假设可以表示为0:H F ∈ℱ0。
如果ℱ是一个参数分布族ℱ=}),;({Θ∈θθx F ,ℱ0=00{(;),},F x θθ∈ΘΘ⊂Θ, 在这种情况下,假设可以表示为参数假设检验的形式00:H θ∈Θ.以下先集中讨论参数假设检验。
一般把上述假设00:H θ∈Θ称为“零假设”或“原假设”。
当零假设被拒绝时,从逻辑上讲就意味着接受一个与之不同的假设(称为“备选假设”)记为1H 。
如果事先不指明备选假设,则拒绝0H 的含义就是接受备选假设11:H θ∈Θ,1Θ⊂Θ。
但在一些实际问题中,常常指明备选假设 1110:,H θ∈ΘΘ⊂Θ−Θ。
一个以0H 为零假设,1H 为备选假设的假设检验问题常记为:0011::H H θθ∈Θ↔∈Θ (4.2)其中0101,Θ∪Θ⊂ΘΘ∩Θ=∅。
假 设 检 验
一、客车空调系统数值模拟仿真的意义
客车车室内部的空气品质是衡量乘坐舒适性的一个重要指标。 车内空气质量的优劣和热舒适性的好坏,不仅直接影响乘客的乘坐感受,还影响乘 员的身体健康。 车内空气环境研究的重点是对空气分布的研究,只有掌握了车内空气流速、温度、 湿度、洁净度等的时空分布,才能准确地对车内空气品质进行预测和评价。 传统的汽车空调系统试验(主要指轿车)利用样机或实车在风洞或环境模拟实验室 内完成,既费时又耗资巨大,且对不同方案试验很不方便,极大影响了新产品的开发周 期。
对于正态总体提出数学期望等于0 的假设等.
假设检验就是根据样本对所提出的假设作出判断: 是接受, 还是拒绝. 假设检验问题是作出这一决策的过程.
4.1 假设检验的基本概念
假设检验的推理方法及其基本原理 推理方法: 带有某种概率性质的反证法。 其基本原理就是 人们在实际问题中经常采用的所谓实际推断原理: 小概率事件在一次试验中几乎是不可能发生的. 下面结合实例来说明假设检验的基本思想.
目前,国际上常见的商业化 CFD 通用软件有: FLOTRAN、CFX、FLUENT、NUMECA、 PHOENICS、STAR-CD 等。
第十章 计算流体动力学在客车空调系统设计中的应用
第一节 影响客车空调系统噪声的主要因素及其噪声控制的基本方法
二、CFD的研究进展及CFD软件
1. FLUENT
第十章 计算流体动力学在客车空调系统设计中的应用
计算流体动力学(Computational Fluid Dynamics,CFD)作为流体力学的一个
分支,是近代流体力学、数值数学和计算机科学结合的产物,是一门具有强大生命力的 边缘学科。它以电子计算机为工具,应用各种离散化的数学方法,对流体力学的各类问 题进行数值实验、计算机模拟和分析研究,以解决各种实际问题。
第四章 假设检验
大,就越容易将试验的真实差异错判为试验误差。
显著性检验的两类错误归纳如下:
表4-1 显著性检验的两类错误
客观实际
H0 成立 H0 不成立
检验结果
否定 H0 Ⅰ型错误( )
接受 H0 推断正确(1- )
推断正确(1- ) Ⅱ型错误( )
与0 有差异而因为试验误差大被掩盖了。
为了降低犯两类错误的概率,一般从选取适当的显
著水平 和增加试验重复次数 n 来考虑。因为选取数 值小的显著水平 值可以降低犯Ⅰ类型错误的概率,
但与此同时也增大了犯Ⅱ型错误的概率,所以显著水
平 值的选用要同时考虑到犯两类错误的概率的大小。
对于田间试验,由于试验条件不容易控制
y1 510
y2 500
我们能否根据 y1 y2 10 就判定这两
个水稻品种平均产量不同?结论是,不一定。
因为两个水稻品种平均产量 y1 、y2 都 是从试验种植的10个小区获得,仅是两个品种
有关总体平均数 1, 2 的估计值。由于存在
试验误差 ,样本平均数并不等于总体平均数 , 样本平均数包含总体平均数与试验误差二部分, 即
∣u∣≥2.526的两尾概率,所以称为 u 检验.
三、显著水平与两种类型的错误
(一)显著水平
用来否定或接受无效假设的概率标准叫显著水
平,记作 。 在生物学研究中常取 =0.05,称为 5% 显著水平; 或 =0.01,称为1% 显著水平或极显著水平。
对于上述例子 u的检验来说,若∣u∣<1.96 ,
则说明试验的表面差异属于试验误差的概率p>0.05,
即表面差异属于试验误差的可能性大,不能否
4-统计假设检验与参数估计
3. 根据“小概率事件实际不可能性原理”否 定或接受无效假设
在统计学上 ,把小概率事件在一次试验中看成
是实际上不可能发生的事件,称为小概率事件实际不
可能原理。根据这一原理,当试验的表面效应是试验
误差的概率小于0.05时 ,可以认为在一次试 验
中试验表面效应是试验误差实际上是不可能的,
因而否定原先所作的无效假设H0,接受备择假设HA, 即认为试验的处理效应是存在的。当试验的表面效应
食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?
3
上一张 下一张 主 页 退 出
例2:A,B两种肥料,在相同条件下各施用于5 个小区的水稻上,水稻产量平均分别为
xA=500 kg,xB=520成的 还是由试验的随机误差造成的?
而区间( t,t )则称为α水平上的接受域。
27
上一张 下一张 主 页 退 出
图4-1 双侧检验时H0的接受域和否定域
28
对前例分析: 0=0.0975
是被检验的假设,通过检验可能被接受,也
可能被否定。
H A 备择假设(alternative hypothesis) 与H0对应的假设,只有是在无效假设被否定
后才可接受的假设。无充分理由是不能轻率
接受的。
12
上一张 下一张 主 页 退 出
如前例,原假设H0:=0=9.75% ,即 假设由新曲种酿造出的食醋的醋酸含量与原 菌种酿造的食醋醋酸含量相等,这个假设表 明采用新曲种酿造食醋对提高醋酸含量是无 效的,试验的表面效应是随机误差引起的。
一部分是两个总体平均数的差(1 - 2 ), 叫 做 试 验 的 处 理 效 应 (treatment
effect);另一部分是试验误差( 1 - 2)。
数理统计之假设检验
带概率性质的反证法 u 通常的反证法设定一个假设以后,如果出现的 事实与之矛盾,(即如果这个假设是正确的话,出现 一个概率等于0的事件)则绝对地否定假设.
u 带概率性质的反证法的逻辑是:
如果假设H0是正确的话,一次试验出现一个 概率很小的事件,则以很大的把握否定假设H0.
(3)拒绝域为
u
x 0 n
z
(4)取 , 查表确定临界值 k z z0.05 1.65
(5)计算
u x 0
2250
2000
5
1.65
n 250 25
则拒绝 H0 ,即认为这些产品较以往有显著提高.
2. 2未知时,的检验
未知
2,可用样本方差 S 2
1n n 1 k1 ( X k
当
H
为真时,
0
U
X 0 n
~
N(0,1)
衡量 u x 0 的大小 n
设一临界值 k>0,若
u x 0 k n
就认为有较大偏差;
则认为
H
不真,拒绝
0
H
0
若
u x 0 k
n
则接受 H0
显著性检验: P{拒绝H0| H0为真}
P
X
0
k
,
n
U X 0 ~ N(0,1) n
(6) t t , 则拒绝 H0 ,接受 H1;反之,接受 H0.
左边检验
(1)H0 : 0; H1 : 0
(2)选取统计量:T X 0
Sn
(3)拒绝域为
t
x 0
sn
t (n 1)
(4)取 , 查表确定临界值 k t (n 1)
第四章假设检验
• 在n重贝努利试验中,事件A可能发生0,1,2,…,n次, 则事件A 恰好发生k(0≤k≤n)次的概率Pn(k):
k Pn ( k ) = Cn p k q n − k
k=0,1,2…,n
二项分布的定义: 设随机变量x所有可能取的值为零和正整数:0,1,2,…,n, 且有
k Pn (k ) = Cn p k q n − k
k=0,1,2…,n
其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的 二项分布,记为 x~B(n,p)。 , 在n较大,np、nq较接近时,二项分布接近于正态分布; 当n→∞时,二项分布的极限分布是正态分布。
二项分布的平均数、标准差: 当试验结果以事件A发生次数k表示时 μ=np σ=
小概率事件实际不可能原理 随机变量的概率分布——正态分布、二项分布 样本平均数的抽样分布 t分布 假设检验的基本原理和步骤
小概率事件实际不可能原理 • 概率的统计定义 • 在相同条件下进行n次重复试验,如果随机事件A发生的次 数为m,那么m/n称为随机事件A的频率; • 当试验重复数n逐渐增大时,随机事件A的频率越来越稳定 地接近某一数值p,那么就把p称为随机事件A的概率。 • 这样定义的概率称为统计概率,或者称后验概率。可以记 为P(A)=p。
由样本平均数 x 构成的总体称为样本平均数的抽样总体, 其平均数和标准差分别记为 µ x 和 σ x 。
σ x 是样本平均数抽样总体的标准差,简称标准误, ,
它表示平均数抽样误差的大小。 统计学上已证明
µx = µ
σ
x
=
σ
n
两个定理: 1、若随机变量x服从正态分布N(µ,σ2), x1 , x2 ,L, xn 是由x总体得来的随机样本,则统计量 也是正态分布, 且有
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0: 0 ,即新老工艺没有差异。
H A: 0 ,新老工艺有差异。
上一张 下一张 主 页 退 出
(2)确定显著水平α=0.01 (3)计算t值
x =520g,S=12g
所以
均数标准误
S
=
x
S= n
12 =3 16
t x u0 =520 500=6.667 **
Sx
3
自由度 df n 1 16 1 15
(4)查临界t值,作出统计推断
由df =15,查t值表(附表3)得
t0.01(15)=2.947,因为|t|>t0.01,
P<0.01, 故应否定H0,接受HA, 表明
新老工艺的每100g加工出的果冻量差异极 显著。(在统计量t上标记**)
上一张 下一张 主 页 退 出
数值或期望数值。常用的检验方法有u检验
和t检验。
上一张 下一张 主 页 退 出
2.1.1 单个样本平均数的u 检验
u 检验(u-test),就是在假设检验中利用
标准正态分布来进行统计量的概率计算的检验方
法。Excel中统计函数(Ztest)。
由抽样分布理论可知,有两种情况的资料可以
用u检验方法进行分析:样本资料服从正态分布
df n 1 12 1 11
3、查临界t值,作出统计推断
t 因为单侧 0.05(11) = 双侧 t0.10(11) = 1.796,
t=2.281 > 单侧t0.05(11), P < 0.05 , 否
定H0 : ≤ 246,接受HA : >246,可以认
为该批饲料维生素C含量符合规定要求。
(2)确定显著水平。α=0.05(两尾概率)
(3)构造统计量,并计算样本统计量值。
样本平均数:
x= xi =505 512 510 =502 .70
n
10
均数标准误: x= = 8 =2.530
n 10
统计量u值:
u x 0 =502.70 500=1.067
/ n
8 / 10
(4)统计推断。由显著水平α=0.05,查附表, 得临界值u0.05=1.96。实际计算出的 u=1.067 u0.05=1.96 表明,试验表面效应仅由误差引起的概率P>0.05,
故不能否定H0 ,所以,当日装罐机工作正常。
2.1.2 单个样本平均数的t 检验
t 检验(t-test)是利用t分布来进行统计量 的概率计算的假设检验方法。它主要应用于总体 方差未知时的小样本资料(n<30)。
均数标准误
S
=
x
S n
统计量t t x 0
Sx
x 其中, 为样本平均数,S为样本标准差,n为
上一张下一张主 页退 出
按题意,此例应采用单侧检验。 (1)提出无效假设与备择假设
H0: ≤ 246,HA: > 246 (2)计算 t 值
经计算得:x =114.5,S=1.581
上一张 下一张 主 页 退 出所以t x = 252 246
Sx
9.115 12
=6
2.631
= 2.281
【例3-4】某名优绿茶含水量标准为不超过5.5 %。现有一批该绿茶,从中随机抽出8个样品测
x 定其含水量,平均含水量 =5.6%,标准差
S=0.3%。问该批绿茶的含水量是否超标?
符合t检验条件,为单尾检验。 (1)提出无效假设与备择假设
H0: ≤ 0 =5.5%,HA: > 0
(2)计算 t 值 Sx = S =0.003=0.001
上一张 下一张 主 页 退 出
2.2 两个样本平均数的假设检验
在实际工作中还经常会遇到推断两个样本 平均数差异是否显著的问题,以了解两样本所 属总体的平均数是否相同。比如两个果实品种 的比较,两种检验方法的比较,两种加工方法 的比较等。
n8
t= x 0 =0.056 0.055=1.000
Sx
0.001
df n 1 8 1 7 上一张 下一张 主 页 退 出
(3)查临界t值,作出统计推断
单侧 t0.05(7) = 双侧 t0.10(7) = 1.895,
t=1.000< 单侧t0.05(7),P > 0.05 ,
不能否定H0 : ≤ 0 =5.5%,可以认为
N(μ,σ2),并且总体方差σ2已知;总体方差虽
然未知,但样本平均数来自于大样本(n≥30)。
下边举例说明检验过程:
【例3-2】某罐头厂生产肉类罐头,其自动装罐机在正 常工作时每罐净重服从正态分布N(500,64)(单位 ,g)。某日随机抽查10瓶罐头,得净重为:505,512 ,497,493,508,515,502,495,490,510。问装 罐机当日工作是否正常?
由题意知,样本服从正态分布,总体方差σ2 =64, 符合u检验应用条件。由于当日装罐机的每罐平均净 重可能高于或低于正常工作状态下的标准净重,故需 作两尾检验。其方法如下:
(1) 提出假设。无效假设H0:μ=μ0= 500 g, 即当日装罐机每罐平均净重与正常工作状态下的标 准净重一样。
备择假设HA:μ≠μ0,即罐装机工作不正常。
样本容量。
上一张 下一张 主 页 退 出
例3-3 用山楂加工果冻,传统工艺平均每100 g 加工500g果冻,采用新工艺后,测定了16次,得
知每100g山楂可出果冻平均为 x =520g,标准
差S=12g。问新工艺与老工艺在每100g加工果
冻的量上有无显著差异? 本例总体方差未知,又是小样本,采用双侧t
该批绿茶的含水量符合规定要求。
上一张 下一张 主 页 退 出
【例】 按饲料配方规定,每1000kg某种饲料 中维生素C大于246g,现从工厂的产品中随机抽 测12个样品,测得维生素C含量如下:255 、
260、 262、 248、244、245、 250、 238、 246、 248、 258、
270g/1000kg,若样品的维生素C含量服从正 态分布,问此产品是否符合规定要求?
2 样本平均数的假设检验
2.1 单个样本平均数的假设检验
实质是样本所在总体平均数与已知总体平均数差 异显著性检验。
在实际工作中我们往往需要检验一个样
本平均数与已知的总体平均数是否有显著差
异,即检验该样本是否来自某一总体。即检
验无效假设H0:μ=μ0,备择假设HA: μ≠μ0或μ>μ0(μ<μ0)的问题。已知的总 体平均数一般为一些公认的理论数值、经验