第6章假设检验
第六章 假设检验2006
第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
第六章假设检验基础PPT课件
❖假设检验的原理: 假设检验的基本思想是反证法和小
概率的思想
❖反证法思想:首先提出假设(由于未经检验是否成立,
所以称为无效假设),用适当的统计方法确定假设
成立的可能性大小,如果可能性小,则认为假设不
成立,拒绝它;如果可能性大,还不能认为它不成立
❖小概率思想:是指小概率事件在一次随机试验中认为
基本上不会发生
一、一组样本资料的t 检验(one sample/group t-test)
现有取自正态总体N(μ,σ2)的、容量为n 的一份 完全随机样本。 目的:推断该样本所代表的未知总体均数µ与已知总体 均数µ0是否相等已知总体均数µ0是指标准值,理论值 或经大量观察所得的稳定值。
n136135
3. 确定P值
指从H0规定的总体中随机抽得等于及 大于(或等于及小于)现有样本获得
的检验统计量值的概率。
4. P值的意义:如果总体状况和H0一致,统计量获 得现有数值以及更不利于H0的数值的可能性(概率) 有多大。
5.
t0 .2 (3 5 ) 50 .68 t 2 t0 .2 (3 5 ) 5得 P 0 .25
H0一般设为某两个或多个总体参数 相等,即认为他们之间的差别是由 于抽样误差引起的。H1的假设和H0 的假设相互对立,即认为他们之间 存在着本质的差异。H1的内容反映 出检验的单双侧。
单双侧的确定: 一是根据专业知识,已知东北某县囱
门月龄闭合值不会低于一般值; 二是研究者只关心东北某县值是否高
于一般人群值,应当用单侧检验。 一般认为双侧检验较为稳妥,故较为
目的要求选用不同的检验方法。
4、确定P值: P值是指由H0所规定的总体中做随机抽
样,获得等于及大于(或等于及小于)现 有统计量的概率。当求得检验统计量的值 后,一般可通过特制的统计用表直接查出P 值。
第6章-假设检验课件
3. 第Ⅰ类错误(错误)
原假设为正确时拒绝原假设
第Ⅰ类错误的概率记为,被称为显著性水平
2. 第Ⅱ类错误(错误)
原假设为错误时未拒绝原假设
第Ⅱ类错误的概率记为
6 - 17
2008年8月
统计学
STATISTICS (第三版)
两类错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
6-4
2008年8月
第 6 章 假设检验
6.1 假设检验的基本原理
6.1.1 怎样提出假设? 6.1.2 怎样做出决策? 6.1.3 怎样表述决策结果?
6.1 假设检验的基本原理 6.1.1 怎样提出假设?
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
6 - 10
2008年8月
统计学
STATISTICS (第三版)
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
2. 当不拒绝原假设时,我们称样本结果是统 计上不显著的
6 - 32
2008年8月
第 6 章 假设检验
6.2 一个总体参数的检验
6.2.1 总体均值的检验 6.2.2 总体比例的检验 6.2.3 总体方差的检验
统计学
STATISTICS (第三版)
第6章 假设检验
×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )
样本均数服从 正态分布
N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。
α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义
假设检验的实际意义
不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;
接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2
N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较
若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。
若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。
统计学第六章假设检验
10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?
第6章 假设检验
第6章假设检验练习:6.1某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。
在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?6.2研究人员发现,当禽类被拘禁在一个很小的空间内时,就会发生同类相残的现象。
一名孵化并出售小鸡的商人想检验某一品种的小鸡因为同类相残而导致的死亡率是否小于0.04。
试帮助这位商人定义检验参数并建立适当的原假设和备择假设。
6.3一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进行抽检,如果证实玻璃纸的横向延伸率不符合规格,该生产线就必须立即停产调整。
监控人员应该怎样提出原假设和备择假设,来达到判断该生产线是否运转正常的目的?6.4一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60克一袋的那种土豆片的重量不符。
店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(克)μ进行检验,假设陈述如下:如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。
(1)与这一假设检验问题相关联的第一类错误是什么?(2)与这一假设检验问题相关联的第二类错误是什么?(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重?6.5某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。
研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。
假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。
(1)选择检验统计量并说明其抽样分布是什么样的?(2)检验的拒绝规则是什么?(3)计算检验统计量的值,你的结论是什么?6.6一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。
第6章 假设检验
三、假设检验中的相关概念
(一)原假设和备择假设 1、原假设和备择假设的定义
原假设:假设检验中,通常将所要检验的假 设称为原假设,也称为零假设,用H0表示。 备择假设:原假设的对立假设称为备择假设 或备选假设,用H1表示。
例如:设μ 0为总体均值μ 的某一确定值。
0
1.检验总体均值μ 是否等于某一确定值μ
2、原假设和备择假设的形式
(双侧检验和单侧检验)
若原假设是总体参数等于某一数值,
如H0:μ=μ0 ;H1:μ≠μ0。
这种假设检验称为双侧检验 若原假设是总体参数大于等于或小于等于某一数值, 如H0:μ≥μ0 ;H1:μ<μ0 或H0 :μ≤μ0 ;H1:μ>μ0
这种假设检验称为单侧检验。又分为左侧检验和右侧检验。
一、总体均值的检验
(一)提出假设
1. 双侧检验:H0 : m =m0;H1 : m m0
2. 3.
左侧检验:H0 : m m0;H1 : m <m0 右侧检验:H0 : m m0 ;H1 : m >m0
一、总体均值的检验
(二)选择检验统计量,并确定其分布形式
大
样本容量n
否 是
小(正态总体)
设检验。
一、什么是假设检验
参数假设检验 指对总体分布函数中的未知参数提出某种 假设,然后利用样本信息对所提的假设进 行检验并做出判断的过程。 非参假设检验 指对总体分布函数形式等的假设进行检验 的过程。
参数假设检验实例
例1:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要求, 这时需要进口商对供货商的说法是否真实作出 判断。进口商可以先假设该批钢筋的平均拉力 强度不低于2000克,然后用样本的平均拉力 强度来检验假设是否正确。
第6章 假设检验
2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2
139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
t 检 验
样本均数与总体均数的比较
目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。
总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。
解决思路:
区间估计
判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤
建立假设 确定检验水准 计算检验统计量 计算概率P 结论
当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体
目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18
手头样本对应的未知总体均数 μ等于已知总体均数μ0,
第六章假设检验
α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。
第6章 假设检验
第6章假设检验6.1考点归纳一、正态性检验1.W检验设是来自正态总体的样本,为其次序统计量,W统计量定义为,其中系数在样本容量为n时有特定的值,可查附表6,对于假设:总体分布为,其检验的拒绝域具有形式{},其中分位数形,可查附表7。
2.EP检验EP检验即爱泼斯—普利(Epps—Pulley)检验。
爱泼斯—普利检验对多种备择假设有较高的效率,其出发点是利用样本的特征函数与正态分布的特征函数的差的模的平方产生的一个加权积分得到的。
设是来自正态总体N的样本,EP检验统计量定义为,其中,就是前述的样本均值和(除以n的)样本方差看,其拒绝域为是样本容量为n时EP检验统计量(在原假设下的分布)的1-分位数。
二、正态总体均值的假设检验1.单个总体均值μ的检验设总体,未知,检验问题为,.(显著性水平为)(1)σ2已知,关于μ的检验(Z检验)当σ2已知时,用统计量作为检验统计量,当时拒绝原假设,即得拒绝域为(2)σ2未知,关于μ的检验(t检验)设X1,X2,…,X n是来自总体X的样本,由于σ2未知,样本统计量S2是σ2的无偏估计,用S来代替σ,采用作为检验统计量,当时拒绝原假设,即得拒绝域为2.两个正态总体均值差的检验(t检验)设是来自正态总体的样本,是来自正态总体的样本,均为未知,设两样本独立且方差是相等的,又分别记它们的样本均值为,记样本方差为.检验问题为:(δ为已知常数),显著性水平为α,采用下述t统计量作为检验统计量:其中当时拒绝原假设,于是得拒绝域为3.基于成对数据的检验(t检验)(1)逐对比较法在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出推断,这种方法常称为逐对比较法.(2)成对数据的检验设有n对相互独立的观察结果:(X1,Y1),(X2,Y2),…,(X n,Y n),令,则D1,D2,…,D n相互独立,又由于D1,D2,…,D n是由同一因素所引起的,可认为它们服从同一分布.假设,i=1,2,…,n,其中未知,我们需要基于这一样本检验假设:①;②,③,分别记D1,D2,…,D n的样本均值和样本方差的观察值为,由单个正态总体均值的t检验知检验问题①,②,③的拒绝域分别为(显著性水平为α):三、正态总体方差的假设检验1.单个总体的情况(χ2检验法)设总体均未知,X1,X2,…,X n是来自X的样本,要求检验假设(显著性水平为α)为已知常数.由于S2是σ2的无偏估计,因此选作为检验统计量,则拒绝域具有以下的形式:或类似地,可得左边检验问题的拒绝域为右边检验问题问题的拒绝域为表6-1 正态总体均值、方差的检验法(显著性水平为α)2.两个总体的情况(F检验法)设是来自总体的样本,是来自总体的样本,且两样本独立,其样本方差分别为且设均为未知.现在需要检验假设(显著性水平为α)选取作为检验统计量,则拒绝域为四、分布拟合检验1.单个分布的χ2拟合检验法设总体X的分布未知,x1,x2,…,x n是来自X的样本值,来检验假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x).将在下X可能取值的全体分成互不相交的子集,以记样本观测值落在的个数,其中设F(x)不含未知参数,(也常以分布律或概率密度代替F(x)).采用作为检验统计量,其中.定理若n充分大(n≥50),则当H0为真时统计量近似服从χ2(k-1)分布.对于给定的显著性水平α,得到上述假设检验问题的拒绝域为.注意:在拟合检验中,n不能小于50,应有np i≥5,否则应适当并组以满足这个要求.2.分布族的χ2拟合检验检验的原假设是H0:总体X的分布函数是其中F的形式已知,而是未知参数,用样本求出未知参数的最大似然估计(在H0下),以估计值作为参数值,求出p i的估计值则取作为检验假设H0的统计量,在H0为真时近似地有得到上述检验问题在显著性水平为下的拒绝域为五、其他分布参数的假设检验1.指数分布参数的假设检验(1)提出假设:拒绝域:,P值:。
贾俊平统计学第6章假设检验
正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
第六章 假设检验
第六章 假设检验 6.2 总体均值的假设检验
【例6-7】某厂采用自动包装机分装产品,假定每包产 品的重量服从正态分布,每包标准重量为1000克。某 日随机抽查9包,测得样本平均重量为986克,样本标 准差为24克。试问在0.05的显著性水平上,能否认为 这天自动包装机工作正常?
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.2
假设检验的步骤
(三)选取显著性水平,确定原假设的拒绝域和接受域 显著性水平表示原假设为真时拒绝原假设 H 0 的最大概率, 即拒绝原假设所冒的风险,用 表示。 通常取 0.05 或 0.01
6.1
第六章 假设检验 假设检验的原理
第六章 假设检验 6.2 总体均值的假设检验
6.2.3 2未知时小样本情况下总体均值的假设检验
设总体服从正态分布 X ~ N (, 2 ) ,在小样本抽样情况下,利用 t检验法对总体均值的检验,其检验统计量及分布为:
t X ~ t (n 1) s/ n
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.4
假设检验中的P值
H1 : 0
(2)左侧检验:H 0 : 0
P值= P(Z zc 0 )
H 0 : 0
(3)右侧检验:
H1 : 0
第六章 假设检验
所以有 C0 = 6 × 1.65 + 250 = 因此犯第二类错误的概率是
259.9
X − 270 C0 − 270 β = P{ X ≤ C0 } = P{ } ≤ 6 6 259.9 − 270 = P{z ≤ = −1.68} = φ (−1.68) 6 = 1 − φ (1.68) = 0.0465
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 )的计算结果可以看出, 情况下,随机抽取的200件产品中,有6件是次品的概率 件产品中, 情况下,随机抽取的 件产品中 件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 ,显然这是一个小概率事件, 不应该发生,现在它发生了, 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设, 在这个例子中,超市提出了假设,通过抽样获得样本数
这两类错误之间的关系是:在样本容量一定时,犯第一类 这两类错误之间的关系是:在样本容量一定时, 错误概率较大时,犯第二类错误地概率较小;反之, 错误概率较大时,犯第二类错误地概率较小;反之,犯第 一类错误概率较小时,犯第二类错误概率较大。 一类错误概率较小时,犯第二类错误概率较大。要想两类 错误的概率都减小,只有增加样本容量。 错误的概率都减小,只有增加样本容量。 5、显著性水平 、 显著性水平:是指人们犯第一类错误概率的最大允许值。 显著性水平:是指人们犯第一类错误概率的最大允许值。 注意:显著性水平是人们根据自己所研究的问题来确定, 注意:显著性水平是人们根据自己所研究的问题来确定, 在经济学和其他社会科学中,常用选择的显著性水平是5% 在经济学和其他社会科学中,常用选择的显著性水平是 或者10%,在卫生和医药统计中,常用选择的显著性水平 或者 ,在卫生和医药统计中, 是1%。在我们经济学中,除非特别声明,一般都以 。在我们经济学中,除非特别声明,一般都以5% 作 为显著性水平。 为显著性水平。 6、临界值和拒绝域 、 拒绝域: 所围城的区域。 拒绝域:拒绝域就是由显著性水平 α 所围城的区域。 临界值:由给定的显著性水平确定的拒绝域的边界值, 临界值:由给定的显著性水平确定的拒绝域的边界值,称 为临界值。 分位点所对应的值。 为临界值。实际上临界值就是 α 分位点所对应的值。
第六章假设检验基础
假设检验亦称为显著性检验, 假设检验亦称为显著性检验,是判 断样本指标与总体指标或样本指标与样 本指标之间的差异有无统计学意义的一 种统计方法。 种统计方法。
样本指标与总体指标之间差异产生的原因有: 样本指标与总体指标之间差异产生的原因有: 1.抽样误差---亦即样本来自于该总体。 ---亦即样本来自于该总体 .抽样误差---亦即样本来自于该总体。
H 0:µ = µ 0
H 1 : µ ≠ µ 0 (单侧µ > µ 0或µ < µ 0 )
t=
X − µ0 s n
~ t (ν ), ν = n − 1
配对设计资料的t 二、配对设计资料的 检验
配对设计是研究者为了控制可能存在的主要非处理 因素而采用的一种试验设计方法。 因素而采用的一种试验设计方法。 形式: 形式: 将受试对象配成特征相近的对子, ⑴将受试对象配成特征相近的对子,同对的两个受试对 象随机分别接受不同处理; 象随机分别接受不同处理; 同一样品分成两份,随机分别接受不同处理(或测量) ⑵同一样品分成两份,随机分别接受不同处理(或测量) 同一受试对象处理前后,数据作对比。 ⑶同一受试对象处理前后,数据作对比。
假设检验的基本步骤: 二、假设检验的基本步骤: 已知北方农村儿童前囟门闭合月龄为14.1月。某 例6-1 已知北方农村儿童前囟门闭合月龄为 月 研究人员从东北某县抽取36名儿童,得囟门闭合月龄 研究人员从东北某县抽取 名儿童, 名儿童 均值为14.3月,标准差为 均值为 月 标准差为5.08月。问该县儿童前囟门闭 月 合月龄的均数是否大于一般儿童? 合月龄的均数是否大于一般儿童?
称之为差异无统计学意义。 称之为差异无统计学意义。 差异无统计学意义
从某地13岁女孩的总体中(总体均数为155.4 13岁女孩的总体中 155.4cm) 如:从某地13岁女孩的总体中(总体均数为155.4 随 机抽取一个样本,样本均数为154.6 154.6≠155.4, 154.6, 机抽取一个样本,样本均数为154.6,154.6≠155.4, 是因为抽样误差所致。 是因为抽样误差所致。 2.除抽样误差之外,主要是由于样本并不是来自 除抽样误差之外, 除抽样误差之外 于该总体而导致的本质差异。 于该总体而导致的本质差异。
第6章 假设检验
二、 假设检验的步骤 提出原假设和备择假设 /备择假设 确定适当的检验统计量 规定显著性水平: 根据显著性水平α及检验
统计量的查找临界值,并确定拒绝域。注 意是单侧检验还是双侧检验
计算检验统计量的值: 从总体中抽取某一样 本,据样本资料计算检验统计量的值 作出统计决策: 若检验统计量的值落在拒绝 域内就拒绝H0,否则接受H0
置信水平
拒绝域
a/2
1 - 接受域
H0值
a/2
临界值
临界值
样本统计量
双侧检验 (显著性水平与拒绝域 )
抽样分布
拒绝域 a/2 1 - 接受域 H 0值 样本统计量 置信水平 拒绝域 a/2
临界值
临界值
例如 ,一个灯光厂需要生产平均使用寿命 µ = 1000小时的灯泡。为了观察生产工艺过程是否正常, 从一批产品中抽取150个进行检验,得到平均使用 寿命980小时,能否断定这个厂生产的灯泡平均使 用寿命为1000小时?为什么? 不希望在1000小时任何一边超越太多,假设: H0: µ = 1000 (平均使用寿命为1000) H1: µ ≠ 1000 (平均使用寿命不是1000) 我们在这里提出的原假设是µ =1000,所以只要 µ >1000或µ <1000二者中有一个成立就可以否定原假 设(平均使用寿命为1000)。
标准误计算公式
σ已知: σ未知: S
X
n
X
S n
实例:如某年某市120名12岁健康男孩,已求 得 均数为143.07cm,标准差为5.70cm,按公 式计算,则标准误为:
SX
5 . 70 120
0 . 52
标准误的应用
第6章 假设检验基础
5
配对设计资料的 t 检验
n 配对设计(paired design)是一种特殊的设计方式,能够 很好地控制非实验因素对结果的影响,有自身配对和异 体配对之分。
n 配对设计资料的分析着眼于每一对观察值之差,这些差 值构成一组资料,用 t 检验推断“差值的总体均数是否为 0”。
3.48
3.50
0.02
…
…
…
…
12
2.69
2.66
0.03
13
3.09
3.20
0.11
14
2.98
2.92
0.06
15
2.65
2.60
0.05
8
1. 建立检验假设,确定检验水准
H 0 : md = 0 ,即差值的总体均数为 0 H 1 :md ¹ 0 ,即差值的总体均数不为 0
2. 计算统计量 n=15, d =0.06, sd = 0.10
X1 ~ N( m1 ,s 2 ), X2 ~ N( m2 ,s 2 )
1. 建立检验假设,确定检验水准
H0: m1 = m2 , 或 m1 - m2 = 0 H1: m1 ¹ m2, 或 m1 - m2 ¹ 0
a =0.05
4
2. 计算统计量
X1
~
N(
m1
s2
, n1
)
,
X2
~
N(
m2
s2
, n2
小结(Summary)
1. t 检验是以 t 分布为基础的一类比较均数的假设检验方法。 2. t 检验的应用条件为随机样本、来自正态总体、方差齐性。 3. 单样本 t 检验是推断该样本所属总体的均数与已知的某一 数值有无差别。配对设计资料的 t 检验着眼于差值的总体均 数是否为0。
第6章 假设检验
⑤案例1判断决策 案例1
在这个检验中,“不能拒绝”原假设是因 为样本均值与假设总体均值(15)非常接近,它的 离差可以通过概率(P值)大于显著性水平来解释。 当样本均值为14.982时,它很接近供应商 提供的总体金属板的均值,所以经过检验得出 的结论是:没有证据证明供应商提供的总体均值 是不正确的。
⑤案例3判断决策 案例3 不能拒绝原假设,因 此经理有足够证据证明新 支行的平均储蓄存款与总 部没有什么不同,可以开 展业务。
二、一个正态总体方差的假设检验
H0 :σ = σ , H1 :σ ≠ σ
2 2 0 2ຫໍສະໝຸດ 2 0所用统计量χ =
2
(n −1)S
2
σ
2 0
~ χ (n −1)
2
对于显著性水平α ,拒 绝域为, 绝域为,
χ ≤χ
2
2 1−α
2
或 χ ≥χ
2
2 α
2
单边检验, 单边检验,
H0 :σ ≤ σ , H1 :σ > σ
2 2 0 2
2 0
拒绝域为, 拒绝域为,
2
χ ≥ χα
2
χ
2 1−α
χα
2
2 2
案例研究4 案例研究4
某公司生产的清洁剂包装净重为64克 某公司生产的清洁剂包装净重为64克, 尽管每盒净重量存在差异不可避免, 尽管每盒净重量存在差异不可避免 , 但公 司还是期望这种差异尽可能的小些。 司还是期望这种差异尽可能的小些 。 如果 净重过大, 会增加成本;如果净重过少, 净重过大 , 会增加成本;如果净重过少 , 会使顾客不满。 正常情况下, 会使顾客不满 。 正常情况下 , 每盒净重的 标准差为1 标准差为1.6克。为了控制生产质量,公司 为了控制生产质量, 随机抽取了50 盒作为样本, 随机抽取了 50盒作为样本 , 测得样本标准 差为1 差为1.9克,以0.05为显著性水平,公司是 05为显著性水平, 否有证据说明清洁剂净重的标准差不超过 1.6克。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章假设检验
一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为小时,标准差为小时。
据报道,10年前每天每个家庭看电视的平均时间是小时。
取显着性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?
详细答案:
,=,,拒绝,如今每个家庭每天收看电视的平均时间显着地增加了。
为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。
在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):
根据最近的测量数据,当显着性水平时,能否认为该城市空气中悬浮颗粒的平均值显着低于过去的平均值
详细答案:
,=,,拒绝,该城市空气中悬浮颗粒的平均值显着低于过去的平均值。
安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:
假设金属板的重量服从正态分布,在显着性水平下,检验该企业生产的金属板是否符合要求?
详细答案:
,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在显着性水平下,检验该生产商的说法是否属实详细答案:
,,,拒绝,该生产商的说法属实。
某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:
操作A操作B
=100=50
==
==
对=,检验平均装配时间之差是否等于5分钟。
详细答案:
,=,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。
某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。
样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。
潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。
原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。
对=的显着性水平,用下列数据检验该假设,并对该广告给予评价。
购买力得分购买力得分
个体看后看前个体看后看前
165535
264698
377775
443866
详细答案:
设,。
,=,,不拒绝,广告提高了平均潜在购买力得分。
某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2 对12名员工进行培训。
培训后的测试分数如下:
方法1方法2
565145595753
475243525665
425352535553
504248546457
474444
两种方法培训得分的总体方差未知且不相等。
在显着性水平下,检验两种方法的培训效果是否有显着差异?
详细答案:
,,,拒绝,两种方法的培训效果是有显着差异。
为研究小企业经理们是否认为他们获得了成功,在随机抽取100个小企业的女性经理中,认为自己成功的人数为24人;而在对95个男性经理的调查中,认为自己成功的人数为39人。
在的显着性水平下,检验男女经理认为自己成功的人数比例是否有显着差异?
详细答案:
设,。
,,,拒绝,男女经理认为自己成功的人数比例有显着差异。
为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。
研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下:
旧肥料新肥料
1091019798100105109110118109
9898949910411311111199112
1038810810210610611799107119
97105102104101110111103110119
取显着性水平,检验:
(1)新肥料获得的平均产量是否显着地高于旧肥料假定条件为:
①两种肥料产量的方差未但相等,即。
②两种肥料产量的方差未且不相等,即。
(2)两种肥料产量的方差是否有显着差异?
详细答案:
(1)设,。
,,
,拒绝,新肥料获得的平均产量显着地高于旧肥料。
(2),拒绝,新肥料获得的平均产量显着地高于旧肥料。
(3),。
,,两种肥料产量的方差有显着差异。
生产工序中的方差是工序质量的一个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。
某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位:克)如下,检验这两部机器生产的袋茶重量的方差是否存在显着差异(a=)。
机器1
机器2
详细答案:
,。
=,,拒绝,两部机器生产的袋茶重量的方差存在显着差异。