应用统计学 经管类 第7章 假设检验
第七讲-假设检验
• 这里备择假设H1包含了 >0和 <0两方面。
13
H0: = 34.50 (该矿区新生儿的头围与当 地一般新生儿头围均数相同) H1: ≠ 34.50 (该矿区新生儿的头围与当 地一般新生儿头围均数不同)
2. 计算检验统计量
根据变量和资料类型、设计方案、 统计推断的目的、是否满足特定条件等 (如数据的分布类型)选择相应的检验统 计量。
2 1 2 2
2.9 5.2 1.9 / 32 2.7 2 / 40
2
4.23
两均数之差的标准误的估计值
由 于 u0.05/2=1.96 , u0.01/2=2.58 , |u|>u0.01/2, 得 P<0.01 ,按 α=0.05 水准,拒绝 H0 ,接受 H1 ,两 组间差别有统计学意义。可以认为试验组和对 照组退热天数的总体均数不相等,两组的疗效 不同。试验组的平均退热天数比对照组短。 例7-7已计算了的95%的可信区间: -3.3~-1.3 天, 给出了两总体均数差别的数量大小。
4
例 8-3(续例 7-7) 为比较某药治疗流行性出血热的疗效,
二、两样本比较的 u检验 (two-sample u-test) 适用于两样本含量较大 ( 如 n1>30 且 n2>30) 时。 检验统计量为
将 72 名流行性乙型脑炎患者随机分为试验组和对照组, 两组的例数、均数、标准差分别为: n1 32 , X 1 2.9 ,
2
• 本例中一个总体均数已知,是特定的; • 另一个总体均数未知,只知道其中的一个样 本,属于单样本检验。 • 建立以下假设: H0: =0, 即 H1:≠0。 H0: =34.50, H1: ≠34.50。
应用统计学 第七章假设检验-学生版
基础课程
例如,某电信运营商声称,该企业所提供 的本地电话业务接通率在95%以上
除非样本能提供证据表明接通率在95%以下 ,否则就应认为运营商的声称是正确的 建立的原假设与备择假设应为 H0: P 95% H1: P 95%
1 - 41
经济类管理类
单侧检验
(例子)
基础课程
该企业所提供的本地电话业务接通率在 95%以上吗?
1 - 39
经济类管理类
单侧检验
(原假设与备择假设的确定)
基础课程
检验某项声明的有效性 1. 将所作出的说明(声明)作为原假设 2. 对该说明的质疑作为备择假设 3. 先确立原假设H0
除非我们有证据表明“声明”无效,否则 就应认为该“声明”是有效的
1 - 40
经济类管理类
单侧检验
(原假设与备择假设的确定)
经济类管理类
双侧检验
(显著性水平与拒绝域 )
置信水平
基础课程
抽样分布
拒绝域 /2 1-
拒绝域 /2
接受域
临界值
1 - 35
H0值
临界值
样本统计量
经济类管理类
双侧检验
(显著性水平与拒绝域 )
置信水平 拒绝域 1- 接受域 H0值 样本统计量
基础课程
抽样分布
拒绝域 /2
/2
临界值
1 - 36
3. 特点
1 - 12
经济类管理类
基础课程
一个简单的例子
一名被告正在受法庭的审判,根据英国法律,先 假设被告是无罪的,于是证明他有罪的责任 就落在原告律师身上。用假设检验的术语就 是要建立一个假设,记为H0:被告是无罪的 ,称为原假设或零假设。另一个可供选择的 假设记作H1:被告是有罪的,称为备择假设 或替代假设。法庭陪审团要审查各种证据, 以确定原告律师是否证实了这些证据与“无 罪”这一原假设不一致。如果陪审团员们认 为证据与H0不一致,他们就拒绝该假设而接 受其备择假设H1 ,即认为被告有罪。
假设检验《统计学原理》课件
X=X1>X0
H0为伪
从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小 α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而 β变小,即若减小β错误,也会增大犯α错误的机会,
a 错误和 错误的关系
在样本容量n一定的情况下,假设检验不能同时做到犯α和 β两类错误的概率都很小,若减小α错误,就会增大犯β错误 的机会;若减小β错误,也会增大犯α错误的机会,要使α和 β同时变小只有增大样本容量,但样本容量增加要受人力、 经费、时间等很多因素的限制,无限制增加样本容量就会 使抽样调查失去意义,因此假设检验需要慎重考虑对两类 错误进行控制的问题,
参数假设检验举例
例2:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要 求,这时需要进口商对供货商的说法是否真 实作出判断,进口商可以先假设该批钢筋的 平均拉力强度不低于2000克,然后用样本的 平均拉力强度来检验假设是否正确,这也是 一个关于总体均值的假设检验问题,
假设检验的两类错误
正确决策和犯错误的概率可以归纳为下表:
假设检验中各种可能结果的概率
H0 为真
接受H0
1-α 正确决策
拒绝H0,接受H1
α 弃真错误
H0 为伪
β 取伪错误
1-β 正确决策
•假设检验两类错误关系的图示
以单侧上限检验为例,设H0 :X≤X0 , H1:X>X0
图a X≤X0 H0为真
a
H0值
样本统计量 临界值
观察到 的样本 统计量
5、假设检验的两类错误
根据假设检验做出判断无非下述四种情况:
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误, 假设检验是依据样本提供的信息进行判断,有犯错误的可 能,所犯错误有两种类型: 第一类错误是原假设H0为真时,检验结果把它当成不真而 拒绝了,犯这种错误的概率用α表示,也称作α错误 αerror 或弃真错误, 第二类错误是原假设H0不为真时,检验结果把它当成真而 接受了,犯这种错误的概率用β表示,也称作β错误 βerror 或取伪错误,
应用统计学上机实验指导二-假设检验
02 实验内容与步骤
实验数据准备
数据来源
选择适当的数据集,可以是实际数据或模拟数 据。
数据预处理
对数据进行清洗、整理和转换,以满足假设检 验的要求。
数据分组
根据实验需求,将数据分为不同的组别,以便进行后续的假设检验。
假设检验方法选择
双样本t检验
用于比较两个独立样本均值是 否有显著差异。
卡方检验
置差异的假设。
似然比检验法
似然比统计量
根据样本数据计算似然函数,并构造 似然比统计量进行假设检验。
大样本性质
当样本量足够大时,似然比统计量近 似服从卡方分布,从而可以利用卡方 分布表进行假设检验。
贝叶斯因子检验法
01
贝叶斯因子定义
贝叶斯因子是贝叶斯统计中用于比较两个假设相对支持度的一个指标。
02
用于检验两个分类变量是否独 立。
单样本t检验
用于比较样本均值与已知总体 均值是否有显著差异。
配对样本t检验
用于比较同一总体中两个相关 样本均值是否有显著差异。
F检验
用于比较两个或更多总体方差 是否有显著差异。
检验过程实施
提出假设
根据实验目的,提出原假设和备择假 设。
01
02
选择检验统计量
根据假设检验方法,选择适当的检验 统计量。
案例二:二项分布比例比较
• 实验目的:比较两个二项分布的比例是否 存在显著差异。
案例二:二项分布比例比较
实验步骤
1. 收集两组二项分布数据,记录成功次数和总 次数。
2. 提出原假设和备择假设,选择合适的检验统 计量。
案例二:二项分布比例比较
3. 计算检验统计量的值,并查 找对应的p值。
第七章假设检验与t检验(终板)
2、P值是指从H0所规定的总体中作随机 抽样,获得等于及大于 (或等于及小于)现有 样本统计量的概率。通过 P值与α 值的比 较来确定拒绝或不拒绝H0。
四、假设检验的应用注意事项
(1)研究设计要科学严密 (2)考虑假设检验方法的前提条件 (3)正确理解P值的含义 (4)假设检验的结论不能绝对化 (5)统计学意义与实际意义相互结合
的疗效时,如能根据专业知识认为新药 疗效不会比旧药差,只关心新药是否比 旧药好(疗效至少相同,绝对排除出现 相反的可能性),可用单侧检验。
双侧检验:在比较甲乙两种药物的疗效时, 事先不能确定哪种药的疗效较好,只关心两药 的疗效有无差别,要用双侧检验。双侧检验若 有差别,单侧检验肯定有差别;反之,单侧检 验若有差别,双侧检验不一定有差别。 单侧检验更容易得到有统计学意义的结论。
140 150 138 120 140 145 135 115 135 130 120 133 147 125 114 165 —
差值d (4)
27 25 12 -10 -10 0 0 10 7 -5 20 3 37 10 -6 10
d 130
d2 (5)
725 625 144 100 100 0 0 100 49 25 400 9 1369 100 36 100
2、选定检验方法和计算检验统计量
根据研究设计方案、资料类型、样本含量 大小及分析目的选用适当的检验方法,并根据 样本资料计算相应的检验统计量;不同的检验 方法要用不同的公式计算现有样本的检验统计 量(t ,u,F值)。检验统计量是在H0成立的前 提下计算出来。
3、确定P值,作出统计推断 P值是指由所规定的总体作随机抽样, 获得
统计学课件讲义 第7章 假设检验
第7章假设检验一、假设检验概述1.概念:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
2.主要目的:在于判决原假设的总体和当前抽样所取自的总体是否发生了显著的差异。
3.假设检验的检验法则假设检验过程就是比较样本观察结果与总体假设的差异。
差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。
4.假设检验中的两类错误:“弃真”、“取伪”在假设检验中,在一定样本容量下,不能同时做到犯这两类错误的概率都很小。
因为减少α会引起β增大,减少β会引起α增大。
5.基本思想:反证法思想、小概率原理6.假设检验的步骤:根据题意合理地建立原假设和备择假设→选择适当的检验统计量,并确定其分布形式→选定显著性水平,并根据相应统计量的统计分布表查出临界值→根据样本观察值计算检验统计量的观察值→根据检验规则作出接受或拒绝原假设的判断二、单个正态总体的假设检验(显著水平为α)三、两个正态总体的假设检(显著水平为α)注:2221212222212121211s s n n f s s n n n n ⎛⎫+ ⎪⎝⎭=⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭+-- 四、总体比率的假设检验1、根据中心极限定理,在大样本条件下,若np 和nq 都大于5时,样本比率的抽样分布近似服从正态分布,因此,我们可用Z =作为检验统计量2、对于两总体比率之差的概率分布,可证明其近似地服从正态分布。
若总体比率未知,且1111,(1)n p n p -和 2222,(1)n p n p -都大于5时,我们可用样本比率1p 和2p 来替代。
因此,我们可用Z =五、假设检验中的其他问题1、区间估计与假设检验的关系:两者推断的角度不同、两者立足点不同、两者的主要决策参考点不同。
两者都属于统计推断方法,根据样本统计量对总体参数进行推断 对相同条件的推断问题,其推断的理论依据——抽样分布理论相同都是建立在概率基础上的推断,推断结果都具有一定的可靠程度或风险 利用置信区间可以进行假设检验2、假设检验中的p -值假设检验的p -值就是拒绝原假设的最小显著性水平。
应用统计学第7章 假设检验
•
μp
(1 )
σp
n
7.3 几种常见的假设检验
• p的抽样分布接近于 正态分布,所以检
验统计量是ZSTAT 值:
p的假设检验
Z STAT
pπ
nπ 5和 n(1-π) 5
π(1 π)
n
nπ < 5或 n(1-π) < 5
本章不讨论
7.3 几种常见的假设检验
关于总体比例,可建立如下假设:
提出原假设和备择假设 选择显著性水平 确定检验统计量 建立决策准则 做出决策
7.2 假设检验的五个步骤
7.2.1提出原假设和备择假设 原假设,H0
检验的声称或断言
例:在美国每个家庭平均有3台电视机
(H0 : μ 3)
是总体参数,不是样本统计量
H0 : μ 3
H0 : X 3
7.2 假设检验的五个步骤
的假设检验
σK已n知own (Z 检验)
检验统计量是:
σ Un未kn知own (t 检验)
7.3 几种常见的假设检验
根据抽样分布原理,当总体服从正态分布N(μ,2)时,那
么从中抽取(重复抽样)容量为n 的样本,其样本均值
服从正态分布
N , 2 / n ,而统计量
Z
x
服从标
准正态分布。
n
对于双侧检验,对给定的显著性水平α,当
解:由题意知,这是左单侧检验问题,可建立如下假设:
H0 : 0.9
H1 : 0.9
样本比例
p 82 0.82 ,检验统计量的值为:
100
Z
p
= 0.82 0.9 2.67
(1 )
0.9 0.1
n
100
应用统计学7假设检验
应用统计学第九章假设检验朱佳俊博士Applied Statistics 第一节假设检验的基本问题一、假设检验的基本概念对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。
1、假设定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。
是对总体参数的一种假设。
常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。
2、假设检验(hypothesis test)(1)概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立(2)类型–参数假设检验–非参数假设检验(3)特点–采用逻辑上的反证法–依据统计上的小概率原理... 因此我们拒绝假设 =20... 如果这是总体的真实均值样本均值μ= 50抽样分布H0这个值不像我们应该得到的样本均值...203、假设检验的基本思想小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。
当进行假设检验时,先假设H 0正确,在此假设下,若小概率事件A出现的概率很小,例如P (A )=0.01,经过取样试验后,A 出现了,则违反了上述原理,我们认为这是一个不合理的结果。
4、小概率原理5、原假设和备择假设(1)原假设(null hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H 1–H 1 :μ<某一数值,或μ>某一数值–例如, H 1 :μ< 10cm ,或μ>10cm(2)备择假设(alternative hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H1–H1 :μ<某一数值,或μ>某一数值–例如, H1 :μ< 10cm,或μ>10cm6、双侧检验与单侧检验(1)备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)(2)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)–备择假设的方向为“<”,称为左侧检验–备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验(假设的形式)单侧检验H1: μ> μ0H1:μ< μ0H1: μ≠μ0备择假设H: μ≤μ0H: μ≥μ0H: μ= μ0原假设右侧检验左侧检验双侧检验假设二、假设检验中的两类错误与显示性水平1、假设检验中的两类错误(1)第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为α•被称为显著性水平(2)第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为β(Beta)2、显著性水平(significant level)(1)是一个概率值(2)原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域(3)表示为α(alpha)–常用的α值有0.01, 0.05, 0.10(4)由研究者事先确定三、检验统计量与拒绝域(一)检验统计量(test statistic)1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、对样本估计量的标准化结果–原假设H为真–点估计量的抽样分布点估计量的抽样标准差假设值—点估计量标准化检验统计量=3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布临界值临界值α/2α/2 样本统计量拒绝H 0拒绝H 01 -α1 -置信水平显著性水平和拒绝域(单侧检验)0临界值α样本统计量拒绝H 0抽样分布1 -α置信水平(二)决策规则1、给定显著性水平α,查表得出相应的临界值z α或z α/2,t α或t α/22、将检验统计量的值与α水平的临界值进行比较3、作出决策–双侧检验:I 统计量I > 临界值,拒绝H 0–左侧检验:统计量< -临界值,拒绝H 0–右侧检验:统计量> 临界值,拒绝H 0四、利用P 值进行决策(一)什么是P 值(P -value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率–双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H 0之间不一致的程度3、被称为观察到的(或实测的)显著性水平4、决策规则:若p 值<α, 拒绝H 0双侧检验的P 值α/ 2α/ 2Z拒绝H 0拒绝H 0临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值临界值α样本统计量拒绝H 0抽样分布1 -1 -α置信水平计算出的样本统计量P 值左侧检验的P 值临界值α拒绝H 0抽样分布 1 -1 -α置信水平计算出的样本统计量P 值右侧检验的P 值五、假设检验步骤1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0–也可以直接利用P 值作出决策第二节一个总体参数的检验z 检验(单尾和双尾)z 检验(单尾和双尾)t 检验(单尾和双尾)t 检验(单尾和双尾)z 检验(单尾和双尾)z 检验(单尾和双尾)χ2 检验(单尾和双尾)χ2 检验(单尾和双尾)均值均值一个总体一个总体比率比率方差方差是z 检验x z nμσ−=否z 检验ns x z 0μ−=一、总体均值的检验σ是否已知小样本容量n大σ是否已知否t 检验ns x t 0μ−=是z 检验nx z σμ0−=(一)总体均值的检验(大样本)•1.假定条件–正态总体或非正态总体大样本(n ≥30)2.使用z 检验统计量σ2已知:σ2未知:)1,0(~0N nx z σμ−=)1,0(~0N nsx z μ−=1、总体均值的检验(σ2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差为5ml 。
统计学 第7章 假设检验ppt课件
(1)贝努利定理(Bernoulli Theorem)
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
完整版PPT课件
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
3.抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
完整版PPT课件
《统计学教程》
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
ln i m Fn
x
n lim k1Xk
nx
x
n n
1
t2
e 2dt
(6.3)
2பைடு நூலகம்
统计学,刘照德07-1第七章 假设检验
一、假设检验的概念
称为 t检验。 • 3. 显著性水平,即指原假设为真时拒绝原假 设的概率,通常很小,而1-就很大。若总体没 有发生显著性变化,则样本统计量应该落在以总 体待估参数为中心的概率为1-的区域内。该区域 称为抽样分布的接受域;否则,总体就发生了显 著性变化,样本统计量应该落在概率 为1-的区域 外,该区域被称为抽样分布的拒绝域。因此,被 称为显著性水平。常用的值有0.01, 0.05, 0.10。而 接受域和拒绝域的分界点的数值就称为临界值。
1.建立假设 H0:μ=μ0=5 H1:μ≠μ0= 5,
一、假设检验的概念
1. 假设是指对总体参数的数值所作的一种 陈述。总体参数包括总体均值、总体比例(成 数)、总体方差等。 原假设是指待检验的假设,研究者想收集 证据予以反对的假设,表示为H0 。通常有 , 或三种形式。【例7-1】中H0:μ=5。 备择假设是指与原假设对立的假设,研究 者想收集证据予以支持的假设,表示为H1 。 其通常对应原假设也有三种形式:,或三种 。【例7-1】中H1:μ≠5。
一、假设检验的概念
• 根据不同的显著性水平值,可得到不同的统 计量临界值。这些临界值可通过查表得到。【例 7-1】=0.05,查表得拒绝域:t t / 2 2.064
4. 检验规则,第一种是根据拒绝域,将检验统计量 的值与水平的临界值进行比较,得出拒绝或不拒绝原 假设H0的结论,称为临界值规则,【例7-1】解答用了 临界值规则。第二种是将检验统计量值对应的概率p与 显著性水平进行比较,若P<α,则检验统计量落入拒 绝域,拒绝H0;否则,不能拒绝H0,称这种检验规则为 P-值规则,计算机软件中通常用P-值规则。
一、假设检验的概念
• 而那些“不明确的陈述”是指新的、可能的、猜 测的,处于备择假设的位置。例如某公司,以前 生产的产品的废品率不低于18%,是明确的陈述 18 % ;该公司对生产设备进行 ,因此, H 0: 改造后,生产的产品的废品率下降是不明确的陈 述,因此,H1:π<18%。 • 假设检验是指利用样本统计量的取值,来检 验事先对总体参数或总体分布所作的假设是否成 立的一种统计推断方法。
假设检验 经管类课件
统计学 5.2 单个总体参数的假设检验
z 2.33为拒绝域。
x 若 2根.9据2 样本均值计算得Z值小于-2.33,就
可 以 0拒.1绝8 零假设,接受备择假设。
z x称 2.92 3 2.67
z
2假.x3定3,
0.18 / 36
落 根 入 据拒 3 6绝个域听,装则咖可啡以样拒本绝计零算假出设的。均
概率很小的事件在一次实验中实际上不大可能 出现。 如:P= 0.001。
概率论中把该类事件称为“小概率事件” 。 “小概率事件不发生” 原则:当一事件的概率 P≤α时( α为一小正数),就认为该事件是一小 概率事件,而且概率小到可以认为它实际上不会
统计学 5.1 假设检验的基本思想
5.1.4 统计假设检验的一般步骤
统计学 5.2 单个总体参数的假设检验
z x
x
3
当n=36时,样本均值服从正态分布,我 们可以用
统计量
的取值来衡量样本均值偏离总体均
值 的 程z度。1.645, 我们就拒绝H0。
我们先考察 的情况,下图表明观察到的样
本均值低于总体均值的1.645倍标准差的概率是
统计学 5.2 单个总体参数的假设检验
统计学
实践中的统计
随着我国加入WTO,我国的企业面 临着异常严重的挑战,汽车行业的形势尤 为严峻。是挑战也是机遇,为了迎接挑战, 国内汽车行业纷纷采取各种应对措施。A汽 车集团公司对本公司的A1型号汽车的发动 机系统进行了一系列改进,提高了启动速
统计学
实践中的统计
8.50 8.75 8.33 8.21 8.52 为8此.30,随机8.抽31取了18.51辆9 A2型8.4汽0 车做8试.8验6 , 测得15辆汽车的每百公里耗油量的数据如
《应用统计学》第章:单个总体的假设检验
《应用统计学》第7章:单个总体的假设检验第7章单个总体的假设检验本章教学目标了解和掌握统计推断中的另一个基本问题:参假设检验及其在经济管理中的应用;掌握运用 Excel 的“数据分析”及其统计函数功能求解假设检验问题。
本章主要内容:§71>.1 案例介绍§7.2 假设检验的基本原理§7.3 单个正态总体均值的检验§7.4 单个正态总体方差的检验本章重点:假设检验中不可避免的两类错误及其应用 Excel“数据分析”功能的使用及其运行输出结果分析。
难点:假设检验中不可避免的两类错误及其应用。
§7.1 案例介绍【案例1】新工艺是否有效?某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。
现采用新工艺生产了一种新钢丝,随机抽取 10 根,测得抗拉强度为: 10512, 10623, 10668, 10554, 1077610707, 10557, 10581, 10666, 10670求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。
是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过0.02 mm。
检验人员从加工的缸套中随机抽取 9 个,测得外径的样本标准差为 S = 0.03 mm。
问:该机床的加工精度是否符合要求?【案例2】机床加工精度是否符合要求?§7.2 假设检验的原理一、实际推断原理假设检验的理论是小概率原理,又称为实际推断原理,其具体内容是:小概率事件在一次试验中是几乎不可能发生的。
二、假设检验推理的思想方法假设检验推理的思想方法是某种带有概率性质的反证法。
三、基本原理和步骤例1:统计资料表明,某电子元件的寿命 X~N(??0 , ?? 2 ),其中 ??0已知,?? 2 未知。
现采用了新工艺生产,测得新工艺生产的 n 个元件寿命为 x1, x2, ···, xn。
统计学第七章假设检验和非参数统计
4、计算T值:根据裁判的观察确定球的 反弹角度为X
5、统计判断:当一名球员使用上肢之外 的身体部分触球时,球的反弹角度为X的概率 为0.03。由于0.03<0.05,拒绝原假设,即认 为球员A存在上肢触球。
在本例中,有3%的可能性发生弃真错误, 即球员A没有上肢触球,但裁判作出了错误判 断。
显著性水平α在这里决定了某一个结论能 否被接受。
例题:
对24名儿童依次进行一项测试活动,获得 下列分数序列:
31,23,36,43,41,44,12,26,43, 75,2,3,15,13,78,24,13,27,86,61, 13,7,6,8
转化成上下游程,为:-,+,+,-, +,-,+,+,+,-,+,+,-,+, -,-,+,+,-,-,-,-,+
二、确定适当的检验统计量T
检验统计量T是用于检验原假设是否成立 的标准,在原假设成立的前提下,统计量T满 足某种特征。
四、计算检验统计量T的值
根据检验中获得的数据,计算统计量T的 值。
五、作出统计决策
根据T的取值特征,计算取该值的概率, 如果此概率小于a,则拒绝原假设。
第一节 检验原理
一、提出原假设(Null Hypothesis)和 备择假设(Alternative Hypothesis)
建立原假设H0:P+=P-
计算两种符号的数量S+和S-,利用二 项分布计算S+或S-出现的概率是否处于接受 域。
在n>20的情况下,二项分布可以用正态 分布进行近似:
符号检验中仍然没有利用总体的分布特 征。
四、游程检验
游程检验又称连贯检验或串检验,用于考 察一个序列中两种符号的出现次序是否随机。
本例,如果α变为0.15,这时当一名球员 使用上肢之外的身体部分触球时,球的反弹 角度为X的概率为0.10,就可以拒绝原假设, 即认为球员A存在上肢触球。但如果α为0.05, 在反弹角度为X的概率为0.10时,就要接受原 假设。
统计学第四版第7章假设检验(简)总结
~ 2 n 1
2 n 1 s 当H 为真时,统计量 2
2 n 1 s 20 10.0042 2 统计量的值 31.92
2
0.0025
2 0.10, 查 2分布表得 02.05 ( 19) 30.14, 0 19 10.12 .95
假设检验分为两类:参数检验、非参数检验/自
由分布检验
2
例1
消费者协会接到消费者投诉,指控品牌纸包装饮
料存在容量不足,有欺骗消费者之嫌。包装上标 明的容量为250毫升。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生产中正常的波动, 还是厂商的有意行为?消费者协会能否根据该样 本数据,判定饮料厂商欺骗了消费者呢?
提出原假设和备择假设→根据抽样分布,计算样本统 计量→选择显著性水平α ,查表确定临界值→判断并 得出结论。
8
第一步:确定原假设与备择假设
: =255;
:
≠250
原假设H0:通常是研究者 想收集证据予以反对的假 设,也称为零假设
备择假设H1:通常是研究 者想收集证据予以支持的 假设,也称为研究假设。
3
例2
一种罐装饮料采用自动生产线生产,每罐
的容量是255ml,标准差为5ml。为检验每罐
容量是否符合要求,质检人员在某天生产
的饮料中随意抽取了40罐进行检验,测得每
罐平均容量为255.8ml。检验该天生产的饮
料容量是否符合标准要求。
4
例3
根据过去大量资料,某厂生产的产品的使
用寿命服从正态分布N(1020,1002)。现
第七章假设检验
第三节
u检验
u检验(u test ),亦称z检验(z test) 大样本均数(率)与总体均数(率)比较的u检 验、 两个大样本均数(率)比较的u检验 一、大样本均数比较的u检验 二、大样本率的u检验
一、大样本均数比较的u检验
假定样本数据服从正态分布 ,当总体标准差 未知时,可用样本标准差作为估计值 这里的总体均数一般是指已知的理论值、标准 值或经过大量观察所得到的稳定值,记作µ 0 (或记为 )
两个样本率p1、p2的差值服从正态分布
u p1 p2
1 2
p p
2 2 p p p p 1 (1 1 ) / n1 2 (1 2 ) / n2
1 2 1 2
样本率p介于0.1~0.9之间,每组例数大于60 例
n1 p1 n2 p2 ˆ0 n1 n2
两样本均数比较的u检验
该检验方法适用于完全随机设计中两组 计量资料差别的比较 两样本均数差值服从正态分布
u Leabharlann 1 X 2X1X2
X
1X2
2 2 2 2 X / n 1 1 2 / n2 X2 1
当总体标准差未知,两组例数均超过30
ˆX
1X2
亦称样本率与总体率的比较的u检验,这里的 总体率一般是指已知的理论值、标准值或经大 量观察所获得的稳定值。
例7–3 全国调查的调查结果,学龄前儿童营 养性贫血患病率为23.5%。某医院为了解当
地学龄前儿童能够营养性贫血患病情况,对
当地1396例学龄前儿童进行了抽样调查,查
出营养性贫血患儿363例,患病率为26.0%。
ˆp p
1
2
1 1 ˆ0 (1 ˆ0 )( ) n1 n2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • • • • •
二、假设检验的步骤 (一)提出原假设与备择假设 (二)构造检验统计量 (三)确定拒绝域 (四)计算检验统计量的样本观测值 (五)做出结论
1、提出原假设与备择假设
• 消费者协会实际要进行的是一项统计检验 H0 工作。检验总体平均 =250是否成立。这 就是一个原假设(null hypothesis),通常用 表示,即: H0 : =250
第三节 自由分布检验
一、自由分布检验概述 自由分布检验与限定分布检验不同, 它是指在假设检验时不对总体分布的形状和参数加 以限制的检验。与参数检验相对应,自由分布检验又称为非参数检验,但这里的非参数只是 指未对检验统计量服从的分布及其参数做出限制, 并不意味着在检验中 “不涉及参数” “不 或 对参数进行检验” 。
• 解:通过统计软件进行计算。
(二)配对样本的均值检验 设配对观察值为(x,y),其差值是 d = x-y。设 d 为差值的总体均值,要检验的是:
H 0 : d 0 , H1 : d 0
记d
d ,则其方差是: n
2
2 d d / n Sd n(n 1) n
t
X 1000 S/ n
第三步:确定显著性水平,确定拒绝域。 α=0.05,查 t-分布表(自由度为 8),得临界值是 t / 2, n 1 t0.025,8 =2.306, 拒绝域是(-,-2.306]∪[2.306,+)。在 Excel 中,可以使用函数 TINV(0.05,8) 得到临界值 t0.025,8 。 第四步:计算检验统计量的样本观测值。 将 X 986 ,n=9,S=24,代入 t 统计量得:
H1 • 与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否 定时另一种可能成立的结论。备选假设比 原假设还重要,这要由实际问题来确定, 一般把期望出现的结论作为备选假设。
5-8
2、构建检验统计量
• 构造一个统计量来决定是否“拒绝原假设,接受 备选假设”。对不同的问题,要选择不同的检验 统计量。 X 250 Z / n
Sd
检验统计量是: t d 0 Sd / n t (n 1)
三、p-值检验 p-值检验的一般步骤如下:(1)建立原假设与备择假设;(2)确定检验统计量及其分布; (3)将样本观测值代入检验统计量计算出其样本数值;(4)计算 p-值;(5)将 p-值与显著性水 平 α 相比较,做出判断。如果 p-值小于给定的显著性水平 α,则拒绝原假设;否则,不能拒 绝原假设。更加直观的原则是:如果 p-值很小,拒绝原假设,p-值不够小,则不能拒绝原 假设。 p-值检验不必根据不同的显著水平, 查对有关分布表确定的临界值。 通过计算机计算时, p-值检验更加方便可行。
立抽样,得到两个样本,它们的容量分别是 n1 和 n2;这两个样本的均值分别 是 X 1 和 X 2 。由于总体方差已知, X 1 X 2 N ( 1 2 , 使用 Z 统计量进行检验: Z X1 X 2
12
n1
2 2
n2
) 。我们可以
2 1
n1
2 2
N (0,1)
986 1000 t0 1.75 24 / 9
第五步:判断。 由于 | t0 | =1.75<2.306,检验统计量的样本取值落入接受域,所以不能拒 绝 H0。样本数据表明这天的自动包装机工作正常。
(二)总体成数的检验
根据抽样分布理论,在大样本条件下,样本成数也近似服从正态分布。由此可知,当 H0 为真时,可以构建服从标准正态分布的 Z 统计量进行检验:
第七章 假设检验
1
本章主要内容:
• • • • 第一节 假设检验概述 第二节 总体均值与成数的检验 第三节 自由分布检验 第四节、列联表分析与总体方差检验
2
第一节 假设检验概述
• 一、假设检验的基本思想 • 假设检验是统计推断的另一种方式,它与区间估 计的差别主要在于:区间估计是以大概率为标准, 推断出总体参数的取值范围;而假设检验是以小 概率为标准,对总体参数或分布形式所做出的假 设进行判断。假设检验分为两类:一类是参数检 验,另一类是自由分布假设检验,或称非参数检 验。
t
X 0 S/ n
~ t (n 1)
式中 S 是样本标准差。
需要注意的是,在样本容量较小时,t-分布与标准正态分布的差异是明 显的,但是在大样本场合,t-分布与标准正态分布近似,此时可以用 Z 统计 量代替 t 统计量。 此外,当总体分布未知或不是正态总体,且总体标准差未知时,仍然可 用样本标准差来代替总体标准差, 但此时必须是大样本, 并且使用 Z 统计量。
0
临界值 1
与关系示意图
• 四、检验功效 • 在犯第一类错误概率得到控制的条件下,犯取伪 错误也应尽可能地小,或者说,不取伪的概率1-β 应尽可能增大。1-β越大,意味着当原假设不真实 时,检验判断出原假设不真实的概率越大,检验 的判别能力就越好;1-β越小,检验的判别能力就 越差。可见1-β是反映统计检验判别能力大小的重 要标志,我们称之为检验功效或检验力。
3、确定拒绝域
• 检验统计量确定后,就要利用该统计的 分布以及由实际问题中所确定的显著性 水平,来进一步确定检验统计量拒绝原 假设的取值范围,即拒绝域。在给定的 显著性水平α下,检验统计量的可能取值 范围被分成两部分:小概率区域与大概 率区域。小概率区域就是概率不超过显 著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假 设的接受区域。
Z
P 0 N (0,1) 0 (1 0 ) n
式中,0 为总体成数的假设值,P 表示样本成数。
二、两个正态总体的假设检验
(一)独立样本的均值检验 1.总体标准差已知
2 设两总体分别是 1 N ( 1 , 12 ) , 2 N ( 2 , 2 ) ,分别从这两个总体中独
n2
按备择假设的不同,也存在三种情形: (1) H 0 : 1 2 , H 1 : 1 2 ,双侧检验; (2) H 0 : 1 2 , H 1 : 1 2 ,左侧检验; (3) H 0 : 1 2 , H 1 : 1 2 ,右侧检验。
• 【例7-6】某商店销售的商品来自甲、乙两家厂商, 为了考察商品性能的差异,从甲、乙两家厂商的 产品中分别抽取了8件和9件,测定其性能指标, 得如下数据: • 甲厂产品X:0.30,0.12,0.18,0.25,0.27, 0.08,0.19,0.13; • 乙厂产品Y:0.28,0.30,0.11,0.14,0.35, 0.26,0.14,0.31,0.20。 • 问在显著性水平0.1下,两家产品的性能是否存在 明显的差异。
5-10
4、计算检验统计量的观测值
X 250 248 250 Z 3.54 / n 4 / 50
5、做出结论
• 统计量是否落在拒绝域
• 尽管拒绝或者不拒绝是根据主观给定的显 著性水平决定,但是在实践中,我们往往 认为拒绝原假设 接受 H0 拒绝 H0 H0 真实 H0 不真实 判断正确 取伪错误(概率为 β) 弃真错误(概率为 α) 判断正确
• 【例7-3】某厂采用自动包装机分装产品, 假定每包产品的重量服从正态分布,每 包标准重量为1 000克。在产品质量抽样 中,某日随机抽查9包,测得样本平均重 量为986克,样本标准差是24克。试问 在0.05的显著性水平上,能否认为这天 自动包装机工作正常?
解: 第一步:确定原假设与备择假设。 H0: =1000,H1: 1000 以上的备择假设是总体均值不等于 1 000 克, 因为只要均值偏离 1 000 克, 都说明包装机工作不正常。因此使用双侧检验。 第二步:构造检验统计量。 由于是正态总体,总体标准差未知,且是小样本,故采用 t 统计量。
Z0
0.076 0.081 2.83 0.025 / 200
第五步:判断。 Z0= -2.83<-1.96,检验统计量的样本取值落入拒绝域。 拒绝原假设,接受备择假设,有证据表明新机床加工的 零件的椭圆度与以前有显著差异。
2.总体标准差未知 总体标准差未知时可用样本标准差代替。但即使在正态总体条件下, 这一新的统计量已不服从标准正态分布,而是服从自由度为 n-1 的 t-分布了。此时的检验统计量称为 t 统计量。
Z
X 0
/ n
~ N (0,1)
式中,0 为总体均值的假设值。
• 【例7-2】某机床厂加工一种零件,根据 经验知道,该厂加工零件的椭圆度近似服 从正态分布,其总体均值为0.081mm,总 体标准差为0.025mm。今换一种新机床进 行加工,抽取200个零件进行检验,得到 的椭圆度为0.076mm。试问在0.05的显著 性水平上,新机床加工零件的椭圆度的均 值与以前有无显著差异?
• 解: • 1、H0:=250,H1: <250
2、
检验统计量 Z:
Z
• 3、
X 250 / n
=0.05,且使用左侧检验,拒绝域在左边,查标准正态分布表得临界值:
-Z= -1.645,则拒绝域是(-,-1.645]
• 4、
将样本平均数 X =248,n=50,代入检验统计量得:
• “小概率原理”,即概率很小的事件在一 次试验中通常是不可能出现的。如果在原 假设成立的前提下,在一次观察中小概率 事件发生了,则认为原假设不正确应予以 否定 。 • 注意:小概率事件没有发生,并没有说就 可以接受原假设。
• 例7-1:消费者协会接到消费者投诉,指 控品牌纸包装饮料存在容量不足,有欺骗 消费者之嫌。包装上标明的容量为250毫 升。消费者协会从市场上随机抽取50盒该 品牌纸包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生产中正常 的波动,还是厂商的有意行为?消费者协 会能否根据该样本数据,判定饮料厂商欺 骗了消费者呢?