第6章 假设检验(年)
第六章假设检验

假设检验的流程:第二步
2、设计检验统计量 设计要求: • 所设计的检验统计量应与原假设相关,与待检 验参数的估计量相关,但不能包含待检验的未 知参数 • 当H0为真时,该统计量的真实分布已知
z
x
x
x n
~ N 0,1
7-16
yuanlibo@
假设检验的流程:第三步和第四步 3 给定显著性水平和相应的临界值
= 0 ≠0
0 < 0
0 > 0
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2
临界值
H0值
临界值
样本统计量
单侧检验:左侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域ห้องสมุดไป่ตู้
置信水平
1-
临界值
H0值
样本统计量
H0:μ≥μ0 , H1:μ<μ0
判断错误(II)
判断正确
专题:假设检验中的两类错 误
H0为真 H0非真 第I类错误(α) 正确 正确 第II类错误(β)
第I类错误——弃真错误, 发生的概率为α 第II类错误——取伪错误,发生的概率为β
7-18
yuanlibo@
接受H0 :μ=μ0
拒绝H0
真实情况:样本来 自μ=μ0的总体
判断正确
判断错误(I)
真实情况:样本来 自μ=μ1的总体
7-8
yuanlibo@
假设的表达形式
1. 2. 3. 4. 原假设(null hypothesis) 待检验的假设,又称“0假设” 研究者想收集证据予以证实的假设 总是有等号 , 或 表示为 H0,如:
六西格玛系列培训之假设检验

P=0.463>0.05
2、判断数据的正态性和两组数据是否等方差 ②等方差检验【统计-方差分析-等方差检验】
2、判断数据的正态性和两组数据是否等方差 ②等方差检验【统计-方差分析-等方差检验】
等方差检验: 17年, 19年
标准差的多重比较区间,α = 0.05
17年
多重比较 P 值 0.088 Levene 检验 P 值 0.250
什么是假设检验?
(hypothesis test)
概念:先对总体的参数提出某种假设,然后利用样本信息 判断假设是否成立的过程
原理:逻辑上运用反证法,统计上依据小概率原理
作用:运用统计学手段,从实际差异和抽样误差的权衡比 较中,间接地推断实际差异是否存在
Q2:掌握假设检验的基本概念和流程
原假设和备择假设——掌握概念,能够正确建立假设 假设检验的两类错误——了解假设检验犯错的可能 统计量与拒绝域——了解相关概念含义,三种判定方式 假设检验的分类——能够根据题意选择合适的检验方法
双侧检验
置信区间
0 z 2
n
,
0
z
2
n
何时拒绝H0 样本均值落在置信区间外
左侧检验
下限
样本均值小于下限值
右侧检验
上限
样本均值大于上限值
假设检验的分类
参数
应用条件
均值 比率 方差
在总体标准差已知时,确定样本均值是否与指定值显著不同 在总体标准差未知时,确定样本均值是否与指定值显著不同
实际情况
H0为真 H0为假 正确决策 第Ⅱ类错 (1 – α) 误(β) 第Ⅰ类错 正确决策
误(α) (1-β)
假设检验的两类错误
回归模型的假设检验(附)

第6章 回归模型的假设检验1,区间估计—基本概念假设对消费函数回u Y C ++=21ββ归分析之后,得出边际消费倾向2β的估计值为0.509。
这是对未知的总体MPC 2β的一个单一的点估计。
这个点估计可不可靠?虽然在重复抽样中估计值的均值可能会等于真值))ˆ((22ββ=E ,但由于抽样波动,单一估计值很可能不同于真值。
在统计学中,一个点估计量的可靠性有它的标准误差来衡量。
因此,我们不能完全依赖一个点估计值,而是围绕点估计量构造一个区间。
比方说,在点估计量的两旁各划出宽为2或3个标准误差的一个区间,使得它有95%的概率包含着真实的参数值。
这就是取件估计的粗略概念。
假定我们想知道宽竟,比方说,2ˆβ离2β有多“近”。
为了这个目的,试求两个正数δ和a ,10<<a ,使得随机区间)ˆ,ˆ(22δβδβ+-包含2β的概率为a -1。
a -=+≤≤-1)ˆˆPr(222δββδβ (1) 如果存在这个区间,就称之为置信区间,)1(a -称置信系数或置信度,a 称为显著水平。
置信区间的端点称临界值。
上限和下限。
0.05,0.01。
比方说05.0=a ,(1)式就可读为:试中的区间包含真实的2β的概率为95%。
2,回归系数的置信区间一元回归时,在i u 的正态性假定下,OLS 估计量21ˆ,ˆββ本身就是正态分布的,其均值和方差已随之列出。
以2ˆβ为例 2ˆ22ˆβββS Z -=--(2) 2ˆβ的方差∑-=22)(X X σ这是一个标准化正态变量。
因此,如果知道真实的总体方差2σ已知,就可以利用正态分布对2β作概率性表达。
当2σ已知时,以μ为均值,2σ为方差的正态变量有一个重要性质,就是σμ±之间的面积约占68%,95%,99%。
但是2σ很少能知道,在现实中用无偏估计量2σ来确定。
用σˆ代替σ,(2)可以改写为 )ˆ(ˆ222βββS t -= (3)这样定义的t 变量遵循自由度为n-2的t 分布。
统计学(第三版课后习题答案

即有X ~N(10,9.995)。相应的概率为: P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。
可见误差比较大(这是由于P太小,二项分布偏斜太严重)。 【注】由于二项分布是离散型分布,而正态分布是连续性分布,所 以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量
直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:
100只灯泡使用寿命非频数分布
按使用寿命分 灯泡个 频率
组(小时) 数 (%)
(只)
650~660
2
2
660~670
5
5
670~680
6
6
680~690
14
14
690~700
26
26
700~710
18
18
710~720
13
13
720~730
10
求概率为:P(X ≤10)=0.58304。 (2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率 为: P(X>20)=1-P(X≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E(X) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X) =50000×(20000×0.0005×0.9995)1/2=158074(元)
即:,K/30≥1.64485,故K≥49.3456。 3.12设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整 数) (2)
第6章假设检验

第6章假设检验6.1 一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。
据报道,10年前每天每个家庭看电视的平均时间是6.70小时。
取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?详细答案:,=3.11,,拒绝,如今每个家庭每天收看电视的平均时间显著地增加了。
6.2 为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。
已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。
在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):81.6 86.6 80.0 85.8 78.6 58.3 68.7 73.296.6 74.9 83.0 66.6 68.6 70.9 71.7 71.677.3 76.1 92.2 72.4 61.7 75.6 85.5 72.574.0 82.5 87.0 73.2 88.5 86.9 94.9 83.0根据最近的测量数据,当显著性水平时,能否认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值?详细答案:,=-2.39,,拒绝,该城市空气中悬浮颗粒的平均值显著低于过去的平均值。
6.3 安装在一种联合收割机的金属板的平均重量为25公斤。
对某企业生产的20块金属板进行测量,得到的重量数据如下:22.6 26.6 23.1 23.527.0 25.3 28.6 24.526.2 30.4 27.4 24.925.8 23.2 26.9 26.122.2 28.1 24.2 23.6假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求?详细答案:,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
6.4 在对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
第6章 参数假设检验

第2类错误(“存伪”错误):接受了错误的假设H0 。
关于小概率事件原理的说明
例如,有一个厂商声称,他的产品的合格品率很高, 可以达到99%,那么从一批产品(譬如100件)中随 机抽取一件,这一件恰恰好是次品的概率就非常小, 只有1%。如果厂商的宣传是真的,随机抽取一件是 次品的情况就几乎是不可能发生的。但如果这种情 况确实发生了,就有理由怀疑原来的假设,即产品 中只有1%的次品的假设是否成立,这时就有理由推 翻原来的假设,可以做出厂商的宣传是假的这样一 个推断。
依据小概率原理推断可能会犯错误! 假设上例中100件产品中确实只有1件是次品, 但恰好在一次抽取中被抽到了,按前面的方 式将得到一个错误的判断,但犯错误的概率 很小,本例是1%,也就是说我们在冒1%的风 险做出厂商宣传是假的这样一个推断。
相关的问题: 抽到多少件次品, 可判断厂商的宣传是 假的?
假设检验的步骤
第2类错误与样本容量
回顾引例,利用前面介绍的假设检验方法,我们拒绝 了总体均值为100mm的原假设。但是也可能有疑问: 是不是由于样本数量太少,导致的这一结果?自然地, 我们希望知道,多大的样本容量是合适的?
直观地考虑,不难想到:希望犯错误的风险越低, 样本容量就应该越大。
引例 某厂要在生产线上加工一种直径为100mm的轴,加工 出来一批后,检验人员从生产出来的轴中随机抽取了一个 由16根轴(?)构成的一个样本,测量出平均直径为 110mm,样本方差为100。问生产线是否出了问题。
设立假设
设立原假设(null hypothesis)H0和一个与之矛盾 的备择假设(alternative hypothesis) H1。
构造与计算检验统计量
根据事先给定的小概率值——显著性水 平进行检验
第6章 假设检验

第6章假设检验练习:6.1某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。
在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?6.2研究人员发现,当禽类被拘禁在一个很小的空间内时,就会发生同类相残的现象。
一名孵化并出售小鸡的商人想检验某一品种的小鸡因为同类相残而导致的死亡率是否小于0.04。
试帮助这位商人定义检验参数并建立适当的原假设和备择假设。
6.3一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进行抽检,如果证实玻璃纸的横向延伸率不符合规格,该生产线就必须立即停产调整。
监控人员应该怎样提出原假设和备择假设,来达到判断该生产线是否运转正常的目的?6.4一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60克一袋的那种土豆片的重量不符。
店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(克)μ进行检验,假设陈述如下:如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。
(1)与这一假设检验问题相关联的第一类错误是什么?(2)与这一假设检验问题相关联的第二类错误是什么?(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重?6.5某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。
研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。
假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。
(1)选择检验统计量并说明其抽样分布是什么样的?(2)检验的拒绝规则是什么?(3)计算检验统计量的值,你的结论是什么?6.6一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。
第6章假设检验

H0: 1000
H1: 1000
27
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
研究的问题
假设
双侧检验 H0 H1 = ≠ 左侧检验 < 右侧检验 >
28
All rights reserved
建立的原假设与备择假设应为 H0: 10 H1: 10
23
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
单侧检验
备择假设具有特定的方向性,并含有符号“>”或 “<”的假设检验,称为单侧检验或单尾检验(onetailed test) 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
14
All rights reserved
假设的陈述(续)
南审数统学院
零假设的提出
所假设的总体参数值为研究者认为不对的总 体参数值 实质:科学研究中的保守主义 比如:新的工艺或技术没有造成任何改变, 新药没有任何疗效,变量间没有联系
15
All rights reserved
假设的陈述(续)
24
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
例析:
一项研究表明,采用新技术生产后,将会使产品的 使用寿命明显延长到1500小时以上。检验这一结论 是否成立 研究者总是想证明自己的研究结论(寿命延长) 是正确的 备择假设的方向为“>”(寿命延长) 建立的原假设与备择假设应为 H0: 1500 H1: 1500
假设检验的基本概念

客观实际
可能发生的两类错误
假设检验的结果
拒绝 H0
“接受”H0
H0 成立
H0 不成立 即 H1 成立
I 型错误( ) 推 断 正 确 (1 )
推断正确(1 ) II 型错误( )
第四军医大学卫生统计学教研室 2020年3月20日
H1: <0
成立
1
1
界值 0
图8-2 I型错误与II型错误示意图(以单侧u检验为例)
降低。
第四军医大学卫生统计学教研室 2020年3月20日
二、两个率比较的u检验 推断两个总体率是否相同
u
p1 p2
·pc )(
1 n1
1 n2
)
P124例8-5
第四军医大学卫生统计学教研室 2020年3月20日
例8–5 某医院用黄芪注射液和胎盘球蛋白进行穴 位注射治疗小儿支气管哮喘病人,黄芪注射液 治疗117例,有效103例;胎盘球蛋白治疗55例, 有效49例。试比较两种疗法有效率有无差别
第四军医大学卫生统计学教研室 2020年3月20日
③ H1的内容直接反映了检验单双侧。若H1
中只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
④ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。
二 、 两 样 本 比 较 的 u 检 验 (two-
sample u-test) 适用于两样本含量较大(如 n1>30且n2>30)时。检验统计量为
u X1 X2 X1 X2
S X1X 2
第6章 假设检验的基本概念

第四节 假设检验需注意的问题
1.要有严密的研究设计 要有严密的研究设计 2.正确理解α 水准和 值的意义 正确理解 水准和P值的意义 3.正确理解结论的统计学意义 正确理解结论的统计学意义 4.假设检验的结论不能绝对化 假设检验的结论不能绝对化
【例6-4】某人想研究小剂量干扰素加三氮唑核苷治疗 】 流行性乙型脑炎的疗效。 流行性乙型脑炎的疗效。治疗组为在一般治疗的基础 上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑 上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑 同期的接受一般治疗的73例该病患者作 炎99例,采用同期的接受一般治疗的 例该病患者作 例 采用同期的接受一般治疗的 为对照。治疗组中轻型29例 ),普通型 为对照。治疗组中轻型 例(占29%),普通型 例 ),普通型40例 ),重型 ),极重型 (占41%),重型 例(占22%),极重型 例(占 ),重型22例 ),极重型8例 8%);对照组中轻型 例(占25%),普通型 例 轻型18例 ),普通型 ) 对照组中轻型 ),普通型32例 44%),重型17例 ),重型 23%),极重型6例 ),极重型 (占44%),重型17例(占23%),极重型6例(占 8%)。两组病人均采用传统降温、镇静、降颅内压、 ) 两组病人均采用传统降温、镇静、降颅内压、 肾上腺皮质激素及抗生素预防感染等对症治疗。 肾上腺皮质激素及抗生素预防感染等对症治疗。在此 基础上治疗组选择发病在 病人, 治疗组选择发病在5d病人 基础上治疗组选择发病在 病人,加用干扰素和三氮 唑核苷静滴,疗程5~ 。 唑核苷静滴,疗程 ~7d。两组比较疗效差别具有统计 学意义, 学意义,结论是在一般治疗的基础上加用小剂量干扰 素及三氮唑核苷治疗流行性乙型脑炎的疗效优于一般 治疗的疗效。 治疗的疗效。
x − µ 0 123.5 − 125 t= = = −0.6466 sx 11.6 25
贾俊平统计学第6章假设检验

正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
《统计学原理》期末复习资料

08年春期成人教育专科《统计学原理》期末复习指导2008年6月修订第一部份课程考核说明1.考核目的通过本次考试,了解学生对本课程基本内容的掌握程度,重点和难点内容的掌握程度,以及运用统计学的基本知识、基本理论和基本方法来分析解决统计现象和统计分析的技能,同时还考察学生在平时的学习中是否注意了理解和记忆相结合,理解和运用相结合。
2.考核方式本课程期末考试形式为闭卷笔试,考试时间为90分钟。
3.适用范围、教材本复习指导适用于重庆电大成人教育专科经济类各专业的必修课程,以及电子商务专业、工商管理专业(计算机信息管理方向)、物流管理专业的选修课程《统计学原理》。
本课程考试命题依据是的教材采用黄良文、陈仁恩主编,中央电大出版社出版的《统计学原理》(2006年6月第4版)。
4.命题依据本课程的命题依据是《统计学原理》课程的教学大纲、教材、实施意见。
5.考试要求考试主要是考核学生对基本理论、基本指标、基本方法的理解和应用能力。
在能力层次上,从了解、掌握、重点掌握三个角度来要求。
了解是要求考生对本课程的基本知识和相关知识有所了解;掌握是要求考生对基本理论和基本方法不仅要知道是什么,还要知道为什么;重点掌握是要求考生能综合运用所学的基本理论和统计分析方法。
6.考试题型及结构考题类型及分数比重大致为:判断题(占10%左右)、单项选择题(占20%左右)、多项选择题(占10%左右)、简答题(占15%左右)、计算题(占50%左右)。
7.其它说明考试时,要求考生携带有统计功能的计算器。
第二部份期末复习重点范围第一章:总论一、重点掌握1.品质标志和数量标志有什么区别?2.简述统计标志与统计指标的区别。
3.什么是数量指标和质量指标?两者有何关系?4.统计总体、总体单位、标志、标志表现、变量、指标等统计学中的几个基本概念、种类及相互关系。
二、一般掌握1.统计的研究对象。
2.统计的涵义及其关系。
3.统计的研究方法。
4.国家统计的职能。
第6章 假设检验

二、 假设检验的步骤 提出原假设和备择假设 /备择假设 确定适当的检验统计量 规定显著性水平: 根据显著性水平α及检验
统计量的查找临界值,并确定拒绝域。注 意是单侧检验还是双侧检验
计算检验统计量的值: 从总体中抽取某一样 本,据样本资料计算检验统计量的值 作出统计决策: 若检验统计量的值落在拒绝 域内就拒绝H0,否则接受H0
置信水平
拒绝域
a/2
1 - 接受域
H0值
a/2
临界值
临界值
样本统计量
双侧检验 (显著性水平与拒绝域 )
抽样分布
拒绝域 a/2 1 - 接受域 H 0值 样本统计量 置信水平 拒绝域 a/2
临界值
临界值
例如 ,一个灯光厂需要生产平均使用寿命 µ = 1000小时的灯泡。为了观察生产工艺过程是否正常, 从一批产品中抽取150个进行检验,得到平均使用 寿命980小时,能否断定这个厂生产的灯泡平均使 用寿命为1000小时?为什么? 不希望在1000小时任何一边超越太多,假设: H0: µ = 1000 (平均使用寿命为1000) H1: µ ≠ 1000 (平均使用寿命不是1000) 我们在这里提出的原假设是µ =1000,所以只要 µ >1000或µ <1000二者中有一个成立就可以否定原假 设(平均使用寿命为1000)。
标准误计算公式
σ已知: σ未知: S
X
n
X
S n
实例:如某年某市120名12岁健康男孩,已求 得 均数为143.07cm,标准差为5.70cm,按公 式计算,则标准误为:
SX
5 . 70 120
0 . 52
标准误的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
STATISTICS (第四版)
学习目标
假设检验的基本思想和原理
假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
6-4 2014-5-8
统计学
6 - 16
H1 : < 500
500g
2014-5-8
统计学
STATISTICS (第四版)
提出假设
(例题分析)
【例6-3】一家研究机构估计,某城市中家庭拥有汽 车的比例超过 30% 。为验证这一估计是否正确, 该研究机构随机抽取了一个样本进行检验。试 陈述用于检验的原假设与备择假设 解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比例 超过30%”。建立的原假设和备择假设 为 H0 : 30%
3. 表示为 (alpha)
4. 由研究者事先确定
6 - 22
2014-5-8
统计学
STATISTICS (第四版)
依据什么做出决策?
1. 若假设为H0:=500,H1:<500。样本 均值为495,拒绝H0吗?样本均值为502, 拒绝H0吗? 2. 做出拒绝或不拒绝原假设的依据是什么? 3. 传统上,做出决策所依据的是样本统计 量,现代检验中人们直接使用由统计量 算出的犯第Ⅰ类错误的概率,即所谓的P 值
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
6 - 13
2014-5-8
统计学
STATISTICS (第四版)
双侧检验与单侧检验
(假设的形式)
以总体均值的检验为例
假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
Байду номын сангаас右侧检验
H0 : 0
6 - 17
H1 : 30%
2014-5-8
统计学
STATISTICS (第四版)
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
• P值告诉我们:如果原假设是正确的话,我们 得到得到目前这个样本数据的可能性有多大, 如果这个可能性很小,就应该拒绝原假设
2. 被称为观察到的(或实测的)显著性水平 3. 决策规则:若p值<, 拒绝 H0
6 - 29
2014-5-8
统计学
STATISTICS (第四版)
双侧检验的P 值
/2
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
6 - 28 2014-5-8
统计学
STATISTICS (第四版)
用P 值决策
(P-value)
1. 如果原假设为真,所得到的样本结果会像实 际观测结果那么极端或更极端的概率
小概率是在一次试验中,一个几乎不可能发生的 事件发生的概率 在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
6 - 10
2014-5-8
统计学
STATISTICS (第四版)
原假设
(null hypothesis)
1.
2.
3. 4.
又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示 所表达的含义总是指参数没有变化或变量之间没 有关系 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
2014-5-8
6 - 11
统计学
STATISTICS (第四版)
备择假设
(alternative hypothesis)
1. 2. 3.
4.
也称“研究假设”,研究者想收集证据予以支持的 假设,用H1或Ha表示 所表达的含义是总体参数发生了变化或变量之间 有某种关系 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设 总是有符号 , 或
6 - 23
2014-5-8
统计学
STATISTICS (第四版)
检验统计量
(test statistic)
1. 根据样本观测结果计算出对原假设和备择假 设做出决策某个样本统计量 2. 对样本估计量的标准化结果
原假设H0为真
点估计量的抽样分布
点估计量 — 假设值 标准化检验统计量 点估计量的抽样标准差
统 计 学 数据分析
(方法与案例)
作者 贾俊平
统计学
STATISTICS (第四版)
统计名言
……正如一个法庭宣告某一判决 为“无罪(not guilty)”而不为“清白 (innocent)”,统计检验的结论也应 为“不拒绝”而不为“接受”。
——Jan Kmenta
6-2 2014-5-8
第 6 章 假设检验
原假设为正确时拒绝原假设 第Ⅰ类错误的概率记为,被称为显著性水平 原假设为错误时未拒绝原假设 第Ⅱ类错误的概率记为(Beta)
2. 第Ⅱ类错误(错误)
6 - 20
2014-5-8
统计学
STATISTICS (第四版)
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι类错误 的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ 类错误的概率定得低些较为合理;反之,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较低,则将 犯第Ⅰ类错误的概率定得高些 2. 一般来说,发生哪一类错误的后果更为严重,就应该 首要控制哪类错误发生的概率。但由于犯第Ι类错误 的概率是可以由研究者控制的,因此在假设检验中, 人们往往先控制第Ι类错误的发生概率
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值
计算出的样本统计量
6 - 30
0
临界值
Z
计算出的样本统计量
2014-5-8
2014-5-8
统计学
STATISTICS (第四版)
正常人的平均体温是37oC吗?
根据样本数据计算的平均值是 36.8oC ,标准差 为0.36oC 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为 (36.7 , 36.9) 。研究人员发现 这个区间内并没有包括37oC 因此提出“不应该再把 37oC 作为正常人体温的 一个有任何特定意义的概念” 我们应该放弃“正常人的平均体温是 37oC” 这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
2014-5-8
6 - 12
统计学
STATISTICS (第四版)
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “ ”的假设检验,称为双侧检验或双尾 检验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
备择假设
H1 : ≠0
H1 : <0
H1 : >0
6 - 14
2014-5-8
统计学
STATISTICS (第四版)
提出假设
(例题分析)
【例 6-1】 一种零件的生产标准是直径应为 10cm ,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于 10cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
非拒绝域
Region of Rejection
抽样分布
拒绝H0
1-
Region of Nonrejection
H0
6 - 27
临界值
2014-5-8
统计学
STATISTICS (第四版)
统计量决策规则
1. 给定显著性水平,查表得出相应的临界 值z或z/2,t或t/2 2. 将检验统计量的值与 水平的临界值进行 比较 3. 作出决策
3. 标准化的检验统计量
6 - 24
2014-5-8
统计学
STATISTICS (第四版)
用统计量决策
(双侧检验 )
非拒绝域
Region of Rejection
抽样分布
Region of Rejection
拒绝H0
拒绝H0
/2
1-
Region of Nonrejection
/2
临界值
6 - 25
解:研究者想收集证据予以证明的假设应该是 “生产过程不正常”。建立的原假设和备择假 设为 H0 : 10cm
6 - 15
H1 : 10cm
2014-5-8
统计学
STATISTICS (第四版)
提出假设
(例题分析)
【例6-2】某品牌洗涤剂在它的产品说明书中声称: 平均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设 解:研究者抽检的意图是倾向于证 绿叶 实这种洗涤剂的平均净含量并不符 洗涤剂 合说明书中的陈述 。建立的原假设 和备择假设为 H0 : 500