假设检验的基本原理与一般步骤PPT(61张)
合集下载
假设检验PPT课件
60 62.5 65 67.5 70 72.5 75
b
H0 不真
67.5 70 72.5 75 77.5 80 82.5
两类错误是互相关联的, 当样本容 量固定时,一类错误概率的减少导致另 一类错误概率的增加.
b a
要同时降低两类错误的概率a b,或 者要在 a 不变的条件下降低 b,需要增
加样本容量.
(二)备择假设(alternative hypothesis),与原假设相对立(相反)的假设。 一般为研究者想收集数据予以证实自己观点的假设。 用H1表示。 表示形式:H1:总体参数≠某值 (<) (>)
例:H1: 0
(三)两类假设建立原则 1、H0与H1必须成对出现 2、通常先确定备择假设,再确定原假设 3、假设中的等号“=”总是放在原假设中
•
P>α时,H0成立
多重检验及校正
在同一研究中,有时我们会用到二次或多次显著 性检验,从上表可以看出,如果我们将显著性水平确 定为α=0.05水平,做一次显著性检验后我们只能保证 有95%的研究结果与真值是一致的;如果做两次显著 性检验后,研究结果与真值的符合程度就会降至 95%*95%=90.25,当我们进行5次显著性检验后,就 会降至77.4%,即在5次显著性检验后,由α水平所得 到的显著性检验结果的可靠性只有3/4的可靠性。
用于处理生物学研究中比较不同处理效应 的差异显著性。
数据资料中,两个样本的各个变量从各自 总体中抽取,两个样本之间变量没有任何关 联,即两个抽样样本彼此独立,不论两个样 本容量是否相同。
方法1:两个总体方差都已知(或方差未知大样本)
• 假定条件
– 两个样本是独立的随机样本
– 两个总体都是正态分布 – 若不是正态分布, 可以用正态分布来近似(n130和
《假设检验》PPT课件
2008-2009
样本统计量 临界值
抽样分布
2008-2009
1 -
置信水平 拒绝H0
0
样本统计量
临界值
✓决策规则
1. 给定显著性水平,查表得出相应的临 界值z或z/2, t或t/2
2. 将检验统计量的值与 水平的临界值进 行比较
3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
H1 : <某一数值,或 某一数值
例如, H1 : < 10cm,或 10cm
2008-2009
➢提出假设
【例】一种零件的生产标准是直径应为10cm,为对生产过
程进行控制,质量监测人员定期对一台加工机床检查, 确定这台机床生产的零件是否符合标准要求。如果零件 的平均直径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是否正常的原 假设和备择假设
2008-2009
❖利用P值进行决策
➢什么是P 值(P-value)
1. 在原假设为真的条件下,检验统计量的观察值 大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一致 的程度
3. 被称为观察到的(或实测的)显著性水平 4. 决策规则:若p值<, 拒绝 H0
2008-2009
第6章 假设检验
统计研究目的
统计设计
推
断
客观
统
统
分
现象
计
计
析
数量
调
整
表现
查
理
描 述
样本统计量 临界值
抽样分布
2008-2009
1 -
置信水平 拒绝H0
0
样本统计量
临界值
✓决策规则
1. 给定显著性水平,查表得出相应的临 界值z或z/2, t或t/2
2. 将检验统计量的值与 水平的临界值进 行比较
3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
H1 : <某一数值,或 某一数值
例如, H1 : < 10cm,或 10cm
2008-2009
➢提出假设
【例】一种零件的生产标准是直径应为10cm,为对生产过
程进行控制,质量监测人员定期对一台加工机床检查, 确定这台机床生产的零件是否符合标准要求。如果零件 的平均直径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是否正常的原 假设和备择假设
2008-2009
❖利用P值进行决策
➢什么是P 值(P-value)
1. 在原假设为真的条件下,检验统计量的观察值 大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一致 的程度
3. 被称为观察到的(或实测的)显著性水平 4. 决策规则:若p值<, 拒绝 H0
2008-2009
第6章 假设检验
统计研究目的
统计设计
推
断
客观
统
统
分
现象
计
计
析
数量
调
整
表现
查
理
描 述
《假设检验》课件
方差分析
总结词
适用于多组数据比较的检验方法
详细描述
方差分析是一种适用于多组数据比较的假设检验方法。它通过比较不同组之间的变异和 误差来源,计算F值和对应的P值,以判断原假设是否成立。方差分析在很多领域都有
应用,如农业、生物统计学和心理学等。
秩和检验
总结词
适用于等级数据或非参数数据的检验方法
详细描述
秩和检验是一种适用于等级数据或非参数数 据的假设检验方法。它通过将数据排序后进 行比较,计算秩和值和对应的P值,以判断 原假设是否成立。秩和检验在很多领域都有 应用,如医学、生物学和环境科学等。
04 假设检验的实例分析
单样本Z检验实例
总结词
用于检验一个样本的平均值与已知的 某一总体均值之间是否存在显著差异 。
如果样本量过小,可能无 法得出可靠的结论,因为 小样本可能无法代表总体 。
样本量过大
如果样本量过大,可能会 导致统计效率降低,增加 计算复杂度和成本。
样本代表性
在选择样本时,需要确保 样本具有代表性,能
假设检验的结果只能给出拒绝或接受 假设的结论,但无法给出假设正确与 否的确凿证据。
置信区间有助于判断假设的正确性
02
通过比较置信区间和假设值的位置关系,可以判断假设是否成
立。
置信区间与假设检验的互补关系
03
置信区间和假设检验各有优缺点,可以结合使用以更全面地评
估数据的统计性质。
THANKS 感谢观看
提出假设
根据研究问题和目的,提出原 假设和备择假设。
确定临界值
根据统计量的性质和显著性水 平,确定临界值。
做出决策
根据计算出的样本统计量和临 界值,做出接受或拒绝原假设 的决策。
《假设检验检验》课件
《假设检验检验》PPT课 件
数据分析中的假设检验
什么是假设检验
假设检验是一种统计方法,用于通过样本数据来推断总体参数的性质。它可以帮助我们判断一个观察结 果是由偶然因素引起的,还是真实存在的差异。
假设检验的步骤
1
2. 选择检验统计量
2
选择适合问题的检验统计量,如t值、
z值等。
3
4. 计算统计量
4
利用样本数据计算检验统计量的值。
5
6. 得出结论
6
根据决策,得出关于总体参数的结论。
1. 建立假设
确定原始假设和备择假设,描述总体 参数的状态。
3. 设定显著性水平
选择显著性水平,决定拒绝原始假设 的界限。
5. 做出决策
根据检验统计量的值和显著性水平, 决定是否拒绝原始假设。
常用的假设检验方法
单样本t检验
结论的解释
根据结果的解释,得出关于总体参数的结论,并提供相应的推论。
实例演示及应用场景
通过具体的实例演示,展示假设检验在各个领域的应用,如医学、市场研究、环境保护等。
总结与展望
假设检验是数据分析中重要的工具之一,它可以帮助我们做出科学的决策, 并推动各个领域的发展。未来,我们可以进一步研究和改进假设检验方法, 提高其效能和适用性。
用于比较一个样本的平均值 与已知值或者另一个样本的 平均值。
独立样本t检验
用于比较两个独立样本的平 均值是否存在显著差异。
相关样本t检验
用于比较两个相关样本的平 均值是否存在显著差异。
如何解读假设检验结果
拒绝原始假设
如
接受原始假设
如果检验结果的p值大于等于显著性水平,我们接受原始假设。
数据分析中的假设检验
什么是假设检验
假设检验是一种统计方法,用于通过样本数据来推断总体参数的性质。它可以帮助我们判断一个观察结 果是由偶然因素引起的,还是真实存在的差异。
假设检验的步骤
1
2. 选择检验统计量
2
选择适合问题的检验统计量,如t值、
z值等。
3
4. 计算统计量
4
利用样本数据计算检验统计量的值。
5
6. 得出结论
6
根据决策,得出关于总体参数的结论。
1. 建立假设
确定原始假设和备择假设,描述总体 参数的状态。
3. 设定显著性水平
选择显著性水平,决定拒绝原始假设 的界限。
5. 做出决策
根据检验统计量的值和显著性水平, 决定是否拒绝原始假设。
常用的假设检验方法
单样本t检验
结论的解释
根据结果的解释,得出关于总体参数的结论,并提供相应的推论。
实例演示及应用场景
通过具体的实例演示,展示假设检验在各个领域的应用,如医学、市场研究、环境保护等。
总结与展望
假设检验是数据分析中重要的工具之一,它可以帮助我们做出科学的决策, 并推动各个领域的发展。未来,我们可以进一步研究和改进假设检验方法, 提高其效能和适用性。
用于比较一个样本的平均值 与已知值或者另一个样本的 平均值。
独立样本t检验
用于比较两个独立样本的平 均值是否存在显著差异。
相关样本t检验
用于比较两个相关样本的平 均值是否存在显著差异。
如何解读假设检验结果
拒绝原始假设
如
接受原始假设
如果检验结果的p值大于等于显著性水平,我们接受原始假设。
第十一章 假设检验.ppt
H0.若H0成立,
X
~
N
269.
22 30
则有
Z
30 X 269
2
则在下Z~N(0,1),即Z的分布已知,因而Z可以做检验统计量, 偏小等价于Z偏小,从而得到拒绝域的形式如下
2019-11-27
R
30
X
2
269
k
其中k待定,称之为临界值.
感谢你的阅读
估计值大于5000呢?也就是说从观察数据得到的结果 ˆ 5001
与参考值5000的差异仅仅是偶然的呢?还是总体均值μ确实 有大于5000的“趋势”?
这些问题是以前没有研究过的。一般而言,估计问题是 回答总体分布的未知参数是多少?或范围有多大?而假设检 验问题则是回答观察到的数据差异只是机会差异,还是反映 了总体的真实差异?因此两者对问题的提法有本质不同。
2019-11-27
感谢你的阅读
3
第十一章 假设检验
二.原假设和备择假设
下面通过一个例子介绍 原假设和备择假设
2019-11-27
感谢你的阅读
4
例1(酒精含量) 一种无需医生处方即可达到的治 疗咳嗽和鼻塞的药。按固定其酒精含量为5﹪.今从 一出厂的一批药中随机抽取10瓶,测试其酒精含量 得到的10个含量的百分数:
μ=5”这样一个待检验的假设记作“H0:μ=5”称为 “原假设”或 “零假设”.表明数据的“差异”是偶
然的,总体没有 “变异”发生.
2019-11-27
感谢你的阅读
5
原假设的对立面是“X的均值μ≠10”记作
“H1:μ≠10”称为“对立假设”或“备择假设”.表 明数据的“差异”不是偶然的,是总体 “变异”的
第6章 假设检验的基本概念 PPT课件
第六章假设检验第一节假设检验的基本思想及步骤例61为了解某地1岁婴儿的血红蛋白浓度某医生从该地随机抽取了1岁婴儿25名测得其血红蛋白浓度的平均数为1235gl标准差为116gl而一般正常婴儿的平均血红蛋白浓度为125gl试分析该地1岁婴儿的平均血红蛋白浓度与一般正常婴儿的平均血红蛋白浓度是否相同
第六章 假设检验的 基本概念
一、Ⅰ型错误与Ⅱ型错误的概念
假设检验的结果 拒绝 H0 H0 成立 I 类错误() 不拒绝 H0 推断正确(1-) II 类错误()
客观实际
H0 不成立 H1 成立 推断正确(1-)
二、Ⅰ型错误与Ⅱ型错误的关系
图6-2 Ⅰ型错误与Ⅱ型错误示意图
三、假设检验的检验功效
• 检验功效或把握度(power of a test) 1-称为检验功效或把握度(power of a test), 是指当两总体参数确有差别时,按水准假 设检验能发现它们有差别的能力。即对真 实的作肯定结论之把握程度。 影响因素:
第五节 假设检验与区间估计的联系
• 假设检验与可信区间是从两个不同目的 出发并有密切关联的分析方法,假设检 验用于推断总体参数“质”的不同,而 可信区间用于说明总体参数“量”的大 小,两者即有区别又有联系。
1.可信区间可以回答假设检验的问题
如果可信区间包含H0,则按水准不拒绝H0; 如果可信区间不包含H0,则按水准拒绝H0。
一 、单侧检验与双侧检验的概念
1.双侧检验(two-sided test)
H 0 : 0
H1 : 0
2.单侧检验(one-sided test)
H 0: 0 ① H 1: 0 H 0: 0 或 ② H 1: 0
二、单侧检验与双侧检验的关系
第六章 假设检验的 基本概念
一、Ⅰ型错误与Ⅱ型错误的概念
假设检验的结果 拒绝 H0 H0 成立 I 类错误() 不拒绝 H0 推断正确(1-) II 类错误()
客观实际
H0 不成立 H1 成立 推断正确(1-)
二、Ⅰ型错误与Ⅱ型错误的关系
图6-2 Ⅰ型错误与Ⅱ型错误示意图
三、假设检验的检验功效
• 检验功效或把握度(power of a test) 1-称为检验功效或把握度(power of a test), 是指当两总体参数确有差别时,按水准假 设检验能发现它们有差别的能力。即对真 实的作肯定结论之把握程度。 影响因素:
第五节 假设检验与区间估计的联系
• 假设检验与可信区间是从两个不同目的 出发并有密切关联的分析方法,假设检 验用于推断总体参数“质”的不同,而 可信区间用于说明总体参数“量”的大 小,两者即有区别又有联系。
1.可信区间可以回答假设检验的问题
如果可信区间包含H0,则按水准不拒绝H0; 如果可信区间不包含H0,则按水准拒绝H0。
一 、单侧检验与双侧检验的概念
1.双侧检验(two-sided test)
H 0 : 0
H1 : 0
2.单侧检验(one-sided test)
H 0: 0 ① H 1: 0 H 0: 0 或 ② H 1: 0
二、单侧检验与双侧检验的关系
假设检验的基本原理与一般步骤PPT课件( 61页)
H0称为原假设或 ,H1零 称假 为设 备择 . 假设 上述假设检验假 成设 为检 .双验 边
有时我们只关心总体均值是否增大或减小。 此时,我们需要检验假设: 右边检验: H0 : 0 , H1 : 0 . 左边检验: H0 : 0 , H1 : 0 . 右边检验和左边检验统称为单边检验。
再利用已知样本作出判断是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1).
如果作出的判断是接受H0, 则 0,
即认为机器工作是正常的, 否则, 认为是不正常的.
由于要检验的假设涉及总体均值, 故可借助于样本 均值来判断.
因为 X是的无偏估, 计量
所H 以 0为 ,若 则 真 |x0|不应 , 太大
一般来说,我们总是控制犯第Ⅰ类错误的概率, 使它不大于显著性水平,而不考虑犯第Ⅱ类错 误的概率的检验,称为显著性检验.
三、假设检验的一般步骤
1. 根据实际问 ,提题 出的 原 H 要 0假 及 求 设 备择 假设 H1;
2.选择适当的检,在 验H统 0成计 立量 的条, 件下 确定它的概; 率分布
然而由于作出决策的依据是一个样本,当实际
上 H0 为真时仍可能做出拒绝 H0 的决策,这是一
种错误,其概率记为
P{当 H0为真时拒绝 H0}
我们给定一个较小的数α (0< α < 1),使得 P{当 H0 为真时拒绝 H0 }≤α
取允许犯这类错误的概率最大为 α 即令
P
{当为真
时拒绝
}=
P
{
X-u0
又已 n9,知 0.0由 15 样 , 本x 算 0.得 511,
即有 x / n 0 2. 21.96,
于是拒绝假设H0, 认为包装机工作不正常.
有时我们只关心总体均值是否增大或减小。 此时,我们需要检验假设: 右边检验: H0 : 0 , H1 : 0 . 左边检验: H0 : 0 , H1 : 0 . 右边检验和左边检验统称为单边检验。
再利用已知样本作出判断是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1).
如果作出的判断是接受H0, 则 0,
即认为机器工作是正常的, 否则, 认为是不正常的.
由于要检验的假设涉及总体均值, 故可借助于样本 均值来判断.
因为 X是的无偏估, 计量
所H 以 0为 ,若 则 真 |x0|不应 , 太大
一般来说,我们总是控制犯第Ⅰ类错误的概率, 使它不大于显著性水平,而不考虑犯第Ⅱ类错 误的概率的检验,称为显著性检验.
三、假设检验的一般步骤
1. 根据实际问 ,提题 出的 原 H 要 0假 及 求 设 备择 假设 H1;
2.选择适当的检,在 验H统 0成计 立量 的条, 件下 确定它的概; 率分布
然而由于作出决策的依据是一个样本,当实际
上 H0 为真时仍可能做出拒绝 H0 的决策,这是一
种错误,其概率记为
P{当 H0为真时拒绝 H0}
我们给定一个较小的数α (0< α < 1),使得 P{当 H0 为真时拒绝 H0 }≤α
取允许犯这类错误的概率最大为 α 即令
P
{当为真
时拒绝
}=
P
{
X-u0
又已 n9,知 0.0由 15 样 , 本x 算 0.得 511,
即有 x / n 0 2. 21.96,
于是拒绝假设H0, 认为包装机工作不正常.
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验过程如下:
在实例中若取定 0.05, 则 k z z 1 . 96 , / 2 0 . 025
又已知 n 9 , 0.015, 由样本算得 x 0.511,
x 即有 0 2.2 1.96, / n
于是拒绝假设H0, 认为包装机工作不正常.
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原理, 作出接受还是拒绝H0的判断。由于样本具有随机 性,因而假设检验所作出的结论有可能是错误的 . 这种错误有两类: (1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第Ⅰ类错误, 又叫 ‘弃真’. 犯第一类错误的概率是显著性水平 .
三、假设检验的一般步骤
1 . 根据实际问题的要求 ,提出原假设 H 0及备择
假设 H ; 1 2 .选择适当的检验统计量 ,在 H 成立的条件下 , 0
确定它的概率分布 ; 3 . 给定显著性水平 , 确定拒绝域 W ; 1
4. 根据样本观察值计算统 计量的值 ;
μ 和 σ 分 别 表 示 这 一 天 袋 装 糖 重 分析: 用 总 体 X 的 均 值 和 标 准 差 ,
0 . 015 , 由长期实践可知, 标准差较稳定, 设
2 则 X ~ N ( ,0 . 015 ), 其中 未知 .
0.5 还是 0.5 . 问题: 根据样本值判断
(2) 当原假设H0不真, 而观察值却落入接受域, 而作出了接受H0的判断, 称做第Ⅱ类错误, 又叫 ‘取伪’. 当样本容量 n 一定时, 若减少犯第Ⅰ类错误的概 率, 则犯第Ⅱ类错误的概率往往增大.若要使犯 两类错误的概率都减小, 除非增加样概率, 使它不大于显著性水平,而不考虑犯第Ⅱ类错 误的概率的检验,称为显著性检验.
假设检验就是根据样本对所提出的假设作出判 断: 是接受, 还是拒绝. 下面结合实例来说明假设检验的基本思想.
引例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖重是一个随机变量, 它服从正态分布.当 机器正常时, 其均值为0.5公斤, 标准差为0.015 公斤.某日开工后为检验包装机是否正常, 随机 地抽取它所包装的糖9袋, 称得净重为(公斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
因为 X 是 的无偏估计量 ,
所以若 H 为真 , 则 | x | 不应太大 , 0 0 X 0 当 H 为真时 , ~ N ( 0 , 1 ), 0 /n |x | 0 衡量 |x | 的大小可归结为 的大 , 0 / n
于是可以选定一个适当的正数k,
x 0 当观察值 x 满足 k 时 ,拒绝假设 H , 0 /n x 0 反之 , 当观察值 x 满足 k 时 ,接受假 H . 0 /n
上例中所采取的检验法则是符合实际推断原理的 .
因通常 总是取得很小 , 一般取 0.01, 0.0
X 0 因而当 H0为真 ,即 0时 , z/ 2是一 / n 个小概率事件 , 几乎不会发生,现在在 一次试验中
竟然发生了,我们就有 理由怀疑假设的正确性 ,因 而拒绝假设 H0
X-u0 n k
X 0 因为当 H 为真时 Z ~ N ( 0 , 1 ), 0 /n 由标准正态分布分位点的定义得 k z / 2 ,
}= α
x μ x μ 0 0 当 z 时, 拒绝H , z 接受H . α /2 0 α 时, /2 0 σn / σn /
§1
假设检验
一、假设检验的基本原理 二、假设检验的相关概念
三、假设检验的一般步骤
一、假设检验的基本原理
在总体的分布函数完全未知或只知其形式、但不 知其参数的情况下, 为了推断总体的某些性质, 提 出某些关于总体的假设.
例如 , 提出总体服从泊松分布的假设 ; 又如 , 对于 正态总体提出数学期望等于 u0 的假设等.
提出两个对立假设H : 0 . 5 和 H : . 0 0 1 0 再利用已知样本作出判断是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判断是接受H0, 则 , 0 即认为机器工作是正常的, 否则, 认为是不正常的.
由于要检验的假设涉及总体均值, 故可借助于样本 均值来判断.
在假设检验中,数 称为显著性水平 .
二、假设检验的相关概念
1. 原假设与备择假设
下 , 上例假设检验问题通常叙述为: 在显著性水平
检验假设 H : , H : . 0 0 1 0
上述假设检验成为双边 假设检验 .
H 称为原假设或零假设 ,H . 0 1 称为备择假设
有时我们只关心总体均值是否增大或减小。 此时,我们需要检验假设: 右边检验: H0 : 0 , H1 : 0 . 左边检验: H0 : 0 , H1 : 0 .
然而由于作出决策的依据是一个样本, 当实际 上 H 0 为真时仍可能做出拒绝 H 0 的决策, 这是一 种错误,其概率记为 P{当 H 为真时拒绝 H }
0 0
我们给定一个较小的数 α (0< α < 1 ) ,使得 P{当 H 0 为真时拒绝 H 0 }≤α 取允许犯这类错误的概率最大为 α 即令 P{当为真时拒绝} = P{
右边检验和左边检验统称为单边检验。
2. 拒绝域与临界点
当检验统计量取某个区域 W 1 中的值时,我们 拒绝原假设H0,则称区域 W 1 为拒绝域, 拒绝域 的边界点称为临界点. 如在前面实例中, 检验统计量为
X 0 Z / n
拒绝域为 |z | z , /2
临界点为 z 及 z . /2 /2