04第三章 假设检验的基本原理和步骤(研1309)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
法庭上,陪审团需要建立以下两种 假设:
无罪
有罪
事先并不知道哪种假设是正确的, 需要根据呈庭证供,才可下结论
4
胎儿的性别
有人声称能够预测胎儿的性 别,我们对此有两种假设:
无此能力 有此能力
事先并不知道哪种假设是正 确的,需要根据她推测的结果, 才可下结论
5
商家信誉
某商家宣称他所卖的鸡蛋绝对新鲜,可 以达到“百里挑一”;是否可以相信商 家信誉?
t 临界值
已知总N(体 ,2)
双侧检验:用于推断两总体有无差别时,对两总体 间可能存在的两种位置关系均要考虑在内。
25
问:从事铅作业男性工人Hb是否高于正常成年
男性?பைடு நூலகம்
①
拒绝域
1 -a
接受域
a
t 临界值
已知总N(体 ,2)
2. 单侧检验:用于推断两总体有无差别时,仅考虑 两总体间可能存在的两种位置关系的一种。
26
单侧、双侧检验的确定原则及描述方法:
一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值,
如 0(双侧,包括 0和 < 0 两方面)
如果从专业上能肯定其中一侧是不可能的,则 采用单侧对立假设 H1: <某一数值;如 < 0 (左单侧) H1: 某一数值;如 0 (右单侧)
假设检验中的 P 值
假设检验中的 P 值
:所谓P 值,由H0所规定的总体中作一 次随机抽样,获得依据现有样本获得的
检验统计量的概率,也即是H0成立的概 率。
换言之,是指在H0 成立的前提下,出 现统计量目前值及更不利于零假设数值
的概率。
P >α
P≤α
-t 界值
P≤α
t 界值
t分布
19
假设检验 (hypothesis test) 的概念: 亦称显著性检验
应根据研究目的、设计类型和资料特点等因素选择 合适的检验方法,并计算出对应统计量。
数值变量
变量
分类变量
单样本资料 配对设计资料 两、多组独立样本资料
24
3. 根据数据特征和专业知识,确定单、双侧
问:从事铅作业男性工人Hb与正常成年男性是否不同?
①
拒绝域
拒绝域
②
1 -a
a/2
接受域
a/2
- t 临界值
11
样本均数与拟比较的总体均数不等有两种可能:
第一种可能性:
抽样误差
n=36
已知总体 0 14g0/L
第二种可能性:
X 13.80g3/L
本质差异-职业的影响
未知总体 =? 12
解析:(1)抽样误差 (2)环境因素
上述两种可能是对立的,互不相容的, 事实上只能是其中的一个,如何进行判断 呢?我们可通过假设检验来回答这个问题。
设
n 100
H1:备择假设
X 130.83 n 100
0 140
0, N(,2)
验
证 假
预设 α =0.05
设
a/2
t样本
X
X
a/2
检验统计量
-t 界值
t 界值
下
t 分布图
P值
结
论 根据P 值,得出结论 17
假设检验的小概率事件原则和检验水准 α
小概率事件(0.05 or 0.01)
商家有信誉
商家无信誉
事先并不知道哪种假设是正确的,需要 对其鸡蛋检验后,才可下结论
6
?
肯定
× 否定
7
胎儿性别—统计学的思维方式
女士说她可以预测胎儿的性别
暂时认为她是瞎猜,每个孕妇被猜对的可能 性均为50%
让她对10个孕妇作推断,结果是全部说对了; 在瞎猜的情况下,全对的可能性为 0.510=0.000976563
(significance test),是依据样本提供的有限信息对总体作 推断的统计学方法,是在对研究总体的两种对立的判断
之间做选择的决策程序。
提出假设
验证假设
得出结论
对总体的参数 或分布作出某
种假设
选用适当方法根 据样本对总体提 供的信息作检验
推断此假设 应当拒绝或
不拒绝
20
假设检验的步骤
21
建立假设,确定检验水准 计算检验统计量 确定P值
• 但是对于该顾客而言,他仅仅购买了一 次,就碰上了小概率事件,所以商家的 信誉度值得怀疑
9
假设检验
先 对 总 体 的 参 数 提 出 某 种 假 设,然后利用样本信息判断是 否拒绝该假设过程
反证法 + 小概率事件原理
10
【例3-5】某医生测量了100名从事铅 作业男性工人的血红蛋白含量,算 得其均数为130.83g/L,标准差为 25.74g/L。问从事铅作业工人的血 红蛋白是否不同于正常成年男性平 均值140g/L?
13
假设检验的基本思想
14
学术上:唯证据原则—反证法
刑事诉讼
无罪假设
找证据
统计推断
无差异假设
作检验
15
基本思路:
首先假定该样本来自的总体就是已知总体,
即=0,然后根据样本统计量的特征,找出 它取样于或不取样于总体0的证据, 从而
取得间接的判断。
16
建
H0:零假设
立
假
X 130.83
在一次试验中出现小概率事件是不太可能的, 故认为她真的有这种能力!
8
关于商家信誉
• 某商家宣称他所卖的鸡蛋绝对新鲜,可 以达到“百里挑一”;结果有人买了10 个鸡蛋,其中2个坏了,是否还可以相 信商家广告?
• 暂时认为商家是有信誉的,在此前提下 10个鸡蛋中出现2个或更多变质的可能 性为0.004,是小概率事件!
检验水准 — α (level of test)
:假设检验中,定义发生概率≤ α的 事件叫小概率事件,并称α为检验水 准,一般α取0.05。
故对于H0 为真而言,检验统计量
超过α对应的临界值的概率P≤α,对
于一次随机抽样而言,一般是不会发 生的,所以如果出现这种情况,可以 凭此作出拒绝H0的决策。
18
P≤α
作推断结论
P >α
拒绝H0,接受H1,
不拒绝H0,
认为差异有统计学意义 认为差异无统计学意义
22
一、 对立假设、确定检验水准: 1.建立假设H0、H1 2. 确定检验水准α 3.根据实际情况、确定单、双侧检验 4.根据资料类型,选择检验方法;
23
1. 明确资料类型、选择检验方法:
假设检验的方法很多,如t 检验、F 检验及 2 检验等, 各有其适用条件和范围。
第三章 总体均数的 估计与假设检验
何保昌 福建医科大学流行病与卫生统计学系
1
教学内容:
第一节 均数的抽样误差与标准误 第二节 t分布 第三节 总体均数估计 第四节 假设检验基本原理与步骤 第五节 t检验 第六节 假设检验的注意事项 第七节 正态性与方差齐性检验
2
假设检验的基本 原理和步骤
3
法官的判决
无罪
有罪
事先并不知道哪种假设是正确的, 需要根据呈庭证供,才可下结论
4
胎儿的性别
有人声称能够预测胎儿的性 别,我们对此有两种假设:
无此能力 有此能力
事先并不知道哪种假设是正 确的,需要根据她推测的结果, 才可下结论
5
商家信誉
某商家宣称他所卖的鸡蛋绝对新鲜,可 以达到“百里挑一”;是否可以相信商 家信誉?
t 临界值
已知总N(体 ,2)
双侧检验:用于推断两总体有无差别时,对两总体 间可能存在的两种位置关系均要考虑在内。
25
问:从事铅作业男性工人Hb是否高于正常成年
男性?பைடு நூலகம்
①
拒绝域
1 -a
接受域
a
t 临界值
已知总N(体 ,2)
2. 单侧检验:用于推断两总体有无差别时,仅考虑 两总体间可能存在的两种位置关系的一种。
26
单侧、双侧检验的确定原则及描述方法:
一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值,
如 0(双侧,包括 0和 < 0 两方面)
如果从专业上能肯定其中一侧是不可能的,则 采用单侧对立假设 H1: <某一数值;如 < 0 (左单侧) H1: 某一数值;如 0 (右单侧)
假设检验中的 P 值
假设检验中的 P 值
:所谓P 值,由H0所规定的总体中作一 次随机抽样,获得依据现有样本获得的
检验统计量的概率,也即是H0成立的概 率。
换言之,是指在H0 成立的前提下,出 现统计量目前值及更不利于零假设数值
的概率。
P >α
P≤α
-t 界值
P≤α
t 界值
t分布
19
假设检验 (hypothesis test) 的概念: 亦称显著性检验
应根据研究目的、设计类型和资料特点等因素选择 合适的检验方法,并计算出对应统计量。
数值变量
变量
分类变量
单样本资料 配对设计资料 两、多组独立样本资料
24
3. 根据数据特征和专业知识,确定单、双侧
问:从事铅作业男性工人Hb与正常成年男性是否不同?
①
拒绝域
拒绝域
②
1 -a
a/2
接受域
a/2
- t 临界值
11
样本均数与拟比较的总体均数不等有两种可能:
第一种可能性:
抽样误差
n=36
已知总体 0 14g0/L
第二种可能性:
X 13.80g3/L
本质差异-职业的影响
未知总体 =? 12
解析:(1)抽样误差 (2)环境因素
上述两种可能是对立的,互不相容的, 事实上只能是其中的一个,如何进行判断 呢?我们可通过假设检验来回答这个问题。
设
n 100
H1:备择假设
X 130.83 n 100
0 140
0, N(,2)
验
证 假
预设 α =0.05
设
a/2
t样本
X
X
a/2
检验统计量
-t 界值
t 界值
下
t 分布图
P值
结
论 根据P 值,得出结论 17
假设检验的小概率事件原则和检验水准 α
小概率事件(0.05 or 0.01)
商家有信誉
商家无信誉
事先并不知道哪种假设是正确的,需要 对其鸡蛋检验后,才可下结论
6
?
肯定
× 否定
7
胎儿性别—统计学的思维方式
女士说她可以预测胎儿的性别
暂时认为她是瞎猜,每个孕妇被猜对的可能 性均为50%
让她对10个孕妇作推断,结果是全部说对了; 在瞎猜的情况下,全对的可能性为 0.510=0.000976563
(significance test),是依据样本提供的有限信息对总体作 推断的统计学方法,是在对研究总体的两种对立的判断
之间做选择的决策程序。
提出假设
验证假设
得出结论
对总体的参数 或分布作出某
种假设
选用适当方法根 据样本对总体提 供的信息作检验
推断此假设 应当拒绝或
不拒绝
20
假设检验的步骤
21
建立假设,确定检验水准 计算检验统计量 确定P值
• 但是对于该顾客而言,他仅仅购买了一 次,就碰上了小概率事件,所以商家的 信誉度值得怀疑
9
假设检验
先 对 总 体 的 参 数 提 出 某 种 假 设,然后利用样本信息判断是 否拒绝该假设过程
反证法 + 小概率事件原理
10
【例3-5】某医生测量了100名从事铅 作业男性工人的血红蛋白含量,算 得其均数为130.83g/L,标准差为 25.74g/L。问从事铅作业工人的血 红蛋白是否不同于正常成年男性平 均值140g/L?
13
假设检验的基本思想
14
学术上:唯证据原则—反证法
刑事诉讼
无罪假设
找证据
统计推断
无差异假设
作检验
15
基本思路:
首先假定该样本来自的总体就是已知总体,
即=0,然后根据样本统计量的特征,找出 它取样于或不取样于总体0的证据, 从而
取得间接的判断。
16
建
H0:零假设
立
假
X 130.83
在一次试验中出现小概率事件是不太可能的, 故认为她真的有这种能力!
8
关于商家信誉
• 某商家宣称他所卖的鸡蛋绝对新鲜,可 以达到“百里挑一”;结果有人买了10 个鸡蛋,其中2个坏了,是否还可以相 信商家广告?
• 暂时认为商家是有信誉的,在此前提下 10个鸡蛋中出现2个或更多变质的可能 性为0.004,是小概率事件!
检验水准 — α (level of test)
:假设检验中,定义发生概率≤ α的 事件叫小概率事件,并称α为检验水 准,一般α取0.05。
故对于H0 为真而言,检验统计量
超过α对应的临界值的概率P≤α,对
于一次随机抽样而言,一般是不会发 生的,所以如果出现这种情况,可以 凭此作出拒绝H0的决策。
18
P≤α
作推断结论
P >α
拒绝H0,接受H1,
不拒绝H0,
认为差异有统计学意义 认为差异无统计学意义
22
一、 对立假设、确定检验水准: 1.建立假设H0、H1 2. 确定检验水准α 3.根据实际情况、确定单、双侧检验 4.根据资料类型,选择检验方法;
23
1. 明确资料类型、选择检验方法:
假设检验的方法很多,如t 检验、F 检验及 2 检验等, 各有其适用条件和范围。
第三章 总体均数的 估计与假设检验
何保昌 福建医科大学流行病与卫生统计学系
1
教学内容:
第一节 均数的抽样误差与标准误 第二节 t分布 第三节 总体均数估计 第四节 假设检验基本原理与步骤 第五节 t检验 第六节 假设检验的注意事项 第七节 正态性与方差齐性检验
2
假设检验的基本 原理和步骤
3
法官的判决