04-第三章 假设检验的基本原理和步骤(研1309)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 总体均数的 估计与假设检验
何保昌 福建医科大学流行病与卫生统计学系
1
教学内容:
第一节 均数的抽样误差与标准误 第二节 t分布 第三节 总体均数估计 第四节 假设检验基本原理与步骤 第五节 t检验 第六节 假设检验的注意事项 第七节 正态性与方差齐性检验
2
假设检验的基本 原理和步骤
3
法官的判决
小概率事件(0.05 or 0.01) 检验水准 — α (level of test)
:假设检验中,定义发生概率≤ α的 事件叫小概率事件,并称α为检验水 准,一般α取0.05。 故对于H0 为真而言,检验统计量 超过α对应的临界值的概率P≤α,对 于一次随机抽样而言,一般是不会发 生的,所以如果出现这种情况,可以 凭此作出拒绝H0的决策。

a
t 临界值 已知总体N ( , 2 )
2. 单侧检验:用于推断两总体有无差别时,仅考虑
两总体间可能存在的两种位置关系的一种。
26
单侧、双侧检验的确定原则及描述方法:
一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值, 如 0(双侧,包括 0和 < 0 两方面)
H 0 : 140g / L( 0) H 1 : 140g / L( 0) a=0.05双侧 u X 0 130.83 140 3.562549; / n 25.74 / 100
3. 确定 p 值,作出推断结论:
统计结论:已知 U(0.05/2)=1.96,则 P <0.05 ,故拒绝H0,接
如果从专业上能肯定其中一侧是不可能的,则 采用单侧对立假设
H1: <某一数值;如 < 0 (左单侧)
H1: 某一数值;如 0 (右单侧)
27
单侧、双侧检验的确定原则及描述方法:
一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值, 如 0(双侧,包括 0和 < 0 两方面)
18
假设检验中的 P 值
假设检验中的 P 值 :所谓P 值,由H0所规定的总体中作一
次随机抽样,获得依据现有样本获得的 检验统计量的概率,也即是H0成立的概 率。 换言之,是指在H0 成立的前提下,出 现统计量目前值及更不利于零假设数值 的概率。
P >α
P≤α
-t 界值 t 界值
P≤α
t分布
19
假设检验 (hypothesis test) 的概念: 亦称显著性检验
31
二、 计算检验统计量:
检验统计量:属于样本指标,用来反应样 本信息,用于计算“H0 成立”的概率P, 从而抉择是否要拒绝H0。
32
各检验方法都有其相应的检验统计量,不同的
检验统计量通常都依据于其特定的抽样分布。 举例:
数值 变量
1. 单样本、配对、两样本资料(来自正态分 布总体) → t /u检验 (t 值) → t /u分布
如果从专业上能肯定其中一侧是不可能的,则 采用单侧对立假设
H1: <某一数值;如 < 0 (左单侧)
H1: 某一数值;如 0 (右单侧)
28
3. 建立假设:提出无效假设和备择假设
什么是零假设 (Null Hypothesis) ?
(1)一般是作没有差别的假设,又称“原假设”或 “无效假设” ,表示为 H0,即 H0: = 某一数值,如 = 0 (2) 该假设将差异的原因归结为抽样误差
9
假设检验
先对总体的参数提出某种假 设,然后利用样本信息判断是 否拒绝该假设过程 反证法 + 小概率事件原理
10
百度文库
【例3-5】某医生测量了100名从事铅
作业男性工人的血红蛋白含量,算 得其均数为130.83g/L,标准差为 25.74g/L。问从事铅作业工人的血 红蛋白是否不同于正常成年男性平 均值140g/L?
问:从事铅作业男性工人Hb与正常成年男性是否不同?

拒绝域
1-a 接受域
拒绝域

a/2
a/2
t 临界值
- t 临界值
已知总体N ( , 2 )
双侧检验:用于推断两总体有无差别时,对两总体
间可能存在的两种位置关系均要考虑在内。
25
问:从事铅作业男性工人Hb是否高于正常成年 男性?
1-a 接受域 拒绝域
受 H1 ,认为 X 与μ 0的差别有统计学意义. 专业结论:可认为从事铅作业男性工人的血红蛋白含量与 正常成年男性不同。
42
【案例2】
某药物100mg溶解在1L溶剂中,溶解后的标准浓
度是20.00mg/L。现采用某种测定方法进行溶解实验, 重复实验11次获得的药物浓度分别为:20.99、20.41、 20.10、…、21.11。 请问:用该种方法测得的药物浓度与标准浓度 20.0mg/l是否相同?
建立假设,确定检验水准
计算检验统计量
确定P值
作推断结论
P≤α
拒绝H0,接受H1, 认为差异有统计学意义
P >α
不拒绝H0, 认为差异无统计学意义
22
一、 对立假设、确定检验水准:
1.建立假设H0、H1 2. 确定检验水准α 3.根据实际情况、确定单、双侧检验 4.根据资料类型,选择检验方法;
23
确定检验水平: a=0.05双侧
X 0 20.98364 20 3.056; 11 1 10 2. 计算检验统计量:t S / n 1.06753 / 11
3. 确定 p 值,作出推断结论: 统计结论:查t 界值表,得t (0.05/2,10) =2.228,按α=0.05 检 验水准,拒绝H0,接受H1;认为这种方法测得的药物浓度 与标准浓度不同。 专业结论:该方法测得的药物总体平均浓度高于标准,该 方法的效果欠佳。
13
假设检验的基本思想
14
学术上:唯证据原则—反证法
刑事诉讼
无罪假设
找证据
统计推断
无差异假设
作检验
15
基本思路:
首先假定该样本来自的总体就是已知总体,
即=0,然后根据样本统计量的特征,找出
它取样于或不取样于总体0的证据, 从而
取得间接的判断。
16
建 立 假 设
H0:零假设
X 130 .83 n 100
11
样本均数与拟比较的总体均数不等有两种可能:
第一种可能性:
抽样误差
已知总体 0 140 g / L
n=36
第二种可能性:
X 130 .83g / L 本质差异-职业的影响
未知总体 =?
12
解析:(1)抽样误差 (2)环境因素 上述两种可能是对立的,互不相容的, 事实上只能是其中的一个,如何进行判断 呢?我们可通过假设检验来回答这个问题。
商家有信誉 商家无信誉
事先并不知道哪种假设是正确的,需要 对其鸡蛋检验后,才可下结论
6

肯定
否定
×
7
胎儿性别—统计学的思维方式
女士说她可以预测胎儿的性别
暂时认为她是瞎猜,每个孕妇被猜对的可能 性均为50% 让她对10个孕妇作推断,结果是全部说对了; 在瞎猜的情况下,全对的可能性为 0.510=0.000976563
在一次试验中出现小概率事件是不太可能的, 故认为她真的有这种能力!
8
关于商家信誉
• 某商家宣称他所卖的鸡蛋绝对新鲜,可 以达到“百里挑一”;结果有人买了10 个鸡蛋,其中2个坏了,是否还可以相 信商家广告? • 暂时认为商家是有信誉的,在此前提下 10个鸡蛋中出现2个或更多变质的可能 性为0.004,是小概率事件! • 但是对于该顾客而言,他仅仅购买了一 次,就碰上了小概率事件,所以商家的 信誉度值得怀疑
40
【案例解析】
资料类型:定量资料 设计类型:单样本
1. 首先考虑对原始数据进行正态性检验: 结果表明,该样本所属总体来自正态分布。 2. 再者σ已知,故考虑用 u 检验。
3. u 检验统计量:
u
X 0 / n
41
检验过程:
1. 建立假设: 确定检验水平: 2. 计算检验统计量:
②或 σ 未知但 n 较大(如n>60)
u 检验
σ未知,n较小(n<60),且 样本来自正态分布的总体
样本例数 n<60且样 本来自偏态分布总体
t 检验 变量变换 或秩和检验
39
【例3-5】某医生测量了100名从事
铅作业男性工人的血红蛋白含量, 算得其均数为130.83g/L,标准差 为25.74g/L。问从事铅作业工人的 血红蛋白是否不同于正常成年男 性平均值140g/L?
43
【案例解析】
资料类型:定量资料 设计类型:单样本
首先考虑对原始数据进行正态性检验:结果表明, 该样本所属总体来自正态分布。 另外总体σ未知,样本含量 n =11较小,所以考虑 用 t 检验。
X 0 t的检验统计量为: t S/ n
44
检验过程:
1. 建立假设:
H 0 : 20.00mg/L ( 0) H 1 : 20.00mg/L ( 0)
34
四 、做出推断结论
指对 “ 假设的H0 是否真实” 作出判断的 过程。即:比较 p 值和检验水准a,得出拒绝 或不拒绝无效假设的结论。
35
在两个对立的检验假设间二取一的规则是:
(1)若 P ≤ a,意味着在H0成立的前提下不大可能发生当
前,或是更不利的状况 拒绝 不拒绝 (2)若 P >a,意味着在H0成立的前提下,发生当前状 况或是更不利的状况的可能性还是比较大的
2. 多组样本资料→ 方差分析(F 值) → F分布
3. 方差齐性检验→ F 值 → F分布
变 量
分类变量
2 → c 分布 c 检验(c 值) 2 2
33
三 、确定 p 值
P 值意义是:由 H0所规定的总体中作随机抽样,
获得依据现有样本获得的检验统计量的概率,也即 是H0成立的概率。 换言之,在H0成立的前提下,统计量获得现有 数值以及更不利于H0的可能性(概率)有多大。
H1:备择假设
X 130 .83 n 100
0 140
0,N ( , 2 )
验 证 预设 α =0.05 假 a/2 设
-t 界值
t 样本
a/2
X
X
检验统计量
t 界值
下 结 论
t 分布图
P值
根据P 值,得出结论
17
假设检验的小概率事件原则和检验水准 α
1. 明确资料类型、选择检验方法:
2
假设检验的方法很多,如t 检验、F 检验及 c 检验等, 各有其适用条件和范围。 应根据研究目的、设计类型和资料特点等因素选择 合适的检验方法,并计算出对应统计量。
数值变量
单样本资料
变量
分类变量
配对设计资料
两、多组独立样本资料
24
3. 根据数据特征和专业知识,确定单、双侧
29
什么是备择假设 (Alternative Hypothesis) ?
(1)与无效假设相对立有差别的假设, 由不等号 ,< 或 组成,常表示为 H1;即
H1: 某一数值;或 <某一数值, 某一数值。
(2) 该假设将差异的原因归结为环境因素,或是一
种本质差异。
30
4. 确定检验水准 a
(significance test),是依据样本提供的有限信息对总体作 推断的统计学方法,是在对研究总体的两种对立的判断
之间做选择的决策程序。
提出假设
验证假设
得出结论
对总体的参数 或分布作出某 种假设
选用适当方法根 据样本对总体提 供的信息作检验
推断此假设 应当拒绝或 不拒绝
20
假设检验的步骤
21
又称显著性水准,是判断应当拒绝或不拒绝H0 的 水准。它规定什么是“不大可能”,规定概率不超过 的事件就是小概率事件,依据的是 “小概率事件在 一次随机试验中不大可能发生”的理论。
注意:
由研究者事先确定。
表示为 a,常用的 a 值有0.01、0.05;
是一个概率值,假设原假设为真时,拒绝原假设的 概率,又被称为抽样分布的拒绝域。
t=
2.5% 95%
X
SX
2.5%
t 分布图
t 临界值
36
建立假设,确定检验水准
计算检验统计量
确定P值
作推断结论
P≤α
拒绝H0,接受H1, 认为差异有统计学意义
P >α
不拒绝H0, 认为差异无统计学意义
37
假设检验例子
38
单样本定量资料要依据不同的前题条件选择适当 的假设检验方法。
①总体标准差σ已知时
法庭上,陪审团需要建立以下两种 假设:
无罪
有罪
事先并不知道哪种假设是正确的, 需要根据呈庭证供,才可下结论
4
胎儿的性别
有人声称能够预测胎儿的性 别,我们对此有两种假设:
无此能力
有此能力
事先并不知道哪种假设是正 确的,需要根据她推测的结果, 才可下结论
5
商家信誉
某商家宣称他所卖的鸡蛋绝对新鲜,可 以达到“百里挑一”;是否可以相信商 家信誉?
相关文档
最新文档