第六章假设检验基础-厦门大学研究生院.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实际应用中,往往通过α去控制β;在样本量确定时, 如果要减小β,就把α取大一些。
3. 假设检验的功效
1-β称为假设检验的功效(power of a test)。 反映H0不真时,假设检验能检验出H0不真的能力。
如果1-β=0.90,则意味着当H0不成立时,理论上在每 100次抽样中,在α的检验水准上平均有90次能拒绝H0。
在假设检验中,不论做出哪一种推断结论,都有可能发 生错误-----假设检验的两类错误。
1. 第一类错wk.baidu.com(弃真错误)
拒绝了实际上存在的H0
第一类错误的概率为α
2. 第二类错误(存伪错误)
不拒绝实际上不存在的H0 第二类错误的概率为β
实际情况 决策 H0为真 接受H0 拒绝H0 1-α 第一类错误(α) H0为假 第二类错误(β) 功效(1-β)
例如,属于配对设计的资料不宜应用两独立样本 的t 检验。
每一种假设检验方法都有相应的适用条件。
要权衡两类错误的危害来确定α的大小。
例如,新药优越性研究:希望拒绝H0。犯第Ⅰ类错 误意味着可能过高评价疗效一般的新药,淘汰比较 成熟的常规药物。应将α取得小一些。 又如,代用品与常规药品等价性研究:希望不拒绝 H0。犯第Ⅱ类错误意味着可能轻易接受代用品。应 将β取得小一些。
查Z 界值表,得P<0.001,按α=0.05水准拒绝H0,接受H1,可 以认为经常参加体育锻炼的中学男生人群的心率不同于一般 中学男生。
例5-2 某药物100mg在某溶剂1L中溶解后的标准浓度为 20mg/L。现采用某种测定方法进行溶解实验:把100mg 的这种药物溶解在1L的该溶剂中,在充分溶解后测定其 药物浓度。由于药物溶解实验的测量存在随机误差,故 定义用这种测定方法大量重复溶解实验所得到的平均浓 度为这个药物100mg在某溶剂1L中溶解后的药物总体平 均浓度。研究者把这个药物溶解实验重复11次,每次实 验将这个药物100mg溶解在1L的该溶剂中,测量后得到 的结果如下:
抽样误差导致
X ≠μ0
μ ≠μ0
X
本质不同
一、假设检验的基本思想
假设检验的思维逻辑
1. 坏蛋率问题
某商家宣称他的 “坏(变质)蛋率为1%”。 欲判断:坏蛋率为1% ?
还是
坏蛋率高于1%?
一个个打碎看是否坏蛋?
随机抽样,从样本推断总体!
随机抽取4个作检查: 3个“好蛋”,1个“坏蛋”。
怀疑:样本率0.25与0.01之间的差异是由抽样误差 引起的还是总体率确实大于0.01? 思维逻辑:
α常取为0.05或0.01等。 α的意义:如果原假设H0成立,重复抽样100次, 检验结论中平均有100 α 次拒绝H0(犯第Ⅰ类
错误)。
β的意义:如果H0并不成立,H1成立,重复抽样 100次,检验结论中平均有100β次不拒绝H0
(犯第Ⅱ类错误)。
样本容量n一定时, α越小β越大;α越大β越小。
目的 双侧检验
是否μ ≠μ0
H0
HI
μ=μ0
μ ≠μ0
μ < μ0 μ > μ0
单侧检验
是否μ < μ0 μ=μ0 是否μ > μ0
μ=μ0
(二)选择检验方法和计算检验统计量
根据资料的类型和分析目的确定相应的检验统 计量。
(三)根据检验统计量的结果作出统计推断;
根据检验统计量的分布特征应用查表法或者统计 软件得出在零假设的前提下,出现目前样本数据 对应的统计量数值乃至比它更极端数值的概率P值; 如果P ≤α,则结论为:按所取的检验水准拒绝H0, 接受H1,认为差异有统计学意义;
3.056, n -1 10
t
20.984 20 1.068 / 11
确定P值,作出推断结论
据v =10,查t 界值表,得0.01<P<0.02,按α=0.05水准拒绝 H0,接受H1,可以认为该法测量的药物总体浓度不同于 标准浓度。
(三)单组样本频率的假设检验
直接概率法(累积概率密度)
正确理解P值的意义。
拒绝H0只是说差异不为零,不要把很小的P值误解为总 体参数间差异很大。 P值小只是说犯第Ⅰ类错误的机会 远小于α。 P<α, 宜说差异“有统计学意义”(statistical significance), 同时写明P的数值或相应的不等式。 将P<0.05说成“差异显著”,将P<0.01说成“差异非常 显著”都是不对的。英文significance 并不含有“显著” 之意。
例5-1 一般中学男生的心率平均值为75次/min, 标准差5.0次/min。通过抽样调查,获得经常参加 体育锻炼的某中学100名男生的心率平均值为 65次/min,问经常参加体育锻炼的中学男生心率 是否与一般中学男生不同?
X 65次 / min ,0 75次 / min
X
μ = μ0
(一)建立假设,确定检验水准
建立假设:
零假设
H0: μ=μ0 ,即 和 X μ0的差异是由抽样误差引起的。
备择假设
双侧 H1: μ≠μ0 ,即 样误差引起的。 单侧 H1: μ>μ0 (μ<μ0)
X 和 μ0 的差异不仅仅是由抽
确定检验水准
α=0.05 (即以0.05为小概率事件的标准)。
样本量不很大,可以直接计算概率
正态近似法( Z 检验 )
满足正态近似的条件:n 较大、π 和1-π 均不太小, 如nπ 和n (1-π) 均大于5时。
1.直接概率法
例3-9 设在人群中感染某种疾病的概率为20%,现有 疫苗A,用该疫苗注射了15人后有1人感染该病。问疫 苗A对该病有无预防作用? 解析:若疫苗A无效,则注射该疫苗后,疾病的感染 率应仍为20%,若有效,则感染率应小于20%。
医学研究中的统计工作 研 究 设 计
统计推断的 重要内容
数 据 搜 集
数 据 整 理
统 计 分 析
结 果 报 告
统计推断 假设检验
统计描述
参数估计
假设检验
假设检验
假设检验的基本思想; 假设检验的步骤; 单组样本资料的假设检验; 假设检验的两类错误; 结果报告; 案例辨析; 电脑试验; 常见疑问与小结。
如果P >α ,则结论为:按所取的检验水准不拒绝 H0,尚不能认为差异有统计学意义。
二 、 假 设 检 验 步 骤
建立检验假设,确定检验水准
计算检验统计量
P≤α
确定p值 作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
三、单组样本资料的假设检验
样本来自正态总体,且
总体标准差σ已知——Z 检验;
本例
Z
0.2333 0.17 0.17(1 0.17) / 150
2.064
确定P值,作出推断结论
本检验为右侧检验,查 t 界值表,得0.01<P<0.025,按 α=0.05水准拒绝H0,接受H1,可以认为传染科工作人员乙 肝总体阳性率高于一般人群的阳性感染率。
四、假设检验的两类错误
确定P 值,作出推断结论
由P=0.1671<0.05,按α=0.05水准不拒绝H0,尚不能认 为疫苗A对该病有预防作用。
2.正态近似法
例5-3 某地区随机抽取传染科工作人员150名作关于 乙型肝炎的血清学检查,其中阳性者共35名。已知 当地一般人群中的阳性概率为17%,问当地传染科 工作人员的阳性概率是否高于一般人群的阳性概率?
假定差异是由抽样误差引起的,
在“坏蛋率为1%”的前提下, 4个鸡蛋中出现1个或 更多坏蛋的概率为0.039 ; 如果定义0.05为小概率事件的标准,那么在“坏蛋率 为1%”的前提下,目前的情况“不(大)可能”发生; 不可能发生的事件居然发生了, 前提不对!
这样推断也可能出错, 因为在“坏蛋率为1%”的前提下, 毕竟还有3.9%的可能真的出现4个鸡蛋有1个甚至更多 坏蛋的情形 ----- 冒了第一类错误的风险
假设检验的思维逻辑
提出一个假设(H0); 如果假设成立,会得到现在的结果吗?
两种:
1)
得到现在的结果可能性很小(小概率)
拒绝H0
2)
得到现在的结果可能不小(不是小概率)
没有理由拒绝H0
二、假设检验的步骤
建立检验假设,确定检验水准; 选择检验方法和计算检验统计量;
根据检验统计量的结果作出统计推断。
建立检验假设并确定检验水准
H0:π=0.2
H1:π<0.2
α=0.05
该数据为二项分布数据,可采用直接概率法进行计算;
在H0成立的前提下,出现1人以及1人以下感染该病的 概率为:
0 1 P ( X 1) C15 0.20 (1 0.2)15 C15 0.21 (1 0.2)151 0.1671
20.99,20.41,20.10,20.00,20.91,22.41,20.00,23.00,22.00,19.89,21.11
请问:用这种测定方法所获的药物总体平均浓度是否与标 准浓度值相同?
解析:已知μ0=20mg/L,样本例数n=11,样本均 数 X 20.984mg / L ,样本标准差 S 1.068 mg/L;
Z
X 0
/ n
X 0 S/ n
N (0,1)
总体标准差σ未知——t 检验;
t
t ( n 1)
样本来自非正态总体,且
满足正态近似的条件—Z 检验 不满足正态近似的条件—非参数检验
(一)单组样本均数的Z 检验
例5-1 一般中学男生的心率平均值为75次/min,标准差 5.0次/min。通过抽样调查,获得经常参加体育锻炼的某 中学100名男生的心率平均值为65次/min,问经常参加体 育锻炼的中学男生心率是否与一般中学男生不同? 解析:一个总体: N(μ,5.02),检验μ是否不同于75次/min。
教学目的
理解假设检验的基本思维过程; 熟悉假设检验的基本步骤; 掌握单组样本资料z 检验的使用条件和方法; 掌握单组样本资料t 检验的使用条件和方法; 掌握单组样本频率的假设检验; 熟悉假设检验与区间估计的关系、假设检验的两类 错误和检验功效; 掌握SPSS计算结果的解释; 了解统计内容的报告与中英文表达。
建立检验假设并确定检验水准 H0:μ=75次/min H1:μ≠ 75次/min α=0.05
(一)单组样本均数的Z 检验
样本来自正态总体,且总体标准差已知,采用Z 检验;
在H0 成立的前提下,
Z
本例
X 0
/ n
N (0,1)
20
Z
65 75 5.0 / 100
确定P 值,作出推断结论
也越大,检验功效越大。
4. 检验功效的影响因素 以单组样本资料Z 检验为例分析
Z
X 0
/ n
检验水准a (即Ⅰ类错误的概率)定得越大,检验功效越 大
a越大,则Z a 越小,P (
X 0
/ n
Z) 也越大,检验功效越大。
应用假设检验需要注意的问题
每一种假设检验方法都是与相应的研究设计 相联系的。
X 0 X 0 Z) σ越小,则 Z 越大, P ( / n / n
也越大,检验功效越大。
4. 检验功效的影响因素
以单组样本资料Z 检验为例分析
Z X 0
/ n
样本含量越大,检验功效越大
n越大,则
Z
X 0
/ n
越大,P (
X 0
/ n
Z)
4. 检验功效的影响因素
以单组样本资料Z 检验为例分析
Z X 0
/ n
X 0
总体参数间差异越大,检验功效越大
记δ=μ-μ0,则|δ|越大,
P(
/ n
越大。 Z)
4. 检验功效的影响因素 以单组样本资料Z 检验为例分析
Z
X 0
/ n
个体间差异(标准差)越小,检验功效越大
解析:已知π0=0.17,n=150,样本频率 p=35/150=0.2333;
建立检验假设并确定检验水准
H0:π=0.17
H1:π>0.17 α=0.05
nπ0=25.5,n(1-π0)=109.5,均大于5,可通过正态近 似法进行Z检验;
计算检验统计量
p 0 p 0 Z p 0 (1 0 ) / n
一个总体: N(μ,σ2),检验μ是否不同于20mg/L。
建立检验假设并确定检验水准
H0:μ=20mg/L
H1:μ≠ 20mg/L
α=0.05
(二)单组样本均数的t 检验
样本来自正态总体,且总体标准差未知,采用t 检验;
在H0成立的前提下,
t
本例
X 0 S/ n
t (n 1)