07假设检验基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验基础
学习要点
为什么要进行假设检验?
假设检验的基本步骤
假设检验中的两类错误
假设检验与置信区间的关系
配对t检验与成组t检验对资料的要求
二项分布近似服从正态分布条件与分析方法
正态近似法分析泊松分布问题
2/114
统计资料处理 统计描述(statistical description)
d 2 d n n 1
2
710 (16 ) 2 12 7.91(k g) 12 1
t
| 1.33 | 7.91 12
0.58
(3)确定 P 值,作出推断结论 , =n-1=12-1=11, 查 附 表 2 , t 界 值 表 , 得 单 侧 t0.05/2 , 11=2.201, 现 t=0.58 <t0.05/2,11=2.201,故P > 0.05。按α=0.05 水准,不拒绝H0, 差异无统计学意义。 结论:故尚不能认为该减肥药有减肥效果。
6/114
例:中国男篮进攻成功率为46.3﹪,第12届世
锦赛与西班牙队的比赛中发动93次进攻,成功率
为53.8﹪。
是否可以认为该场比赛的进攻成功率高于以往?
7/114
假设检验
随机抽样
x 173 .83 样本 s 5.74
? 总 体 μ
抽样误差
总体 μ =173.2
0Baidu Nhomakorabea
8/114
假设检验(hypothesis testing)
样本均数与总体均数比较
上述两个均数不等既可能是抽样误差所致,也有可 能真是环境差异的影响,做假设检验。 因为σ未知,可用t检验,检验过程如下:
1. 建立假设 H0:µ 0=72次/分,H1:µ≠µ0, =µ
检验水准α为0.05。
30/114
样本均数与总体均数比较
2. 计算统计量 进行样本均数与总体均数比较的u检验,计算u值
19/114
20/114
第三步:根据统计量的大小及其分布确定检验假设成立的
可能性P的大小并判断结果。
拒绝域
拒绝域
( t,z,F,x2 )
21/114
( t,z,F,x2 )
22/114
23/114
t / 2 ,
P值是指在H0成立的条件下,获得等于及大于(或 小于)现有统计量的概率。当求得统计量后,一般 可根据有关统计用表查得P值。例如t检验中, │t│≥ t / 2, ,则P≤α;│t│< t / 2 ,, 则P > α 。
的脉搏数不同?
4/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L, 铅作业工人的血红蛋白含量与正常人有无不同?
5/114
根据以往的资料得知A、B两校男生50米跑成 绩的标准差分别为0.4秒和0.2秒。今从两校中分 别抽测了25名和28名男生,其50米跑平均成绩分 别为8.1秒和7.9秒。问两校男生50米跑水平是否 相同?
27/114
样本均数与总体均数比较
例8.3:根据大量调查,已知健康成年男性的脉搏 均数为72次/分,某医生在一山区随即抽查了25 名健康男性,求得其脉搏均数为74.2次/分,标 准差为6.0次/分,问是否能据此认为该山区成年 男性的脉搏均数高于一般成年男性?
28/114
样本均数与总体均数比较
29/114
第一步:提出一对检验假设, (1)无效假设null hypothesis, H0,又称零假设、原假设 (2)备择假设 alternative hypothesis, H1 。
H0:假设两总体均数相等。(即样本与总体或样本与样本间 的差异是由抽样误差引起的) H1:假设两总体均数不相等。(即两总体间存在本质差异)
x 0 x 0 74.2 72.0 t 1.833 s 6.0 sx n 25
31/114
样本均数与总体均数比较
3.确定p值,判断是否应该拒绝
查t界值表,临界值t0.05/2,24=2.064,检验统计量
t=1.833<2.064不是小概率事件,对于一次随机抽样而言,
较高。
41/114
故0.005>P>0.002。按水准,拒绝H0, 接受H1, 差异有统计学意义。
两独立样本资料的t检验 independent samples t-test
适用于比较按完全随机设计而得到的两组资料,比较的目 的是推断它们各自所代表的总体均数和是否相等。
两总体方差齐性,即总体方差相等。 1 2
43/114
23.01
(1)建立检验假设 H0:μ1 =μ2 ,即病人与健康人的尿中17酮类固醇的 排出量相同 H1: μ1 ≠μ2 ,即病人与健康人的尿中17酮类固醇的 排出量不同 α =0.05 (2)计算t值
是会发生的。
32/114
定义P值和应用
本例 t<t0.05,24, P>0.05 ; P>,不拒绝H0, 不能认为该山区成年男性的脉搏均数与一般成 年男性不同。
33/114
配对设计资料的t检验
配对设计; 自身配对:
同一个体治疗前后; 同一标本,不同检查方法 非自身配对:不同个体配对。
先求出各对子的差值d的均值, 若两种处理的效 应无差别,理论上差值d 的总体均数应为0。 要求差值的总体分布为正态分布。
42/114
n1 n2 2
例3.9 测得14名慢性支气管炎病人与11名健康人的尿
中17酮类固醇(mol/24h)排出量如下,试比较两组
人的尿中17酮类固醇的排出量有无不同。 原始调查数据如下:
病
人X1:n=14;
10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60 健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 13.89 19.40 15.83 26.72 17.29
2、如果差别较大,则有可能不是抽样误差,而是来自的总体不
同。
10/114
假设检验是用来判断样本与样本,样本
与总体的差异是由抽样误差引起还是本
质差别造成的统计推断方法
11/114
假设检验理论基础
假设检验理论基础---利用小概率反证法思想,从问题的
对立面(H0)出发,间接判断要解决的问题(H1)是否
H1的内容直接反映了检验的单、双侧。
17/114
设定检验水准(size of test ) α常为0.05
第二步:选定统计方法,计算出统计量的大小。
根据资料的类型和特点,可分别选用t检验,则计算t值,
z检验则计算z值,或其他检验方法:秩和检验和卡方检验等。
x 0 t sx
18/114
成立。然后H0成立的条件下计算检验统计量,最后获得p
值来判断。
1、若p为小概率,则认为假设不成立; 2、若非小概率,则还不能认为假设不成立。 该结论的正确性是冒着5%的错误风险。 假设检验有自己独特的逻辑和统计学思维方式。
12/114
μ=173.2 173.83
176.5
13/114
假设检验的基本步骤
14/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L,铅作业工 人的血红蛋白含量与正常人有无不同?
15/114
假设检验分为单、双侧检验
H0:μ=μ0;H1:μ≠μ0(双侧检验) 或者:
H0:μ=μ0;H1:μ>μ0 ;(单侧检验)
26/114
单样本资料的t检验
单样本资料的t检验(样本均数与总体均数比较的t 检验)实际上是推断该样本来自的总体均数µ 与已 知的某一总体均数µ (常为理论值或标准值) 有 0 无差别。 在进行样本均数与总体均数比较中,需要建立一 个统计量,根据样本所属不同总体,该统计量的 分布也不同,由此作出相应的统计推断。
若P≤α ,表示在H0成立的条件下,出现等于及大于 现有统计量的概率是小概率,根据小概率事件原理, 现有样本信息不支持H0,因而拒绝H0,接受H1,有 统计学意义,可以认为…….不等或不同。
24/114
若P>α ,表示在H0成立的条件下,出现等于及大 于现有统计量的概率不是小概率,现有样本信息还 不能拒绝H0 ,结论为按所取检验水准不拒绝H0 ,
2
2
,用t检验
t
X1 X 2 S X1X 2
S X1X 2
1 1 2 n1 n2 S Sc n n n n 2 1 1 2
2 c
2 (n1 1) S12 (n2 1) S 2 S c2 n1 n2 2
34/114
t检验的公式为:
| d d | | d 0 | |d | t Sd Sd n Sd n
例题 设有12名志愿受试者服用某减肥药,服药前
和服药后一个疗程各测量一次体重(kg),数据如表 所示。问此减肥药是否有效?
35/114
某减肥药研究的体重(kg)观察值
个体号 1 2 3 4 5 6 7 8 9 10 11 12 合 计 服药前(X1) 101 131 131 143 124 137 126 95 90 67 84 101 — 服药后(X2) 100 136 126 150 128 126 116 105 87 57 74 109 — 差值(d=X2-X1) -1 5 -5 7 4 -11 -10 10 -3 -10 -10 8 -16 d 1 25 25 49 16 121 100 100 9 100 100 64 710
即差异无统计意义,,还不能认为…不等或不同。
注意:
1、不拒绝H0不等于接受H0;
2、对H0 只能说拒绝不拒绝Ho;对H1 只能说接受H1 。
25/114
t检验
t检验的应用条件:
σ未知,且 n较小
样本来自正态总体
两样本均数比较时还要求两个总体方差相等 (σ已知或σ未知但n足够大应用z检验)
统计推断 (statistical inference)
1、参数估计estimation of parameter 2、假设检验 hypothesis testing
3/114
根据大量调查,已知健康成年男子脉搏均数为72次/分钟 某医生在一山区随机测量了25名健康成年男子脉搏数, 求得其均数为74.2次/分钟,标准差为6.5次/分钟, 能否认为该山区成年男子的脉搏数与一般健康成年男子
38/114
某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系,将同种属的大白鼠按性别相同,年龄、
体重相近配成8对,并将每对中的两只大白鼠随
机分到正常饲料组和维生素E缺乏组,然后定期
将大白鼠杀死,测得其肝中维生素A的含量如表。
问不同饲料组的大白鼠肝中维生素A含量有无差
别?
39/114
40/114
8.0867 6.812 / 8 Sd 0.572 ( mol / g ) 8 1 0.851 t 4.208 0.572 / 8
查表,t0.005/2,7=4.029, t0.002/2, 7=4.785, 现t0.005/2,7<t< t0.002/2,7 ,
可认为不同饲料的大白鼠肝中维生素A含量有差别,正常饲料的
样本均数与总体均数不等,有两种可能: 由抽样误差所致 两者来自不同的总体
9/114
本例目的是判断是否μ≠μ0,但直接判断很困难。但可以利用
反证法思想,从μ=μ0出发,间接的判断是否μ≠μ0. 假设μ=μ0 ,判断由于抽样误差造成 x 与μ0差别可能性有多 大? 1、如果 x 与μ0接近,其差别是抽样造成的可能性就很大;
或者 H0:μ=μ0;H1:μ<μ0 (单侧检验)
16/114
对于假设检验,需注意:
检验假设是针对总体而言,而不是针对样本;
H0与H1是相互对立、相互联系的,最后的结论 是根据H0与H1做出的,两者缺一不可;
Ho是无效假设,假设常常是两个或多个总体参数 相等、或之差为0、或….无效、或某资料服从某 一特定分布;
2
36/114
(1)建立检验假设 H0:μd=0, 即该减肥药无效; H1:μd≠0 ,即该减肥药有效。 α=0.05 (2)计算t值
本例n = 12, Σd = -16,Σd2 = 710,
差值的均数=Σd /n = -16/12 = -1.33(kg )
37/114
Sd
学习要点
为什么要进行假设检验?
假设检验的基本步骤
假设检验中的两类错误
假设检验与置信区间的关系
配对t检验与成组t检验对资料的要求
二项分布近似服从正态分布条件与分析方法
正态近似法分析泊松分布问题
2/114
统计资料处理 统计描述(statistical description)
d 2 d n n 1
2
710 (16 ) 2 12 7.91(k g) 12 1
t
| 1.33 | 7.91 12
0.58
(3)确定 P 值,作出推断结论 , =n-1=12-1=11, 查 附 表 2 , t 界 值 表 , 得 单 侧 t0.05/2 , 11=2.201, 现 t=0.58 <t0.05/2,11=2.201,故P > 0.05。按α=0.05 水准,不拒绝H0, 差异无统计学意义。 结论:故尚不能认为该减肥药有减肥效果。
6/114
例:中国男篮进攻成功率为46.3﹪,第12届世
锦赛与西班牙队的比赛中发动93次进攻,成功率
为53.8﹪。
是否可以认为该场比赛的进攻成功率高于以往?
7/114
假设检验
随机抽样
x 173 .83 样本 s 5.74
? 总 体 μ
抽样误差
总体 μ =173.2
0Baidu Nhomakorabea
8/114
假设检验(hypothesis testing)
样本均数与总体均数比较
上述两个均数不等既可能是抽样误差所致,也有可 能真是环境差异的影响,做假设检验。 因为σ未知,可用t检验,检验过程如下:
1. 建立假设 H0:µ 0=72次/分,H1:µ≠µ0, =µ
检验水准α为0.05。
30/114
样本均数与总体均数比较
2. 计算统计量 进行样本均数与总体均数比较的u检验,计算u值
19/114
20/114
第三步:根据统计量的大小及其分布确定检验假设成立的
可能性P的大小并判断结果。
拒绝域
拒绝域
( t,z,F,x2 )
21/114
( t,z,F,x2 )
22/114
23/114
t / 2 ,
P值是指在H0成立的条件下,获得等于及大于(或 小于)现有统计量的概率。当求得统计量后,一般 可根据有关统计用表查得P值。例如t检验中, │t│≥ t / 2, ,则P≤α;│t│< t / 2 ,, 则P > α 。
的脉搏数不同?
4/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L, 铅作业工人的血红蛋白含量与正常人有无不同?
5/114
根据以往的资料得知A、B两校男生50米跑成 绩的标准差分别为0.4秒和0.2秒。今从两校中分 别抽测了25名和28名男生,其50米跑平均成绩分 别为8.1秒和7.9秒。问两校男生50米跑水平是否 相同?
27/114
样本均数与总体均数比较
例8.3:根据大量调查,已知健康成年男性的脉搏 均数为72次/分,某医生在一山区随即抽查了25 名健康男性,求得其脉搏均数为74.2次/分,标 准差为6.0次/分,问是否能据此认为该山区成年 男性的脉搏均数高于一般成年男性?
28/114
样本均数与总体均数比较
29/114
第一步:提出一对检验假设, (1)无效假设null hypothesis, H0,又称零假设、原假设 (2)备择假设 alternative hypothesis, H1 。
H0:假设两总体均数相等。(即样本与总体或样本与样本间 的差异是由抽样误差引起的) H1:假设两总体均数不相等。(即两总体间存在本质差异)
x 0 x 0 74.2 72.0 t 1.833 s 6.0 sx n 25
31/114
样本均数与总体均数比较
3.确定p值,判断是否应该拒绝
查t界值表,临界值t0.05/2,24=2.064,检验统计量
t=1.833<2.064不是小概率事件,对于一次随机抽样而言,
较高。
41/114
故0.005>P>0.002。按水准,拒绝H0, 接受H1, 差异有统计学意义。
两独立样本资料的t检验 independent samples t-test
适用于比较按完全随机设计而得到的两组资料,比较的目 的是推断它们各自所代表的总体均数和是否相等。
两总体方差齐性,即总体方差相等。 1 2
43/114
23.01
(1)建立检验假设 H0:μ1 =μ2 ,即病人与健康人的尿中17酮类固醇的 排出量相同 H1: μ1 ≠μ2 ,即病人与健康人的尿中17酮类固醇的 排出量不同 α =0.05 (2)计算t值
是会发生的。
32/114
定义P值和应用
本例 t<t0.05,24, P>0.05 ; P>,不拒绝H0, 不能认为该山区成年男性的脉搏均数与一般成 年男性不同。
33/114
配对设计资料的t检验
配对设计; 自身配对:
同一个体治疗前后; 同一标本,不同检查方法 非自身配对:不同个体配对。
先求出各对子的差值d的均值, 若两种处理的效 应无差别,理论上差值d 的总体均数应为0。 要求差值的总体分布为正态分布。
42/114
n1 n2 2
例3.9 测得14名慢性支气管炎病人与11名健康人的尿
中17酮类固醇(mol/24h)排出量如下,试比较两组
人的尿中17酮类固醇的排出量有无不同。 原始调查数据如下:
病
人X1:n=14;
10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60 健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 13.89 19.40 15.83 26.72 17.29
2、如果差别较大,则有可能不是抽样误差,而是来自的总体不
同。
10/114
假设检验是用来判断样本与样本,样本
与总体的差异是由抽样误差引起还是本
质差别造成的统计推断方法
11/114
假设检验理论基础
假设检验理论基础---利用小概率反证法思想,从问题的
对立面(H0)出发,间接判断要解决的问题(H1)是否
H1的内容直接反映了检验的单、双侧。
17/114
设定检验水准(size of test ) α常为0.05
第二步:选定统计方法,计算出统计量的大小。
根据资料的类型和特点,可分别选用t检验,则计算t值,
z检验则计算z值,或其他检验方法:秩和检验和卡方检验等。
x 0 t sx
18/114
成立。然后H0成立的条件下计算检验统计量,最后获得p
值来判断。
1、若p为小概率,则认为假设不成立; 2、若非小概率,则还不能认为假设不成立。 该结论的正确性是冒着5%的错误风险。 假设检验有自己独特的逻辑和统计学思维方式。
12/114
μ=173.2 173.83
176.5
13/114
假设检验的基本步骤
14/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L,铅作业工 人的血红蛋白含量与正常人有无不同?
15/114
假设检验分为单、双侧检验
H0:μ=μ0;H1:μ≠μ0(双侧检验) 或者:
H0:μ=μ0;H1:μ>μ0 ;(单侧检验)
26/114
单样本资料的t检验
单样本资料的t检验(样本均数与总体均数比较的t 检验)实际上是推断该样本来自的总体均数µ 与已 知的某一总体均数µ (常为理论值或标准值) 有 0 无差别。 在进行样本均数与总体均数比较中,需要建立一 个统计量,根据样本所属不同总体,该统计量的 分布也不同,由此作出相应的统计推断。
若P≤α ,表示在H0成立的条件下,出现等于及大于 现有统计量的概率是小概率,根据小概率事件原理, 现有样本信息不支持H0,因而拒绝H0,接受H1,有 统计学意义,可以认为…….不等或不同。
24/114
若P>α ,表示在H0成立的条件下,出现等于及大 于现有统计量的概率不是小概率,现有样本信息还 不能拒绝H0 ,结论为按所取检验水准不拒绝H0 ,
2
2
,用t检验
t
X1 X 2 S X1X 2
S X1X 2
1 1 2 n1 n2 S Sc n n n n 2 1 1 2
2 c
2 (n1 1) S12 (n2 1) S 2 S c2 n1 n2 2
34/114
t检验的公式为:
| d d | | d 0 | |d | t Sd Sd n Sd n
例题 设有12名志愿受试者服用某减肥药,服药前
和服药后一个疗程各测量一次体重(kg),数据如表 所示。问此减肥药是否有效?
35/114
某减肥药研究的体重(kg)观察值
个体号 1 2 3 4 5 6 7 8 9 10 11 12 合 计 服药前(X1) 101 131 131 143 124 137 126 95 90 67 84 101 — 服药后(X2) 100 136 126 150 128 126 116 105 87 57 74 109 — 差值(d=X2-X1) -1 5 -5 7 4 -11 -10 10 -3 -10 -10 8 -16 d 1 25 25 49 16 121 100 100 9 100 100 64 710
即差异无统计意义,,还不能认为…不等或不同。
注意:
1、不拒绝H0不等于接受H0;
2、对H0 只能说拒绝不拒绝Ho;对H1 只能说接受H1 。
25/114
t检验
t检验的应用条件:
σ未知,且 n较小
样本来自正态总体
两样本均数比较时还要求两个总体方差相等 (σ已知或σ未知但n足够大应用z检验)
统计推断 (statistical inference)
1、参数估计estimation of parameter 2、假设检验 hypothesis testing
3/114
根据大量调查,已知健康成年男子脉搏均数为72次/分钟 某医生在一山区随机测量了25名健康成年男子脉搏数, 求得其均数为74.2次/分钟,标准差为6.5次/分钟, 能否认为该山区成年男子的脉搏数与一般健康成年男子
38/114
某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系,将同种属的大白鼠按性别相同,年龄、
体重相近配成8对,并将每对中的两只大白鼠随
机分到正常饲料组和维生素E缺乏组,然后定期
将大白鼠杀死,测得其肝中维生素A的含量如表。
问不同饲料组的大白鼠肝中维生素A含量有无差
别?
39/114
40/114
8.0867 6.812 / 8 Sd 0.572 ( mol / g ) 8 1 0.851 t 4.208 0.572 / 8
查表,t0.005/2,7=4.029, t0.002/2, 7=4.785, 现t0.005/2,7<t< t0.002/2,7 ,
可认为不同饲料的大白鼠肝中维生素A含量有差别,正常饲料的
样本均数与总体均数不等,有两种可能: 由抽样误差所致 两者来自不同的总体
9/114
本例目的是判断是否μ≠μ0,但直接判断很困难。但可以利用
反证法思想,从μ=μ0出发,间接的判断是否μ≠μ0. 假设μ=μ0 ,判断由于抽样误差造成 x 与μ0差别可能性有多 大? 1、如果 x 与μ0接近,其差别是抽样造成的可能性就很大;
或者 H0:μ=μ0;H1:μ<μ0 (单侧检验)
16/114
对于假设检验,需注意:
检验假设是针对总体而言,而不是针对样本;
H0与H1是相互对立、相互联系的,最后的结论 是根据H0与H1做出的,两者缺一不可;
Ho是无效假设,假设常常是两个或多个总体参数 相等、或之差为0、或….无效、或某资料服从某 一特定分布;
2
36/114
(1)建立检验假设 H0:μd=0, 即该减肥药无效; H1:μd≠0 ,即该减肥药有效。 α=0.05 (2)计算t值
本例n = 12, Σd = -16,Σd2 = 710,
差值的均数=Σd /n = -16/12 = -1.33(kg )
37/114
Sd