6. 第七、八章 假设检验的基本概念和t检验病理
合集下载
假设检验
22
表
u值(取正)、 值与统计结论 值 取正)、P值与统计结论 )、
u值 值 <1.96 <1.645 ≥1.96 ≥1.645 ≥2.58 ≥2.33 P值 值 >0.05 ≤0.05 ≤0.01 统计结论 不拒绝H0,差别无统计学 不拒绝 , 意义 拒绝H0,接受 , 拒绝 ,接受H1,差别有 统计学意义 拒绝H0,接受H1,差别有 拒绝 ,接受 , 高度) (高度)统计学意义
5
x = 74.2, µ0 = 72
本例: 的可能原因有二: 本例:造成 X − µ ≠ 0 的可能原因有二:
① 抽样误差造成的; 抽样误差造成的; ② 本质差异造成的
如何做出判断, 如何做出判断 , 统计上是通过假设检验来 回答这个问题 假设检验的目的— 假设检验的目的 判断差别是由哪种原因造成
9
假设H0成立的条件下, 假设H 成立的条件下, 出现| |≥k或 应为小概率事件, 出现| x -μ0|≥k或t≥tα,v 应为小概率事件, )≤α(0.05), ),若计算出的 即P(t≥tα,v)≤α(0.05),若计算出的 它发生的概率P (0.05) t≥tα,v,它发生的概率P应≤α(0.05),根 据小概率原理, 据小概率原理,小概率事件在一次试验中不 易发生。 易发生。但实际上不易发生的事件已经发生 故认为是假设错了,即认为H 了,故认为是假设错了,即认为H0的假设不成 拒绝H 立,拒绝H0 总结: p≤α,拒绝 拒绝H 总结:t≥tα,v,,p≤α,拒绝H0
x − µ0 k k P {x − µ 0 ≥ k } ≤ α → P ≥ ≤ α → P t ≥ ≤ α成立 s s s n n n
假设α=0.05,
k 应有 P t ≥ (为临界值 tα ,v ) ≤ 0.05 成立 s n
第七章假设检验基础
3t检验的应用条件是什么?
1随机样本 2来自正态总体 3均数比较时,要求两总体方差相等(方差齐性)
4假设检验中P之的意义是什么?
如果总体状况与Ho一致,统计量获得现有数值以及更不利于Ho的数值的概率。
5如何确定检验水准?
需根据研究类型,研究目的,变量类型及变异水平,样本大小等诸多因素。
配对设计资料的t检验:配对设计是研究者为了控制可能存在的非处理因素而采用的一种试验设计方法。
检验统计量:t=dbar-0 / Sd/√n,ν=n-1.其中dbar为差值的均数,Sd为差值的样本标准差,n是对子数。
两独立样本资料的t检验:
㈠两样本所属总体方差相等
检验统计量:t=X1bar-X2bar / √Sc^2(1/n1+1/n2)
6如何恰当地应用单侧与双侧检验?
单侧与双侧检验的应用首先应考虑所要解决问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。
大样本资料的z检验:即把它当正态分布处理。计算z。
泊松分布资料的z检验:
单样本资料的z检验:与大样本资料处理方法一致,只是相应的把λ=μ,
λ=σ^2代入即可。
两独立样本资料的z检验:1两样本观察单位数相等时,z=X1-X2 / √ X1+X2
2观察单位不等时,z=X1bar-X2bar /√ X1bar/n1+X2bar/n2.
Sc^2=(∑(X1-X1bar)^2 + ∑(X2-X2bar)^2 ) / n1+n2-2,为合并的方差。
假设检验与t检验
17酮类固醇排出量mg/dl分别为X1和X2, 试问两组的均数有 无不同 X1: 3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22
4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2: 4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18
t
4 .45 5 .4 299
0 .84 5 1 .820
1 .32 2(14 8 1 ) 1 .38 2(12 6 1 ) 1 1 0 .2156 ( )
1 8 1 6 2
18 16
n 1 n 2 2 1 1 8 2 6 32
3 确定P值,作出统计推断
查附表2 ,t界值表, 得0.10>P>0.05,按=0.05 水准不拒绝H0,尚不能认为慢性支气管患者尿
两个总体的方差不等.否则不拒绝H0,尚不能认为 两个总体的方差不等
THE END
2.配对样本t检验
对于配对样本数据,应该首先计算出各对差值的均数.当两种处理结果无 差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对 样本资料的假设检验视为总体均数差值与0的比较,所用方法为配对t检验 paired t-test
t d d d 0
s d
sd / n
vn1
适用条件:要求差值的总体分布为正态分布,即差数来自正态 分布总体
例 为探讨MRI无创性测量肺脉舒张压PADP的新途 径,分别用MRI和右心导管两种方法测量12名患者 的肺脉舒张压,资料如下表,问两种方法的检测结 果有无差别
两种方法检测12名患者的肺脉舒张压kPa结果
4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2: 4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18
t
4 .45 5 .4 299
0 .84 5 1 .820
1 .32 2(14 8 1 ) 1 .38 2(12 6 1 ) 1 1 0 .2156 ( )
1 8 1 6 2
18 16
n 1 n 2 2 1 1 8 2 6 32
3 确定P值,作出统计推断
查附表2 ,t界值表, 得0.10>P>0.05,按=0.05 水准不拒绝H0,尚不能认为慢性支气管患者尿
两个总体的方差不等.否则不拒绝H0,尚不能认为 两个总体的方差不等
THE END
2.配对样本t检验
对于配对样本数据,应该首先计算出各对差值的均数.当两种处理结果无 差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对 样本资料的假设检验视为总体均数差值与0的比较,所用方法为配对t检验 paired t-test
t d d d 0
s d
sd / n
vn1
适用条件:要求差值的总体分布为正态分布,即差数来自正态 分布总体
例 为探讨MRI无创性测量肺脉舒张压PADP的新途 径,分别用MRI和右心导管两种方法测量12名患者 的肺脉舒张压,资料如下表,问两种方法的检测结 果有无差别
两种方法检测12名患者的肺脉舒张压kPa结果
《假设检验》课件
方差分析
总结词
适用于多组数据比较的检验方法
详细描述
方差分析是一种适用于多组数据比较的假设检验方法。它通过比较不同组之间的变异和 误差来源,计算F值和对应的P值,以判断原假设是否成立。方差分析在很多领域都有
应用,如农业、生物统计学和心理学等。
秩和检验
总结词
适用于等级数据或非参数数据的检验方法
详细描述
秩和检验是一种适用于等级数据或非参数数 据的假设检验方法。它通过将数据排序后进 行比较,计算秩和值和对应的P值,以判断 原假设是否成立。秩和检验在很多领域都有 应用,如医学、生物学和环境科学等。
04 假设检验的实例分析
单样本Z检验实例
总结词
用于检验一个样本的平均值与已知的 某一总体均值之间是否存在显著差异 。
如果样本量过小,可能无 法得出可靠的结论,因为 小样本可能无法代表总体 。
样本量过大
如果样本量过大,可能会 导致统计效率降低,增加 计算复杂度和成本。
样本代表性
在选择样本时,需要确保 样本具有代表性,能
假设检验的结果只能给出拒绝或接受 假设的结论,但无法给出假设正确与 否的确凿证据。
置信区间有助于判断假设的正确性
02
通过比较置信区间和假设值的位置关系,可以判断假设是否成
立。
置信区间与假设检验的互补关系
03
置信区间和假设检验各有优缺点,可以结合使用以更全面地评
估数据的统计性质。
THANKS 感谢观看
提出假设
根据研究问题和目的,提出原 假设和备择假设。
确定临界值
根据统计量的性质和显著性水 平,确定临界值。
做出决策
根据计算出的样本统计量和临 界值,做出接受或拒绝原假设 的决策。
卫生统计学:第7-8章 假设检验与t检验
8
反证法
当一件事情的发生只有A、B两种可能的时候,为了肯 定其中的一种情况A,但又不能直接证实A,这时否定 了另一种情况B,则间接肯定了A。 证明A还是证明B? 抗氧化剂 • 在H0成立的条件下,均数之间的差异是由抽样误差
引起的,有规律可循; • 在H1成立的条件下,均数间的不同包含种种未知情
形,无规律可循。 • 故从H0成立的角度出发,寻求其成立的概率。
分布。
数理统计的中心极限定理表明:从正态总体N ( , ) 中抽取例数均为n 的样 本,样本均 数也服从正态分布N( , X )。
Gosset 将此时的 u 转换:
X
定义为t 转换: t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布,以0为中心,左右对称 • t分布是一簇曲线,其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设,确定检验水准
假 设 检 验 步 骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度,某医 生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125 g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一 般正常小儿的平均血红蛋白浓度。
│t│值越大,则 P 值越小;反之,│t│值 越小,P 值越大。根据上述的意义,在同 一自由度下,│t│≥ tα ,则P≤ α ; 反之, │t│<tα,则P>α。
t 检验的应用条件:
单样本t 检验中,σ未知且样本含量较小 (n<50)时,要求样本来自正态分布总体;
反证法
当一件事情的发生只有A、B两种可能的时候,为了肯 定其中的一种情况A,但又不能直接证实A,这时否定 了另一种情况B,则间接肯定了A。 证明A还是证明B? 抗氧化剂 • 在H0成立的条件下,均数之间的差异是由抽样误差
引起的,有规律可循; • 在H1成立的条件下,均数间的不同包含种种未知情
形,无规律可循。 • 故从H0成立的角度出发,寻求其成立的概率。
分布。
数理统计的中心极限定理表明:从正态总体N ( , ) 中抽取例数均为n 的样 本,样本均 数也服从正态分布N( , X )。
Gosset 将此时的 u 转换:
X
定义为t 转换: t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布,以0为中心,左右对称 • t分布是一簇曲线,其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设,确定检验水准
假 设 检 验 步 骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度,某医 生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125 g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一 般正常小儿的平均血红蛋白浓度。
│t│值越大,则 P 值越小;反之,│t│值 越小,P 值越大。根据上述的意义,在同 一自由度下,│t│≥ tα ,则P≤ α ; 反之, │t│<tα,则P>α。
t 检验的应用条件:
单样本t 检验中,σ未知且样本含量较小 (n<50)时,要求样本来自正态分布总体;
06.假设检验基础
个统计量落入区域 拒绝域 是个小概率事件。
如果该统计量的实测值落入拒绝域,也就是说,
H0 成立下的小概率事件发生了,那么就认为H0
不可信而否定它。否则我们就不能否定H0 (只
好接受它).
假设检验的基本步骤:
1. 建立检验假设,确定检验水准;
H0:零假设、无效假设。是与研究假设有关的、被推断特 征某种确定的关系; H1:备择假设、对立假设。是被推断总体特征的另一种关 系或状况,与H0既有联系又互相对立。 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
假设检验
——通过对假设作出取舍抉择来达到解决问题的目的
A.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数相等无差异假设、零假设 H0(null hypothesis)
B.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数不相等对立假设、备择假设H1(alternative
hypothesis)
单样本t检验
One sample t-test
试验设计
一组样本均数(代表未知总体均数)与已知总 体均数(一般为理论值、标准值或经过大量
观察所得稳定值等)的比较。
X 0 X 0 t , n 1 SX S n
应用条件:样本来自正态分布的总体 且为随机样本!
例:根据大量调查,已知健康成年男子的脉
6.第七、八章假设检验的基本概念和t检验病理
6
常规方法
已知总体
?
断的目的:是否μ ≠μ0 ?
7
样本均数 x 与已知总体均数 0 不等,可 能 ① 由于抽样误差所致( 0 两总体均 数相等) ② 由于两种治疗方案导致差异( 0)
8
假设=0,即假设该样本来自于 0=3 min的总体,那么由于抽样的 偶然性得到样本均数等于及大于 4min的可能性有多大?
22
是“关联”不是“导致”
• 去年,一个有关“看电视时间和死亡率”研究成为媒体热 门的标题,研究者在六年里跟踪了8800人,观察他们的健 康、生活习惯和看电视行为,其中,有284人死亡,根据 研究,每天看电视超过4小时的人,在这段时间内死亡的 风险几率要比每天看两个小时以下的人高出46%。
11
用公式: t X 或z X
SX
X
如果 X与0 相差较远,t或z值就大,P值就小, 当P小到一定的α界值时,则称为小概率事件, 即在
一次抽样中发生的可能性就很小,如果发生了,则有
理由怀疑原假设μ=μ0 可能不成立。
2.5%
-t,
2.5%
0
t,
如果P值较大,认为差异由抽样误差所致的 可能性较大,故还没有足够的理由拒绝所做的 假设。即: (1)P≤:根据小概率事件原理拒绝原假设 。 (2) P>:没有足够的理由拒绝原假设。
19
数字越大,风险“越大”
• 《新科学家》文章问道:如果有人告诉你,100个人里面,有25个人 会因为癌症而死亡,又有人告诉你,1000个人里,有250个人会因癌 症死亡,这两者哪个让你更担心?
• 清楚的读者一看就明了,这两组数字表示的是同一个比例:四分之一 的人因癌症死亡。但是,两组说法的确会给读者带来理解上的不同。 希望夸大或者缩小风险的人,往往会用上“比例偏差”这个法则。乍 一看,数字越大,风险看上去也越大。
常规方法
已知总体
?
断的目的:是否μ ≠μ0 ?
7
样本均数 x 与已知总体均数 0 不等,可 能 ① 由于抽样误差所致( 0 两总体均 数相等) ② 由于两种治疗方案导致差异( 0)
8
假设=0,即假设该样本来自于 0=3 min的总体,那么由于抽样的 偶然性得到样本均数等于及大于 4min的可能性有多大?
22
是“关联”不是“导致”
• 去年,一个有关“看电视时间和死亡率”研究成为媒体热 门的标题,研究者在六年里跟踪了8800人,观察他们的健 康、生活习惯和看电视行为,其中,有284人死亡,根据 研究,每天看电视超过4小时的人,在这段时间内死亡的 风险几率要比每天看两个小时以下的人高出46%。
11
用公式: t X 或z X
SX
X
如果 X与0 相差较远,t或z值就大,P值就小, 当P小到一定的α界值时,则称为小概率事件, 即在
一次抽样中发生的可能性就很小,如果发生了,则有
理由怀疑原假设μ=μ0 可能不成立。
2.5%
-t,
2.5%
0
t,
如果P值较大,认为差异由抽样误差所致的 可能性较大,故还没有足够的理由拒绝所做的 假设。即: (1)P≤:根据小概率事件原理拒绝原假设 。 (2) P>:没有足够的理由拒绝原假设。
19
数字越大,风险“越大”
• 《新科学家》文章问道:如果有人告诉你,100个人里面,有25个人 会因为癌症而死亡,又有人告诉你,1000个人里,有250个人会因癌 症死亡,这两者哪个让你更担心?
• 清楚的读者一看就明了,这两组数字表示的是同一个比例:四分之一 的人因癌症死亡。但是,两组说法的确会给读者带来理解上的不同。 希望夸大或者缩小风险的人,往往会用上“比例偏差”这个法则。乍 一看,数字越大,风险看上去也越大。
【基础医学】第八章假设检验的基本概念
2020年11月24
一 、 单 样 本 均 数 的 u 检 验 (one-sample
u-test)
适用于当n较大(如n>60)或
已知
0
时。检验统计量分别为
u X 0 X 0 (n较大时)
S X
Sn
u X 0 X 0
X
0 n
(
已
0
知
时)
2P012201年例181-月2 24
例8–2(续例7-5) 1995年,已知某 地20岁应征男青年的平均身高为 168.5cm。2003年,在当地20岁应征 男青年中随机抽取85人,平均身高为 171.2 cm,标准差为5.3cm,问2003 年当地20岁应征男青年的身高与1995 年相比是否不同?
如例8–1已得到P<0.05, 按所取检 验水准0.05, 则拒绝H0,接受H1, 差异有统计学意义(统计结论), 可以认为矿区新生儿的头围均数与 一般新生儿不同,矿区新生儿的头 围小于一般新生儿(专业结论)。
2020年11月24
1
P
t / 2 ,
t t / 2 ,
2020年11月24
若 P ,按 所 取 检 验 水 准 ,拒 绝H 0 , 接受 H1 ,下“有差别”的结论。其统计学依 据是,在H0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一 次 试 验 中 发 生 , 所 以 拒 绝H 0 。
2020年11月24
③ H1的内容直接反映了检验单双侧。若H1
中只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
④ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。
一 、 单 样 本 均 数 的 u 检 验 (one-sample
u-test)
适用于当n较大(如n>60)或
已知
0
时。检验统计量分别为
u X 0 X 0 (n较大时)
S X
Sn
u X 0 X 0
X
0 n
(
已
0
知
时)
2P012201年例181-月2 24
例8–2(续例7-5) 1995年,已知某 地20岁应征男青年的平均身高为 168.5cm。2003年,在当地20岁应征 男青年中随机抽取85人,平均身高为 171.2 cm,标准差为5.3cm,问2003 年当地20岁应征男青年的身高与1995 年相比是否不同?
如例8–1已得到P<0.05, 按所取检 验水准0.05, 则拒绝H0,接受H1, 差异有统计学意义(统计结论), 可以认为矿区新生儿的头围均数与 一般新生儿不同,矿区新生儿的头 围小于一般新生儿(专业结论)。
2020年11月24
1
P
t / 2 ,
t t / 2 ,
2020年11月24
若 P ,按 所 取 检 验 水 准 ,拒 绝H 0 , 接受 H1 ,下“有差别”的结论。其统计学依 据是,在H0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一 次 试 验 中 发 生 , 所 以 拒 绝H 0 。
2020年11月24
③ H1的内容直接反映了检验单双侧。若H1
中只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
④ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。
假设检验的概念及t
u
X X
1
2
1 / n1 2 / n2
2
2
u=-4.23 查u界值表,4.23 >u 0.001/2=3.2905,得P <0.001,按照α =0.05水准,拒绝H0,接 受H1,可认为试验组和对照组退热天数的 总体均数不等,疗效不同。试验组比对照 组平均退热天数短。 μ 1-μ 2 的95%可信区间为-3.3——-1.3天
例8-2:1995年,某地20岁应征男青年平 均身高为168.5cm。2003年在当地20岁 应征男青年中随机抽取85人,平均身高 为171.2cm,标准差为5.3cm,问这两年 身高是否不同。 解:总体方差一般未知,当样本含量足够 大时,用S作为σ 的估计值。 1 建立假设,确定检验水准 H0:μ =168.5, H1:μ ≠ 168.5 α =0.05
2 计算统计量u
171 .2 168 .5 u 4.70 5.3 / 85 / n X 0
3 确定P值,下结论 查u界值表, 4.70 >u 0.001/2=3.2905,得P <0.001,按照α =0.05水准,拒绝H0,接 受H1,可认为2003年20岁应征男青年身 高有变化,比1995年增高了。
5.3 171.2 1.96 85
(170.1,172.3)
二 两均数比较的u检验
例8-3:为比较某药治疗流行性 出血热疗效, 将72名患者随机分为试验和对照组,结果分 别为n1=32, X 1 =2.9,S1=1.9;n2=40, X 2 =5.2,S =2.7,问试验组和对照组的平均退热 2 天数有无差别。 解:可用两组大样本资料的u检验 H 0: μ 1 = μ 2 , H 1: μ 1 ≠ μ 2 α =0.05 X 1 X 2 1 2 X1 X 2
X X
1
2
1 / n1 2 / n2
2
2
u=-4.23 查u界值表,4.23 >u 0.001/2=3.2905,得P <0.001,按照α =0.05水准,拒绝H0,接 受H1,可认为试验组和对照组退热天数的 总体均数不等,疗效不同。试验组比对照 组平均退热天数短。 μ 1-μ 2 的95%可信区间为-3.3——-1.3天
例8-2:1995年,某地20岁应征男青年平 均身高为168.5cm。2003年在当地20岁 应征男青年中随机抽取85人,平均身高 为171.2cm,标准差为5.3cm,问这两年 身高是否不同。 解:总体方差一般未知,当样本含量足够 大时,用S作为σ 的估计值。 1 建立假设,确定检验水准 H0:μ =168.5, H1:μ ≠ 168.5 α =0.05
2 计算统计量u
171 .2 168 .5 u 4.70 5.3 / 85 / n X 0
3 确定P值,下结论 查u界值表, 4.70 >u 0.001/2=3.2905,得P <0.001,按照α =0.05水准,拒绝H0,接 受H1,可认为2003年20岁应征男青年身 高有变化,比1995年增高了。
5.3 171.2 1.96 85
(170.1,172.3)
二 两均数比较的u检验
例8-3:为比较某药治疗流行性 出血热疗效, 将72名患者随机分为试验和对照组,结果分 别为n1=32, X 1 =2.9,S1=1.9;n2=40, X 2 =5.2,S =2.7,问试验组和对照组的平均退热 2 天数有无差别。 解:可用两组大样本资料的u检验 H 0: μ 1 = μ 2 , H 1: μ 1 ≠ μ 2 α =0.05 X 1 X 2 1 2 X1 X 2
4. 假设检验和t检验
0g/L
假设检验的基本思想—利用小概率反证法的思想
利用小概率反证法思想,从问题的对立面(H0)出 发间接判断要解决的问题(H1)是否成立。然后在
H0成立的条件下计算检验统计量,最后获得P值来判 断。当P小于或等于预先规定的概率值α,就是小概
率事件。根据小概率事件的原理:小概率事件在一次 抽样中发生的可能性很小,如果他发生了,则有理由 怀疑原假设H0,认为其对立面H1成立
案例10-13
0 136.0g / L, n 25, X 121g / L, S 48.8g / L;
造成 X 0 的可能原因有二:
① 抽样误差造成的; ② 本质差异造成的。
假设检验目的——判断差别是由哪种原因造成的。
一种假设H0
炊事员血红蛋白总体均数
136.0g/L
抽样误差
X 121g/L
( 二)单样本 z 检验
样本来自正态分布的总体
样本含量较大( 100)或总体标准差已知
我们可以近似用z检验
公式如下:
z x u0 x u0 (n 100) sx s / n
z
x u0
x
x u0
0 / n
( 0已知时)
案例
大规模调查表明,健康成年男子血红蛋白的均 数为136.0g/L,今随机调查某单位食堂成年男 性炊事员100名,测得其血红蛋白均数121g/L, 标准差48.8g/L。
似用z检验。当样本含量较大时,t检验与z检验可 以等同使用。
一、样本均数与总体均数比较 ➢ 单样本t检验 ➢ 单样本z检验
二、配对t检验 三、完全随机设计两均数比较
➢ 两独立样本t检验 ➢ 两样本z检验
一、样本均数与总体均数比较
样本均数 X (代表未知总体均数)与已知 总体均数0(一般为理论值、标准值或经过大量
假设检验的基本思想—利用小概率反证法的思想
利用小概率反证法思想,从问题的对立面(H0)出 发间接判断要解决的问题(H1)是否成立。然后在
H0成立的条件下计算检验统计量,最后获得P值来判 断。当P小于或等于预先规定的概率值α,就是小概
率事件。根据小概率事件的原理:小概率事件在一次 抽样中发生的可能性很小,如果他发生了,则有理由 怀疑原假设H0,认为其对立面H1成立
案例10-13
0 136.0g / L, n 25, X 121g / L, S 48.8g / L;
造成 X 0 的可能原因有二:
① 抽样误差造成的; ② 本质差异造成的。
假设检验目的——判断差别是由哪种原因造成的。
一种假设H0
炊事员血红蛋白总体均数
136.0g/L
抽样误差
X 121g/L
( 二)单样本 z 检验
样本来自正态分布的总体
样本含量较大( 100)或总体标准差已知
我们可以近似用z检验
公式如下:
z x u0 x u0 (n 100) sx s / n
z
x u0
x
x u0
0 / n
( 0已知时)
案例
大规模调查表明,健康成年男子血红蛋白的均 数为136.0g/L,今随机调查某单位食堂成年男 性炊事员100名,测得其血红蛋白均数121g/L, 标准差48.8g/L。
似用z检验。当样本含量较大时,t检验与z检验可 以等同使用。
一、样本均数与总体均数比较 ➢ 单样本t检验 ➢ 单样本z检验
二、配对t检验 三、完全随机设计两均数比较
➢ 两独立样本t检验 ➢ 两样本z检验
一、样本均数与总体均数比较
样本均数 X (代表未知总体均数)与已知 总体均数0(一般为理论值、标准值或经过大量
假设检验——t检验
2
n( n 1)
df=n-1 (n为对子数)
式中d为各个对子数值的差数, d 为差数的平均数。
例2 为了检验某种教学方法的效果,某一任课教师从自己任 课的班中选定了在智力、基础知识、家庭学习条件等方面基 本相同的 10名学生,应用该教学方法前进行一次测验,应用 该教学方法一段时间后再进行一次测验,得分如下表,试分 析该教学方法的是否有显著的教学效果?
例1:某飞机制造厂经理拟购一批共计 10000 张的铝板,规定厚度为 0.04 寸(厚 度过大将增加机身重量,过薄则影响应有 的强度)。经检测 100 张铝板,其平均厚 度为0.0408 寸。这样,经理就面临着是否 相信该批铝板的平均厚度与 0.04 寸无异的 问题,从而面临接收或拒收这批铝板的两 种对立行动的抉择。
(大样本)
比例
t 检验
(小样本)
方差
2检验
Z 检验
㈢确定显著性水平α和临界值及拒绝域
• 显著性水平α是当原假设为正确时被拒绝的概率, 是由研究者事先确定的。
• 显著性水平的大小应根据研究需要的精确度和可 靠性而定。通常取α=0.05或α=0.01,即接受原 假设的决定是正确的可能性(概率)为95%或99 %。 • 根据给定的显著性水平α,查表得出相应的临界值, 同时指定拒绝域。
㈡确定适当的检验统计量
假设检验根据检验内容和条件不同需要采用不同的检 验统计量。 在一个正态总体的参数检验中, Z 统计量和 t 统计量常 用于均值和比例的检验, 2 统计量用于方差的检验。 选择统计量需考虑的因素有被检验的参数类型、总体 方差是否已知、用于检验的样本量大小等。
一个总体
均值
Z 检验
成 绩
编 号 成 绩
96
n( n 1)
df=n-1 (n为对子数)
式中d为各个对子数值的差数, d 为差数的平均数。
例2 为了检验某种教学方法的效果,某一任课教师从自己任 课的班中选定了在智力、基础知识、家庭学习条件等方面基 本相同的 10名学生,应用该教学方法前进行一次测验,应用 该教学方法一段时间后再进行一次测验,得分如下表,试分 析该教学方法的是否有显著的教学效果?
例1:某飞机制造厂经理拟购一批共计 10000 张的铝板,规定厚度为 0.04 寸(厚 度过大将增加机身重量,过薄则影响应有 的强度)。经检测 100 张铝板,其平均厚 度为0.0408 寸。这样,经理就面临着是否 相信该批铝板的平均厚度与 0.04 寸无异的 问题,从而面临接收或拒收这批铝板的两 种对立行动的抉择。
(大样本)
比例
t 检验
(小样本)
方差
2检验
Z 检验
㈢确定显著性水平α和临界值及拒绝域
• 显著性水平α是当原假设为正确时被拒绝的概率, 是由研究者事先确定的。
• 显著性水平的大小应根据研究需要的精确度和可 靠性而定。通常取α=0.05或α=0.01,即接受原 假设的决定是正确的可能性(概率)为95%或99 %。 • 根据给定的显著性水平α,查表得出相应的临界值, 同时指定拒绝域。
㈡确定适当的检验统计量
假设检验根据检验内容和条件不同需要采用不同的检 验统计量。 在一个正态总体的参数检验中, Z 统计量和 t 统计量常 用于均值和比例的检验, 2 统计量用于方差的检验。 选择统计量需考虑的因素有被检验的参数类型、总体 方差是否已知、用于检验的样本量大小等。
一个总体
均值
Z 检验
成 绩
编 号 成 绩
96
《假设检验的概念及》PPT课件
2. 假设检验( test of
hypothesis)
实例
通过以往大规模调查,已知某地一般新生 儿的头围均数为34.50cm。为研究某矿区 新生儿的发育状况,现从该地某矿区随机 抽取新生儿55人,测得其头围均数为 33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
假设检验的步骤及有关概念
按α=0.05 水准,不拒绝H0 ,两者的差别无统计学意义
附表2 t界值表
二、配对资料的比较
两种情况:1.随机配对设计(randomized
paired design)是将受试对象按某些混杂因素(如性 别、年龄、窝别等)配成对子,每对中的两个个体随 机分配给两种处理(如处理组与对照组);2.或者同 一受试对象作两次不同的处理(自身对照)。
怀疑H0的正确性,从而接受H1。通常选择后 者。本例,可认为该矿区新生儿总体均数与
一般新生儿头围总体均数不同。
例8-2:1995年,某地20岁应征男青年平 均身高为168.5cm。2003年在当地20岁 应征男青年中随机抽取85人,平均身高 为171.2cm,标准差为5.3cm,问这两年 身高是否不同。
t | d | 0.112 0.817, n 1 12 1 11
Sd / n 0.475 / 12
3. 查相应界值表,确定P 值,下结论。 查表t0.05/ 2,11 2.201,t P t , 0.05/ 2,11 >0.05,按α=0.05 水准, 不拒绝 H 0 ,两种方法的测量结果差值无统计学意义。
第八章 假设检验的概念及t检验
统计推断
statistical inference
内容:
总体
抽取部分观察单位 样本
1. 参数估计 (estimation of
hypothesis)
实例
通过以往大规模调查,已知某地一般新生 儿的头围均数为34.50cm。为研究某矿区 新生儿的发育状况,现从该地某矿区随机 抽取新生儿55人,测得其头围均数为 33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
假设检验的步骤及有关概念
按α=0.05 水准,不拒绝H0 ,两者的差别无统计学意义
附表2 t界值表
二、配对资料的比较
两种情况:1.随机配对设计(randomized
paired design)是将受试对象按某些混杂因素(如性 别、年龄、窝别等)配成对子,每对中的两个个体随 机分配给两种处理(如处理组与对照组);2.或者同 一受试对象作两次不同的处理(自身对照)。
怀疑H0的正确性,从而接受H1。通常选择后 者。本例,可认为该矿区新生儿总体均数与
一般新生儿头围总体均数不同。
例8-2:1995年,某地20岁应征男青年平 均身高为168.5cm。2003年在当地20岁 应征男青年中随机抽取85人,平均身高 为171.2cm,标准差为5.3cm,问这两年 身高是否不同。
t | d | 0.112 0.817, n 1 12 1 11
Sd / n 0.475 / 12
3. 查相应界值表,确定P 值,下结论。 查表t0.05/ 2,11 2.201,t P t , 0.05/ 2,11 >0.05,按α=0.05 水准, 不拒绝 H 0 ,两种方法的测量结果差值无统计学意义。
第八章 假设检验的概念及t检验
统计推断
statistical inference
内容:
总体
抽取部分观察单位 样本
1. 参数估计 (estimation of
假设检验t检验-PPT精品
同质条件:都是鼻咽癌患者 都用相同治疗方法
变异现象:疗效各不相同
(2)随机测量变异:指同一个体重复观测结果未 必相等的现象。
三、概率与频率
1、频率:
某变量值出现的次数(频数)/重复观察的 总次数。
对一个随机事件重复观察时,尽管每进行 n次试验,所得到的频率可能各不相同,但 随着n的增大,频率会逐渐稳定在某个常数 附近波动。
假定正常成年男子的红细胞计数服从正态分布,
总体均数 =5.00(1012/L)、 总体标准差 =0.50(1012/L)。
我们借助计算机从该总体中作随机抽样,每次 抽10名成年男子的红细胞计数组成一个样本, 重复100次抽样。求出每个样本的样本均数和标准
差。
n=10
X1,S
1
= 5.00 =0.50
小概率:P≤0.05或P≤0.01
五、参数与统计量
1、参数:根据总体分布特征而计算的总体 指标。一般用小写的希腊字母表示。
2、统计量:根据样本计算的相应指标(样本 指标)。用拉丁字母表示。
六、假设检验与两类错误
1、假设检验:先对总体的参数或分布作出某 种假设,然后用适当的方法根据样本对总体 提供的信息,运用“小概率原理”推断假设 是否成立。
t0.05 ,139 1 .979 (查表后用内插法求得 )
95 % CI :
( 4 .79 1 .979 0 .42 ,4 .979 1 .979 0 .42 )
140
140
( 4 .72 ,4 .86 )
可信间的两要素:
1、准确度:就是CI包含µ的概率大小;(1-α)值越大, 可信度越高。
P , P 的意思是从正
态总体中随机抽样 , 得样本 t值落在该区
变异现象:疗效各不相同
(2)随机测量变异:指同一个体重复观测结果未 必相等的现象。
三、概率与频率
1、频率:
某变量值出现的次数(频数)/重复观察的 总次数。
对一个随机事件重复观察时,尽管每进行 n次试验,所得到的频率可能各不相同,但 随着n的增大,频率会逐渐稳定在某个常数 附近波动。
假定正常成年男子的红细胞计数服从正态分布,
总体均数 =5.00(1012/L)、 总体标准差 =0.50(1012/L)。
我们借助计算机从该总体中作随机抽样,每次 抽10名成年男子的红细胞计数组成一个样本, 重复100次抽样。求出每个样本的样本均数和标准
差。
n=10
X1,S
1
= 5.00 =0.50
小概率:P≤0.05或P≤0.01
五、参数与统计量
1、参数:根据总体分布特征而计算的总体 指标。一般用小写的希腊字母表示。
2、统计量:根据样本计算的相应指标(样本 指标)。用拉丁字母表示。
六、假设检验与两类错误
1、假设检验:先对总体的参数或分布作出某 种假设,然后用适当的方法根据样本对总体 提供的信息,运用“小概率原理”推断假设 是否成立。
t0.05 ,139 1 .979 (查表后用内插法求得 )
95 % CI :
( 4 .79 1 .979 0 .42 ,4 .979 1 .979 0 .42 )
140
140
( 4 .72 ,4 .86 )
可信间的两要素:
1、准确度:就是CI包含µ的概率大小;(1-α)值越大, 可信度越高。
P , P 的意思是从正
态总体中随机抽样 , 得样本 t值落在该区
医学统计学假设检验原理与t检验
假设检验的两类错误
假设检验的两类错误 • 第Ⅰ类错误(type I error):拒绝原本正 确的H0,导致推断结论的错误。 • 第Ⅱ类错误(type Ⅱ error) : 不拒绝 原本错误的H0,导致推断结论的错误。
推断结论和两类错误 检验结果 实际情况
拒绝H0 ,有差异
H0成立,无差异 H1 成立,有差异
t
d 0 Sd / n
n 1
三、两独立样本均数的假设检验
设计: 将受试对象随机分配成两组,每一组随机接受 一种处理或从不同总体中抽样对比观察其1效 应 目的: 检验两样本代表的总体均数是否有差别
三、两独立样本均数的假设检验
检验假设为 H0:μ1=μ2, H1:μ1≠μ2 已知当H0成立时,检验统计量
u=2.93,说明了什么???
统计量的尾部面积, 即p值
样本计算出来的u值
P值示意图
假设检验基本思想
理解两点:反证法思想、小概率原理
二、假设检验的基本步骤
• 建立检验假设并确定检验水准
• 选择恰当的统计检验方法,计算统计量 • 确定P值,作出推断
推断结论
假设检验的推断结论的出发点是:是否否定H0
推断结论和两类错误实际情况检验结果拒绝有差异不拒绝成立无差异第类错误假阳性结论正确成立有差异结论正确假阴性假设检验中的两类错误当样本量一定时第类错误的概率变小第类错误的概率就变大要同时减少两类错误必须增大样本量n正确理解p值的统计意义两均数比较的假设检验方法一单样本资料的假设检验检验假设大样本时小样本时二配对设计资料的假设检验配对实施的形式主要有
µ ≠72
现在用两个符号来分别代表前面的两个总体, µ 0:1998年大量调查结果:脉搏数的总体均数(72) µ :2018年的脉搏数的造成的 即, µ = µ 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20
2、计算检验统计量
根据分析目的、 资料类型、 设计类型、 根据分析目的 、 资料类型 、 设计类型 、 样 本大小、 本大小 、 方法的适用条件等选择相应的检验方 法并计算检验统计量。 法并计算检验统计量。 所有检验统计量都是在假设 H0 成立的条 件下计算出来的, 件下计算出来的,它是用于决定是否拒绝 H0 的 统计量,其统计分布在统计推断中至关重要。 统计量,其统计分布在统计推断中至关重要。
3
常规方法
新方法
µ0=3min
已知总体
?
未知总体
µ
样本 X = 4m in
判断的目的:是否 判断的目的:是否µ ≠µ0 ?
4
不等, 样本均数 x 与已知总体均数 µ0 不等,可 能 ① 由于抽样误差所致( µ = µ0 两总体均 由于抽样误差所致( 数相等) 数相等)
µ 由于两种治疗方案导致差异( ② 由于两种治疗方案导致差异( ≠ µ0)
23
推断结论(包括统计结论与专业结论 : 推断结论 包括统计结论与专业结论): 包括统计结论与专业结论 P ≤ α ,按α水准,拒绝 H0 ,接受 H1 ,有统 水准, 水准 计学意义(统计结论 可认为……不同或不等 计学意义 统计结论) , 可认为 统计结论 不同或不等 (专业结论 。 专业结论) 专业结论 P >α ,按α水准,不拒绝H0 ,无统计学意义, 水准, 无统计学意义, 水准 不拒绝H 尚不能认为……不同或不等。 不同或不等。 尚不能认为 不同或不等
H0 为无效假设,其假定通常是:某两个 为无效假设,其假定通常是:
(或多个)总体参数相等,或某两个总体参 或多个)总体参数相等, 数之差等于0 数之差等于0。
16
• H1的内容反映了检验的单双侧: 的内容反映了检验的单双侧: • 若H1假设为µ>µ0 或 µ<µ0,则为单侧检验。 假设为µ>µ 则为单侧检验。 • 若H1为µ≠µ0,则为双侧检验。 则为双侧检验。 • 单双侧检验应根据专业知识事先确定。 单双侧检验应根据专业知识事先确定。
28
t 检验的应用条件 检验的应用条件:
单样本t检验中 检验中, 未知且n 较小, ① 单样本 检验中,σ 未知且 较小,样本取自 正态总体; 正态总体; 两小样本均数比较时, ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 布总体,两样本的总体方差相等; 方差不齐可用t’检验; 方差不齐可用 检验; 检验 两大样本均数比较时,可用Z检验 ③ 两大样本均数比较时,可用 检验。
2.5%
2.5%
-tα,ν
0
tα,ν
如果P值较大, 如果 值较大,认为差异由抽样误差所致的 值较大 可能性较大, 可能性较大,故还没有足够的理由拒绝所做的 假设。 假设。即: (1)P≤α:根据小概率事件原理拒绝原假设 。 ) α 根据小概率事件原理拒绝原假设 没有足够的理由拒绝原假设 原假设。 (2) P>α:没有足够的理由拒绝原假设。 ) >
25
回到例子: 回到例子
3.确定 3.确定P值 确定P
界值表, 按自由度 υ = 50 − 1 = 49 ,查t界值表, 界值表 因为4.7140 >3.496 ,所以P<0.001。 因为 。
4. 按α=0.05检验水准,拒绝 0,接受 1,结 检验水准, = 检验水准 拒绝H 接受H
果有统计学意义, 果有统计学意义,可以认为新疗法和常规疗法 在延长锻炼持续时间方面存在差异。 在延长锻炼持续时间方面存在差异。
26
第八章 t 检验
27
假设检验一般以检验统计量命名, 假设检验一般以检验统计量命名, 如 t 检验和 z 检验。 检验。 应用时应了解各种检验方法的应用条 应用时应了解各种检验方法的应用条 和检验统计量的计算方法。 件和检验统计量的计算方法。然后按假设 检验的一般步骤来处理实际问题。 检验的一般步骤来处理实际问题。
32
(1) 建立检验假设,确定检验水准 建立检验假设, H0:µ=3.36,该地农村新生儿体重与该地新生儿平 , 均体重相同 H1:µ≠3.36,该地农村新生儿体重与该地新生儿平 , 均体重不同 α =0.05
33
(2) 计算统计量
µ 已知n=40, x =3.27kg,S=0.44kg, 0 =3.36kg。 已知 , , 。
18
检验水准(size of a test),又称α 水准 是 水准, ③ 检验水准 , 预先规定的概率值, 预先规定的概率值,它确定了小概率事件的 型错误的概率大小。 标准。 标准。 α 为 I 型错误的概率大小。实际工作 的取值并非一成不变, 中常取 α = 0.05。但α的取值并非一成不变, 。 可根据不同研究目的给予不同设置。 可根据不同研究目的给予不同设置。
21
回到例子: 回到例子
2.计算统计量 2.计算统计量
已知µ0= 3min,n=50, X =4min , =
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
22
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表, 相应的界值表,即可得到概率 P。 。 P值是在H 成立前提下, P值是在H0成立前提下,抽得比现有样 值是在 本统计量更极端的统计量值的概率。 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 值越小只能说明:作出拒绝 值越小只能说明 H1的统计学证据越充分。 的统计学证据越充分。
24
假设检验必须对所检验的假设作出明 确判断。 确判断。从“拒绝”或“不拒绝”中选择 拒绝” 不拒绝” 较为合理的决定 一个较为合理的决定,因此, 一个较为合理的决定,因此,假设检验结 论具有概率性。不论拒绝或不拒绝 H0 , 论具有概率性。 都可能犯错误: 型或Ⅱ错误。 都Βιβλιοθήκη 能犯错误:Ⅰ型或Ⅱ错误。29
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 使用范围:用于样本均数与已知总体均数( 般为理论值、标准值或经过大量观察所得的稳 般为理论值、 定值等)的比较。 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 µ 分析目的: 有无差别。 与已知总体均数 µ0有无差别。 • 若 n 较大,则 tα.ν ≈ tα.∞ , 可按算得的 t 值用 v = 较大, ∞ 查 t 界值表 t 即为 Z )得P值。 界值表( 得 值
12
二、假设检验的基本步骤
(1) 建立检验假设,确定检验水准 建立检验假设, (2) 选定检验方法,计算检验统计量 选定检验方法, (3) 确定 值 确定P值 (4) 作出统计推断
13
1、建立检验假设,确立检验水准。 、建立检验假设,
检验假设(hypothesis under test / to be tested) ① 检验假设 无效假设 (null hypothesis) H0: µ=µ0 备择假设(alternative hypothesis) ② 备择假设 对立假设 H1: µ≠µ0 µ
14
检验假设是针对总体而非样本; 检验假设是针对总体而非样本;假设 针对总体而非样本 检验的基本目的就是分辨两个样本是否属 一个总体或两个不同的总体, 一个总体或两个不同的总体,并对总体作 出适当的结论; 出适当的结论;
15
H0 和 H1 是相互联系、对立的假设,两者 是相互联系、对立的假设,
缺一不可; 缺一不可;
10
假设检验的原理
• 反证法思想 • 小概率事件原理
11
从反面提出一个假设( 从反面提出一个假设(H0) ,在假设成立的条 件下,看看得到现有样本的可能性有多大? 件下,看看得到现有样本的可能性有多大? – P< P<0.05,(小概率事件 可能性很小),在一 ,(小概率事件 可能性很小), ,(小概率事件,可能性很小),在一 次试验中本不该得到,居然得到了, 次试验中本不该得到,居然得到了,说明我们 的假设有问题,拒绝之。 的假设有问题,拒绝之。 – P> P>0.05(不是小概率事件,有可能得到手头的 (不是小概率事件, 结果), ),故根据现有的样本无法拒绝事先的假 结果),故根据现有的样本无法拒绝事先的假 没理由) 设(没理由)
19
回到例子: 回到例子
1.建立假设, 1.建立假设,确定检验水准 建立假设
H0: µ= µ0=3min,新疗法使患者锻炼持 , 续时间的平均增加量等于常规疗法; 续时间的平均增加量等于常规疗法; H1: µ≠ µ0,新疗法使患者锻炼持续时间的 平均增加量不等于常规疗法; 平均增加量不等于常规疗法; 双侧α= 双侧 =0.05
5
假设µ 假设µ=µ0,即假设该样本来自于 的总体, µ0=3 min的总体,那么由于抽样的 的总体 偶然性得到样本均数等于及大于 偶然性得到样本均数等于及大于 4min的可能性有多大? 的可能性有多大?
6
常规方法
新方法
µ0=3min
P?
已知总体
=
未知总体
µ
样本 X = 4m in
7
接近, 如果 x 与µ0接近,其差别可用抽样误差解 来自µ 总体; 释,可认为 x来自µ0总体 相差甚远, 如果 x 和µ0相差甚远,不宜用抽样误差解 释,则怀疑 x 不是来自µ0总体。 不是来自µ 总体。 那么 x µ0相差多大算是由抽样误差造成 与 值或z值求得 值来推断。 的?通过t值或 值求得 值来推断。 通过 值或 值求得P值来推断
8
X −µ X −µ 用公式:t = 或z = SX σX
相差较远, 或 值就大 值就大, 值就小 值就小, 如果 X 与 µ 0 相差较远,t或z值就大,P值就小, 小到一定的α界值时 当P小到一定的 界值时,则称为小概率事件, 即在 小到一定的 界值时,则称为小概率事件, 一次抽样中发生的可能性就很小,如果发生了,则有 一次抽样中发生的可能性就很小,如果发生了, 理由怀疑原假设µ=µ0 可能不成立。 可能不成立。 理由怀疑原假设
2、计算检验统计量
根据分析目的、 资料类型、 设计类型、 根据分析目的 、 资料类型 、 设计类型 、 样 本大小、 本大小 、 方法的适用条件等选择相应的检验方 法并计算检验统计量。 法并计算检验统计量。 所有检验统计量都是在假设 H0 成立的条 件下计算出来的, 件下计算出来的,它是用于决定是否拒绝 H0 的 统计量,其统计分布在统计推断中至关重要。 统计量,其统计分布在统计推断中至关重要。
3
常规方法
新方法
µ0=3min
已知总体
?
未知总体
µ
样本 X = 4m in
判断的目的:是否 判断的目的:是否µ ≠µ0 ?
4
不等, 样本均数 x 与已知总体均数 µ0 不等,可 能 ① 由于抽样误差所致( µ = µ0 两总体均 由于抽样误差所致( 数相等) 数相等)
µ 由于两种治疗方案导致差异( ② 由于两种治疗方案导致差异( ≠ µ0)
23
推断结论(包括统计结论与专业结论 : 推断结论 包括统计结论与专业结论): 包括统计结论与专业结论 P ≤ α ,按α水准,拒绝 H0 ,接受 H1 ,有统 水准, 水准 计学意义(统计结论 可认为……不同或不等 计学意义 统计结论) , 可认为 统计结论 不同或不等 (专业结论 。 专业结论) 专业结论 P >α ,按α水准,不拒绝H0 ,无统计学意义, 水准, 无统计学意义, 水准 不拒绝H 尚不能认为……不同或不等。 不同或不等。 尚不能认为 不同或不等
H0 为无效假设,其假定通常是:某两个 为无效假设,其假定通常是:
(或多个)总体参数相等,或某两个总体参 或多个)总体参数相等, 数之差等于0 数之差等于0。
16
• H1的内容反映了检验的单双侧: 的内容反映了检验的单双侧: • 若H1假设为µ>µ0 或 µ<µ0,则为单侧检验。 假设为µ>µ 则为单侧检验。 • 若H1为µ≠µ0,则为双侧检验。 则为双侧检验。 • 单双侧检验应根据专业知识事先确定。 单双侧检验应根据专业知识事先确定。
28
t 检验的应用条件 检验的应用条件:
单样本t检验中 检验中, 未知且n 较小, ① 单样本 检验中,σ 未知且 较小,样本取自 正态总体; 正态总体; 两小样本均数比较时, ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 布总体,两样本的总体方差相等; 方差不齐可用t’检验; 方差不齐可用 检验; 检验 两大样本均数比较时,可用Z检验 ③ 两大样本均数比较时,可用 检验。
2.5%
2.5%
-tα,ν
0
tα,ν
如果P值较大, 如果 值较大,认为差异由抽样误差所致的 值较大 可能性较大, 可能性较大,故还没有足够的理由拒绝所做的 假设。 假设。即: (1)P≤α:根据小概率事件原理拒绝原假设 。 ) α 根据小概率事件原理拒绝原假设 没有足够的理由拒绝原假设 原假设。 (2) P>α:没有足够的理由拒绝原假设。 ) >
25
回到例子: 回到例子
3.确定 3.确定P值 确定P
界值表, 按自由度 υ = 50 − 1 = 49 ,查t界值表, 界值表 因为4.7140 >3.496 ,所以P<0.001。 因为 。
4. 按α=0.05检验水准,拒绝 0,接受 1,结 检验水准, = 检验水准 拒绝H 接受H
果有统计学意义, 果有统计学意义,可以认为新疗法和常规疗法 在延长锻炼持续时间方面存在差异。 在延长锻炼持续时间方面存在差异。
26
第八章 t 检验
27
假设检验一般以检验统计量命名, 假设检验一般以检验统计量命名, 如 t 检验和 z 检验。 检验。 应用时应了解各种检验方法的应用条 应用时应了解各种检验方法的应用条 和检验统计量的计算方法。 件和检验统计量的计算方法。然后按假设 检验的一般步骤来处理实际问题。 检验的一般步骤来处理实际问题。
32
(1) 建立检验假设,确定检验水准 建立检验假设, H0:µ=3.36,该地农村新生儿体重与该地新生儿平 , 均体重相同 H1:µ≠3.36,该地农村新生儿体重与该地新生儿平 , 均体重不同 α =0.05
33
(2) 计算统计量
µ 已知n=40, x =3.27kg,S=0.44kg, 0 =3.36kg。 已知 , , 。
18
检验水准(size of a test),又称α 水准 是 水准, ③ 检验水准 , 预先规定的概率值, 预先规定的概率值,它确定了小概率事件的 型错误的概率大小。 标准。 标准。 α 为 I 型错误的概率大小。实际工作 的取值并非一成不变, 中常取 α = 0.05。但α的取值并非一成不变, 。 可根据不同研究目的给予不同设置。 可根据不同研究目的给予不同设置。
21
回到例子: 回到例子
2.计算统计量 2.计算统计量
已知µ0= 3min,n=50, X =4min , =
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
22
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表, 相应的界值表,即可得到概率 P。 。 P值是在H 成立前提下, P值是在H0成立前提下,抽得比现有样 值是在 本统计量更极端的统计量值的概率。 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 值越小只能说明:作出拒绝 值越小只能说明 H1的统计学证据越充分。 的统计学证据越充分。
24
假设检验必须对所检验的假设作出明 确判断。 确判断。从“拒绝”或“不拒绝”中选择 拒绝” 不拒绝” 较为合理的决定 一个较为合理的决定,因此, 一个较为合理的决定,因此,假设检验结 论具有概率性。不论拒绝或不拒绝 H0 , 论具有概率性。 都可能犯错误: 型或Ⅱ错误。 都Βιβλιοθήκη 能犯错误:Ⅰ型或Ⅱ错误。29
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 使用范围:用于样本均数与已知总体均数( 般为理论值、标准值或经过大量观察所得的稳 般为理论值、 定值等)的比较。 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 µ 分析目的: 有无差别。 与已知总体均数 µ0有无差别。 • 若 n 较大,则 tα.ν ≈ tα.∞ , 可按算得的 t 值用 v = 较大, ∞ 查 t 界值表 t 即为 Z )得P值。 界值表( 得 值
12
二、假设检验的基本步骤
(1) 建立检验假设,确定检验水准 建立检验假设, (2) 选定检验方法,计算检验统计量 选定检验方法, (3) 确定 值 确定P值 (4) 作出统计推断
13
1、建立检验假设,确立检验水准。 、建立检验假设,
检验假设(hypothesis under test / to be tested) ① 检验假设 无效假设 (null hypothesis) H0: µ=µ0 备择假设(alternative hypothesis) ② 备择假设 对立假设 H1: µ≠µ0 µ
14
检验假设是针对总体而非样本; 检验假设是针对总体而非样本;假设 针对总体而非样本 检验的基本目的就是分辨两个样本是否属 一个总体或两个不同的总体, 一个总体或两个不同的总体,并对总体作 出适当的结论; 出适当的结论;
15
H0 和 H1 是相互联系、对立的假设,两者 是相互联系、对立的假设,
缺一不可; 缺一不可;
10
假设检验的原理
• 反证法思想 • 小概率事件原理
11
从反面提出一个假设( 从反面提出一个假设(H0) ,在假设成立的条 件下,看看得到现有样本的可能性有多大? 件下,看看得到现有样本的可能性有多大? – P< P<0.05,(小概率事件 可能性很小),在一 ,(小概率事件 可能性很小), ,(小概率事件,可能性很小),在一 次试验中本不该得到,居然得到了, 次试验中本不该得到,居然得到了,说明我们 的假设有问题,拒绝之。 的假设有问题,拒绝之。 – P> P>0.05(不是小概率事件,有可能得到手头的 (不是小概率事件, 结果), ),故根据现有的样本无法拒绝事先的假 结果),故根据现有的样本无法拒绝事先的假 没理由) 设(没理由)
19
回到例子: 回到例子
1.建立假设, 1.建立假设,确定检验水准 建立假设
H0: µ= µ0=3min,新疗法使患者锻炼持 , 续时间的平均增加量等于常规疗法; 续时间的平均增加量等于常规疗法; H1: µ≠ µ0,新疗法使患者锻炼持续时间的 平均增加量不等于常规疗法; 平均增加量不等于常规疗法; 双侧α= 双侧 =0.05
5
假设µ 假设µ=µ0,即假设该样本来自于 的总体, µ0=3 min的总体,那么由于抽样的 的总体 偶然性得到样本均数等于及大于 偶然性得到样本均数等于及大于 4min的可能性有多大? 的可能性有多大?
6
常规方法
新方法
µ0=3min
P?
已知总体
=
未知总体
µ
样本 X = 4m in
7
接近, 如果 x 与µ0接近,其差别可用抽样误差解 来自µ 总体; 释,可认为 x来自µ0总体 相差甚远, 如果 x 和µ0相差甚远,不宜用抽样误差解 释,则怀疑 x 不是来自µ0总体。 不是来自µ 总体。 那么 x µ0相差多大算是由抽样误差造成 与 值或z值求得 值来推断。 的?通过t值或 值求得 值来推断。 通过 值或 值求得P值来推断
8
X −µ X −µ 用公式:t = 或z = SX σX
相差较远, 或 值就大 值就大, 值就小 值就小, 如果 X 与 µ 0 相差较远,t或z值就大,P值就小, 小到一定的α界值时 当P小到一定的 界值时,则称为小概率事件, 即在 小到一定的 界值时,则称为小概率事件, 一次抽样中发生的可能性就很小,如果发生了,则有 一次抽样中发生的可能性就很小,如果发生了, 理由怀疑原假设µ=µ0 可能不成立。 可能不成立。 理由怀疑原假设