第三节 均数假设检验的基本方法(一)
假设检验1
µ
未知总体
x =74.2次/分 S=6.5次/分
差异的原因:
(1)由于抽样误差造成的.(实际上 0 ,但 由于抽样误差 不能很好代表 0 )
(2)该地成年男性的脉搏与正常成年男性脉搏均数
不同( 0 )
假设检验的目的就是判断差异的原因:
求出由抽样误差造成此差异的可能性(概率P) 有多大 !
医学院
王丽华
(一)假设检验的基本思想
例1 某医生在一山区随机抽查了25名健康成年 男性的脉搏,其均数为 74.2 次 / 分,标准差为 6.5次/分。已知正常成年男性脉搏的均数为72
次 / 分。试问能否认为该山区健康成年男子的
脉搏数与一般健康成年男子的脉搏数不同?
µ 0 =72次/分
已知总体
样本
例2
已知某小样本中含CaCO3的真值是
20.7mg/L。现用某法重复测定该小样本15
次,CaCO3含量(mg/L)分别为:20.99,
20.41,20.62, 20.75,20.10,20.00,
20.80,20.91,22.60,22.30,20.99,
20.41,20.50, 23.00,22.60。问该法测
n 1 25 1 24
(3)确定P值,作出推断结论
确定P 值:
(用求出的t 值与查表查出的t 值比较)
n 10, n 1 10 1 9 查t 值表:
P>0.05 P<0.01
t0.05,9 2.262, t0.01,9 3.250
(1) 求出t=1.833, (2) 求出t=4.18, (3) 求出t=2.96, (4) 求出t=3.25,
( t 越大,P 越小)
假设检验的基本方法
假设检验的基本方法假设检验是统计学中常用的一种方法,用于检验某个假设是否成立。
它可以帮助我们判断样本数据与总体数据之间的关系,从而做出合理的推断和决策。
在进行假设检验时,我们需要遵循一定的步骤和方法,以确保结果的可靠性和准确性。
首先,假设检验的基本步骤包括,建立假设、选择显著性水平、计算统计量、做出决策。
建立假设是假设检验的第一步,通常分为原假设和备择假设。
原假设是对总体参数的某种断言,而备择假设则是对原假设的补充或对立假设。
选择显著性水平是指在假设检验中规定的判断标准,通常取0.05或0.01。
计算统计量是根据样本数据计算出的用于检验假设的统计量,它可以帮助我们判断样本数据与假设之间的差异程度。
最后,根据计算出的统计量和显著性水平,我们可以做出接受原假设或拒绝原假设的决策。
其次,假设检验的方法主要包括,参数检验和非参数检验。
参数检验是指对总体参数进行假设检验,常用的方法有Z检验、t检验、F检验等。
Z检验适用于大样本的均值差异检验,t检验适用于小样本的均值差异检验,F检验适用于方差的检验。
非参数检验是指对总体分布形式进行假设检验,常用的方法有秩和检验、符号检验、卡方检验等。
非参数检验不对总体参数作出假设,适用于总体分布未知或不满足正态分布的情况。
最后,假设检验的应用范围非常广泛,可以用于医学、经济、社会科学等领域。
在医学领域,假设检验可以用于药物疗效的评价和临床试验结果的分析;在经济领域,假设检验可以用于市场调查和投资决策的制定;在社会科学领域,假设检验可以用于调查问卷的分析和社会现象的研究。
总之,假设检验是统计学中非常重要的方法,它可以帮助我们进行科学的推断和决策。
在实际应用中,我们需要根据具体情况选择合适的假设检验方法,并严格遵循假设检验的基本步骤,以确保结果的可靠性和准确性。
希望本文对假设检验方法有所帮助,谢谢阅读!。
总体均数的假设检验
$number {01}
目 录
• 引言 • 假设检验的基本原理 • 总体均数的假设检验方法 • 实例分析 • 总结与展望
01 引言
目的和背景
确定样本数据是否与假设的总体均数 存在显著差异,从而对总体均数进行 假设检验。
在科学实验、统计学、医学研究等领 域广泛应用,用于评估样本数据是否 支持或拒绝关于总体均数的假设。
配对样本均数假设检验实例
总结词
配对样本均数假设检验用于比较同一组研究对象在不同条件下的均数是否存在统计学显 著性差异。
详细描述
例如,为了比较同一组患者在接受两种不同治疗措施前后的改善程度,研究者收集了患 者的基线数据和接受不同治疗措施后的数据,并计算出各自治疗组的平均改善程度。然 后,研究者使用配对样本均数假设检验来比较同一组患者在不同治疗措施下的平均改善
概念简介
假设检验是一种统计推断方法,通过 检验样本数据是否符合某个假设,从 而对总体参数进行推断。
它基于概率论原理,通过计算样本数 据与假设的总体参数之间的差异,评 估这种差异是否具有统计学上的显著 性。
02
假设检验的基本原理
假设检验的步骤
建立假设
根据研究目的,提出一个关于总 体参数的假设,通常包括零假设 和备择假设。
收集样本数据
从总体中随机抽取一定数量的样 本,并记录样本数据。
确定检验水准
选择合适的检验水准,如α和β, 以平衡第一类和第二类错误的概 率。
计算统计量
根据样本数据计算适当的统计量, 如t值、Z值或χ^2值。
假设检验的类型
1 2
3
单样本均数检验
比较一个样本均数与已知总体均数或正常值范围。
两样本均数比较
假设检验的定义和步骤
假设检验的定义和步骤
假设检验是统计学中一种常用的推断方法,用于判断样本数据
是否支持对总体参数的某个假设。
通过对样本数据进行分析,假设
检验可以帮助我们判断我们所做的假设是否合理,并据此对总体参
数进行推断。
假设检验的步骤通常包括以下几个步骤:
1. 提出假设,首先,我们需要明确提出一个关于总体参数的假设,通常包括原假设(H0)和备择假设(H1)两种。
2. 选择检验统计量,根据所提出的假设,选择适当的检验统计量,该统计量应能够在原假设成立时具有已知的概率分布。
3. 确定显著性水平,确定显著性水平(α),即拒绝原假设的
概率阈值。
通常选择0.05作为显著性水平。
4. 计算统计量的值,利用样本数据计算出所选检验统计量的值。
5. 做出决策,根据检验统计量的值和显著性水平,做出决策,
即是拒绝原假设还是不拒绝原假设。
6. 得出结论,根据做出的决策,得出对原假设的结论,判断样本数据是否支持原假设。
总的来说,假设检验是一种通过对样本数据进行统计分析,以判断对总体参数的假设是否成立的方法。
通过严格的步骤和逻辑推理,假设检验可以帮助我们做出合理的推断和决策。
医学统计学总体均数的估计与假设检验
三、 总体均数的估计
(1)点估计: X µ (2)区间估计:
按一定的概率(1 - )估计总体均数所在范围 (或称可信区间),常用95%和99%的概率估计。
1)当未知时
x t /2, Sx , x t,/2 Sx
例2.12 11名18岁男大学生身高得均数 172.25厘米,标准差3.31厘米,试估计该地 18岁男大学生总体身高均数的95%可信区间。
结论:按照 = 0.05水准,拒绝H0 ,故可 认为该山区健康成年男子脉搏高于一般人群。
上例如用双侧检验,查表得双侧 t0.05,24 = 2.064
则: t =1.833< t0.05,24 , P > 0.05。 结论相反。
单侧检验效率要高于双侧检验。 如何选择单侧或双侧检验? 主要根据专业知识而定。 如某指标只高不低或只低不高。
分析两均数不等的原因有两种可能性:
(1)仅仅由于抽样误差所致; (2)除抽样误差外还由于环境条件的影响。
如何判断? 统计上是通过假设检验来回答这个问题。 (1)建立假设:
H0: (检验假设或无效假设) 总体参数相等 为什么称其为无效假设?
H1: (备择假设) 总体参数不等
(2)确立检验水准 指拒绝实际上成立 H0 的所犯错误的概率
被测者编号 ⑴
1 2 3 4 5 6 7 8 9 10 11 12
Wright 法 ⑵
490 397 512 401 470 415 431 429 420 275 165 421
Mini 法
d
⑶
(4)
525
35
415
18
508
-4
444
43
500
30
460
第三章 总体均数的估计与假设检验
Sd
d
d Sd / n
2
(
d)
n
n 1
S d 0.1087 t 2.7424 0.1087/ 10 7.925
v 10 1 9
3)确定P值,作出推断结论 T0.05,9=2.262, 7.925>2.262,故P<0.05.可以认为两种 方法对脂肪含量的测定结果不同。
167.41, 2.74
165.56, 6.57
168.20, 5.36 n j=10
…. 165.69, 5.09
将上述100个样本均数看成新变量值,则这个 100个样本均数构成一新分布,绘制直方图
样本均数的抽样分布具有如下特点:
1) 各样本均数未必等于总体均数
2) 各样本均数间存在差异
3) 样本均数的分布很有规律,围绕着总体均 数,中间多,两边少,左右基本对称,也 服从正态分布
假设检验的基本步骤:
1、建立检验假设
H0: 检验假设, 无效假设,零假设 μ=μ0
H1: 备择假设,对立假设
μ≠μ0
2、确定检验水准 α=0.05 单双侧
3、选定检验方法和计算检验统计量
4、确定P值和作出推论结论。
P值是指从H0所规定的总体进行随机抽样,获 得大于(或等于及小于)现有样本获得的检验 统计量值的概率。
(1012/L)
血红蛋白 (g/L)
女
男 女
255
360 255
4.18
134.5 117.6
0.29
7.1 10.2
4.33
140.2 124.7
*标准值:使用内科学(1976年)所载均数(转位法定单位)
1)说明女性的红细胞数与血红蛋白的变异程度何者为大? 2)抽样误差是? 3)试估计该地健康成年女性红细胞数的均数? 4) 该地健康成年男女血红蛋白含量是否不同? 5)该地男性两项血压指标是否均低于上表的标准值(若测 定方法相同)?
总体均数的假设检验
n 1 n 2 2 1 2 1 2 2 2 2
(3) 确定P值,作出统计推断
查附表3 , t界值表,
0.002<P<0.005,按=0.05水准拒 绝H0,接受H1,差异有统计学意
义,可认为…..
方差齐性检验
F
S12(较大) S22(较小)
1 n1 1 2 n2 1
总体方差不等时处理方式
H0
160 样本均值
P (t≥4.841)
0 t=4.841 t分布
若只考虑单侧,P值就是统计量t≥4.841的概率
QUESTION
如果考虑双侧,即回答例7.3的问题, P是什么?
结论
➢若P≤,表示在H0成立的条件下,出现等
于及大于(或等于及小于)现有统计量的概 率是小概率,按小概率事件原理现有样本
P93例8.3
某医生研究血清白介素-6(IL-6)与银屑病的 关系,收集了12例处于进行期的银屑病患者 及12例正常人的血清标本进行IL-6检测,得 到表8.2结果,问银屑病患者与正常人的血 清IL-6均数是否不同?
未知总体 1 ?
(银屑病患者)
未知总体 2 (正常人)
样本1
X1 182.4
样本2
I 型错误与II 型错误(p85)
拒绝了实际上成立的H0,这类“弃真” 的错误为I 型错误(type I error);
不拒绝实际上不成立的H0,这类“存伪” 的错误为II 型错误(type II error)。
0.08
0.06 0.04
=0
0.02 0 40
,
60
X80
100
120
0.07 0.06 0.05 0.04 0.03 0.02 0.01
个和两个总体平均数的假设检验
设第二个总体为 的 2, 平方 均差 数 22为 ,
由该总体抽取量 了为 n一 2的个 样含 本, 样本平均X2数 ,为 样本方S2差 2;为
1,X 1
2,X 2
1 2?
X1 X2 ?
5. 2 两个总体平均数的比较
1.配对实验设计:
指先将实验单位按配对的要求两两配对,然后 将每一个对子内的两个实验单位独立随机地分配到 两个处理组中。
配对的要求是,配成对子的两个实验单位的初 始条件应尽量一致,不同实验对子之间,实验单位 的初始条件可以有差异。
每一个对子就是实验的一次重复。
我们将实验单位分为两组的方式称为配对实验 设计。
3. 配对实验的检验步骤:
(1)无效假设H0 :μd=μ1-μ2 =0 备择假设HA :μd≠0,即μ1-μ2 ≠0
配对实验时,两组的实验单位数即两个样本的观 察值数目相等,n1=n2。但是反过来,两个样本 观察值相等的实验则不一定是配对实验。
判断配对实验的根据不是两个样本的观察值是否 相等,而是分组的方式。
在配对实验设计中,由于实验单位是两两配对的, 因此观察值也是两两配对的。
2.实验结果表示为:
处理
1 2
F
S12 S22
查F表,确定临界值,接 受或者拒绝H0
如果检验结果不显著,接受零假设σ12=σ22, 那么还按照前一种t检验进行检验。
如果检验结果显著,接受备择假设σ12 ≠ σ22,
那么按照下面的t检验方法进行检验。
tX1X2 X1X2 X1X2
s x1x2
s2 s2
x1
x2
s12/n1s22/n2
第三节 均数假设检验的基本方法(二)
2
1 2
其中:
S X1 X 2
Sc
2(
1
n1
1)
n2
Sc2 x12
x1
2 n1 x22 n1 n2 2
x2
2
n2
两独立样本t检验原理
Sc2称为合并方差(combined/pooled variance),上述公式可
用于已知两样本观察值原始资料时计算,当两样本标准差S1和 S2已知时,合并方差Sc2为:
F
S12
S
2 2
12
1 2
n1
n1 1
2.707
22
2 2
n2
n2 1
1 n1 1 12, 2 n2 1 11
确定P值,作出推断结论
查F界值表,F0.05(12,11)=2.79. 2.707<F0.05(12,11), 故
p >0.05, 尚不能拒绝H0,差异没有统计学意义,故可
Sc2
(n1
1)S12 (n2 1)S22 n1 n2 2
实例分析
25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙 组采用药物治疗合并饮食疗法,二个月后测空腹血糖 (mmol/L)如表5-2 所示,问两种疗法治疗后患者血糖值是 否相同?
表 5-2 25 名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L)
三、两独立样本均数的t检验
两独立样本t 检验(two independent samples t-test),又称成组 t 检验。
适用于完全随机设计的两样本均数的比较,其目的是检验 两样本所来自总体的均数是否相等。
完全随机设计是将受试对象随机地分配到两组中,每组对 象分别接受不同的处理,分析比较处理的效应。或分别从 不同总体中随机抽样进行研究。
假设检验的基本步骤
假设检验的基本步骤(三)假设检验的基本步骤统计推断1.建立假设检验,确定检验水准H0和H1假设都是对总体特征的检验假设,相互联系且对立。
H0总是假设样本差别来自抽样误差,无效/零假设H1是来自非抽样误差,有单双侧之分,备择假设。
检验水准,a=0.05检验水准的含义2.选定检验方法,计算检验统计量选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题,一般计量资料用t检验和u检验;计数资料用χ2检验和u检验。
3.确定P值,作出统计推理P≤a ,拒绝H0,接受H1P> a,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误(四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论)u检验适用条件t检验适用条件t检验和u检验1.样本均数与总体均数比较2.配对资料的比较/成组设计的两样本均数的比较配对设计的情况:3点3. 两个样本均数的比较(1)两个大样本均数比较的u检验(2)两个小样本均数比较的t检验(五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误)1.两类错误拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误;接受错误的H0称Ⅱ型错误-存伪。
用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。
两者的关系:α愈大β愈小;反之α愈小β愈大。
2.假设检验中的注意事项(1)随机化:代表性和均衡可比性(2)选用适当的检验方法(3)正确理解统计学意义(4)结论不绝对(5)单侧与双侧检验的选择四.分类变量资料的统计描述(一)相对数常用指标及其意义1.率2.构成比3.相对比(二)相对数应用注意事项1.观察例数要足够多2.不能犯以比代率的错误3.计算加权平均率或合并率4.可比性,消除混杂因素的影响(可采用标准化方法或分层分析方法。
第三节 样本频率的假设检验.
误的可能性更小,只有 0.01。
第二类错误 如果 H。不是真实的,假设检验时却接受了 H0 否定了 HA , 这样就犯了接受不真实的错误,这类错误叫第二类错误, 或称β错误,亦称纳伪错误。
μ 1 = μ0
μ 1 ≠ μ0
图5-2 两类错误示意图
第一类错误和第二类错误的关系:
区别:第一类错误只有在 否定H0 时才会发生 第二类错误只有在接受 H0 时才会发生。 联系:在样本容量相同的情况下,第一类错误减少,第二类错 误就会增加;反之第二类错误减少,第 一类错误就会增加 大小 犯第一类错误的大小恰好等于显著水平,而犯第二类错 误的大小用表示。 客观实际 否定 H0 接受H0
但如果样本容量增加,则两类错误的概率都可减小。当
固定时,单尾测验的小于双尾测验的。
图5-2 两类错误示意图
(3) 在计算正态离差 u 时,总体平均数 μ 和样本平均数
之间
的差值不是随意能够进行主观改变,但在试验研究中, 却
是可以减小的。从理论上讲,可通过精密的试验设计和增 大样本容量而减小到接近 0 的程度,这样正态分布中接受 区就变得十分狭窄, μ 和 之间的差别就比较容易发现, 所以减小 是减少两类错误的关键。
二、双尾检验与单尾检验
进行假设检验提出无效假设和备择假设时,其总体平均数μ
可能大于 μ0,也可能小于 μ0 在样本平均数的抽样分布中 当 α = 0.05时,落在区间 的 有95%,落在这一区间之外的只有5%。
当 α= o.o1时 ,落在区间
落在这一区间之外的只有 1%。
的
有 99%,
在进行假设检验时,前者相当于接受的区域,称为接受区; 后者相当于否定的区域,称为否定区。
已知 P(︱u︱>1.96)= 0· 05 P( ︱u︱ >2.58)= 0.01 u分布进行检验时 if︱u︱>1.96,在 a = 0.05 的水平上达到显著 if ︱u︱>2.58,在 a= 0.01 的水平上达到极显著水平
均数假设检验的基本步骤
均数假设检验的基本步骤
均数假设检验是数据分析中一种常用的统计检验方法,它可以用来检验某一总体数据的均值是否与预先根据实际情况所建立的一个均值假设进行比较。
均数假设检验的基本步骤如下:
1. 确定总体参数:首先,确定检验的总体参数,其中可包括总体的均数μ、总体的方差σ、总体的规模n等多种参数;
2. 建立假设:其次,将以上总体参数转化为假设,如均数假设,即μ0=μ,μ0为假设的均数,μ为实际的总体均数;
3. 检验统计量:然后,根据检验的假设类型,选取相应的检验统计量,通常采用Z统计量
来检验均数假设;
4. 计算临界值:接着,根据所采用的检验统计量,根据拒绝域理论计算出相应的临界值;
5. 检验:最后,结合样本数据,运用检验统计量及临界值,做出检验结论,即根据检验统计量的值与临界值的比较,得出是拒绝原假设还是不拒绝原假设。
以上是均数假设检验的基本步骤,必要时还需要根据假设的类型,重复上述步骤,进行进
一步的检验;也可以根据样本数据特点,采用其它更契合的统计检验方法,以得出精准有
效的检验结论。
统计学--第三章总体均数的估计与假设检验
总体均数的估计 与假设检验
课件
1
统计推断的目的:
用样本的信息去推论总体。
医学研究中大多数是无限总体, 即使是有限总体,但也经常受各种条 件的限制,不可能直接获得总体的信 息。
课件本科生卫生学(5)
2
第一节 均数的抽样误差与标准误
• 抽样误差(sampling
error):因各样本 包含的个体不同,所得的各个样本统计量 (如均数)往往不相等,这种由于个体差 异和抽样造成的样本统计量与总体参数的 差异,称为抽样误差。
均数的95%可信区间为3.47~ 3.81(mmol / L) 95%参考值范围为1.29~ 5.99(mmol / L)
S 1.20 X u / 2 S X X 1.96 3.64 1.96 n 200 (3.47, 3.81)
X 1.96S 3.64 1.961.20 (1.29, 5.99) 32 课件本科生卫生学(5)
t分布的应用: 总体均数的区间估计 t检验
课件本科生卫生学(5) 18
第三节 总体均数的置信区间估计 confidence interval
可信区间的概念 总体均数可信区间的计算 均数可信区间与参考值范围的区别
课件本科生卫生学(5)
19
一、可信区间的概念
统计推断:参数估计与假设检验。 参数估计: parametric estimation,用样本统 计量估计总体参数的方法。 点(值)估计:point estimation,直接用样 本统计量作为总体参数的估计值。方法简 单但未考虑抽样误差大小。 区间估计:interval estimation,按预先给定 的概率95%,或(1-),确定的包含未知总 体参数的可能范围。考虑了抽样误差。
假设检验的基本方法
假设检验的基本方法假设检验是统计学中常用的一种方法,用于判断样本数据对于某个假设的支持程度。
在进行假设检验时,我们通常会先提出一个原假设(null hypothesis),然后收集样本数据,利用统计方法来判断这些数据对原假设的支持程度。
如果样本数据与原假设相悖,我们就会拒绝原假设,否则我们就会接受原假设。
接下来,我将介绍假设检验的基本方法。
首先,我们需要明确原假设和备择假设。
原假设通常是我们想要进行检验的假设,而备择假设则是与原假设相对立的假设。
在进行假设检验时,我们通常会利用样本数据来判断原假设是否成立,从而间接地判断备择假设的成立情况。
其次,我们需要选择适当的假设检验方法。
常见的假设检验方法包括Z检验、T检验、卡方检验等。
在选择假设检验方法时,我们需要根据样本数据的类型和假设的具体情况来进行选择,以确保检验结果的准确性和可靠性。
接着,我们需要确定显著性水平。
显著性水平通常用α表示,它代表了我们在进行假设检验时所允许的错误率。
一般情况下,我们会将显著性水平设定为0.05,这意味着我们允许在5%的情况下犯错,接受备择假设而拒绝原假设,或者接受原假设而拒绝备择假设。
最后,我们进行假设检验的计算。
在进行计算时,我们需要利用样本数据的统计量(如均值、标准差等)来计算检验统计量,然后将其与相应的分布进行比较,从而得出检验的结论。
在进行计算时,我们需要注意选择适当的检验统计量和分布,以确保检验结果的准确性和可靠性。
总之,假设检验是统计学中一种重要的推断方法,它能够帮助我们判断样本数据对于某个假设的支持程度。
在进行假设检验时,我们需要明确原假设和备择假设,选择适当的假设检验方法,确定显著性水平,并进行相应的计算。
通过合理地进行假设检验,我们能够更加准确地判断假设的成立情况,为科学研究和决策提供可靠的依据。
假设检验(完整)
抽样分布
置信水平
1 -
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1 -
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
• 1. 第Ⅰ类错误(弃真错误)
x
~ N (0,1) s/ n
x ~ t(n 1)
s/ n
非正态分布 大样本 x ~ N (0,1) / n
x ~ N (0,1)
s/ n
非正态小样本情形不讨论。
3、拒绝域和接受域的确定
(双侧检验 )
抽样分布
拒绝H0
/2
1 -
置信水平 拒绝H0
/2
拒绝域
临界值
临界值
0 接受域
样本统计量 拒绝域
关统计) 6、《红楼梦》后40回作者的鉴定(文学统计)。 7、民间借贷的利率为多少?(金融统计) 8、兴奋剂检测(体育统计)
1、假设检验的基本思想
为研究某山区的成年男子的脉搏均数是否高于一般 成年男子脉搏均数,某医生在一山区随机抽查了25名 健康成年男子,得其脉搏均数x为74.2次/分,标准差 为6.0次/分。根据大量调查已知一般健康成年男子脉 搏均数为72次/分,能否据此认为该山区成年的脉搏 均数μ高于一般成年男子的脉搏均数μ0?
– 原假设为真时拒绝原假设
– 第Ⅰ类错误的概率记为
• 被称为显著性水平
• 2. 第Ⅱ类错误(取伪错误)
– 原假设为假时未拒绝原假设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、单样本均数的t检验
• 又称单样本均数t检验(ONE SAMPLE t TEST),适用于样本均数与已 知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均 数μ是否与已知总体均数μ0有差别。
• 已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳
均数的标准差——标准误
µ
x3
x1 s x2
xs
µ
x1
s x3 x
x2
x sx
可知:每一个样本均数与不一定相等,它 们之差别是由抽样所造成的;另外,这100 个样本均数大小也不尽相同,它们之间的 变异程度可以用样本均数的标准差来表示 ,即标准误(为了与反映个体变异的标准差 相区别)
参数估计
➢ 点估计---用 x 估计
22
基本步骤
本例为计量资料小样本均数与总体均数的比较,选 用单个样本均数的t检验
1.建立假设,确定检验水准
H0 : 0
H1 : 0
α=0.05
基本步骤
2.计算检验统计量
t
0 s
0 s/ n
5.22 4.15 1.61 / 41
4.26
=41-1=40
24
基本步骤
3.确定P值,判断结果
x
t x
S x
(t 分布)
• 从N(,2)的总体中做随机抽样,每次抽样样本含
量为n,样本均数为x,标准差为S . 如下:
1 n x1 s1 2 n x2 s2 3 n x3 s3 4 n x4 s4 … ………
sx1 t1 sx2 t2 sx3 t3 sx4 t4 ……
n s s t 100
x100 100 x100 100
18
基本步骤
本例为计量资料小样本均数与总体均数的比较,选用单 个样本均数的t检验
1.建立假设,确定检验水准
H0 : 0
H1骤
2.计算检验统计量
x x / n 316.98/15 21.12
x2 ( x)2
6711.98 (316.98)2
s
n
15 0.98
查t界值表,得t0.05,40=2.021。 现t=4.26,4.26>2.021,故P <0.05, 按 α=0.05的水平,拒绝H0,接受H1,认为陈旧性心
肌梗死患者的血浆载脂蛋白E平均浓度与正常人 的差别有统计学意义,结合专业可以认为前者平 均浓度较高。
25
练习
• 以往通过大规模调查已知某地新生儿出生体重为3.30Kg,从该 地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重 为3.42Kg,标准差为0.40Kg。请问该地难产儿出生体重是否与 一般新生儿体重不同?
x
t检验
根据研究设计t检验有三种形式: ➢ 单样本均数的t检验 ➢ 配对样本均数的t检验 ➢ 两独立样本均数的t检验
13
t 检验应用条件
两组计量资料小样本比较; 样本对总体有较好代表性,对比组间有较好组间均衡性—
—随机抽样和随机分组;
样本来自正态分布总体,配对t检验要求差值服从正态分布, 实际应用时单峰对称分布也可以;大样本时,用u检验,且 正态性要求可以放宽;
定的指标值。
• 单样t检验的应用条件是总体标准未知的小样本资料( 如n<50),且
服从正态分布。
对于总体标准差未知的小样本数据(n<50),单样本均数
的假设检验采用t检验,计算公式为
t X 0 , n 1
S/ n
单个样本 t 检验原理
在 H0 : = 0的假定下,可以认为样 本是从已知总体中抽取的,根据t分 布的原理,单个样本t检验的公式为 :
练习
• 根据大量调查,一般健康成年男子的平均血红蛋白含量为 140.00g/L,现某医生在山区随机测定了25名健康成年男子, 其血红蛋白均数为153.64g/L,标准差为24.82g/L,故认为 该山区成年男子的血红蛋白均数高于一般健康成年男子的血红 蛋白均数。请问该结论是否正确,为什么?
二、配对t检验
➢ 区间估计---按一定的概率估计总体均数落在某个范 围
1. 未知,n较小
x t,sx
95%置信区间
x
t0.05,
S x
99%置信区间 x t0.01, Sx
2. 未知,n足够大
x u,sx
95%置信区间 x 1.96sx 99%置信区间 x 2.58sx
3. 已知
x u, x
95%置信区间 x 1.96 x 99%置信区间 x 2.58
第三节 均数假设检验的 基本方法(一)
公共卫生学院 周泉
µ
x1
x3 x
x2
正态分布与t分布
u x
x
t x
sx
120人 x1
120人 x2
………… …………
全国14岁女 生(身高)
155.40cm
120人 x3
u x
N (, )
N (0,1)
(u 分布)
120人 xn
N(, ) x
x
21
实例分析
例2 大量检测已知正常人血浆载脂蛋白E(APO E)总体 平均水平为4.15mmol/L。某医师经抽样测得41例陈旧性心 机梗死患者的血浆载脂蛋白E平均浓度为5.22mmol/L,标准 差为1.61mmol/L。据此能否认为陈旧性心肌梗死患者的血 浆载脂蛋白E平均浓度与正常人的平均浓度不一致?
• 配对样本均数t检验简称配对t检验(paired t test),又称非独立 两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目
的是检验两相关样本均数所代表的未知总体均数是否有差别。 • 配对设计(paired design)是将受试对象按某些重要特征相近的原
n 1
15 1
t 21.12 20.7 1.70 =15-1=14
0.98 / 15
20
基本步骤
3.确定P值,判断结果
查附表9-9 t界值表,得t0.05,14=2.145。 现t=1.70,1.70<2.145,故P >0.05, 按α=0.05的水平,不拒绝H0,尚不能认为该
法测得的均数与真值不同。
自由度=n-1
未知总体
样本
X
已知总体
0
实例分析
例1 已知某小样本中CaCO3含量的真值是20.7Mg/L。现 用某法重复测定该样品15次,CaCO3的含量分别是:20.99, 20.41 , 20.62 , 20.75 , 20.10 , 20.00 , 20.80 , 20.91 , 22.60,22.30,20.99,20.41,20.50,23.00,22.60。问 该法测得的均数与真值有无差别?