总体均数的估计与假设检验-医学统计教学课件
合集下载
医学统计学总体均数的估计与假设检验ppt-课件
六、 u 检验
•应用: 当已知;或未知,但n足够大时(此时t
分布接近u 分布)。用于两均数的比较。 常用于两大样本均数的比地抽样调查了部分健康成人的红细胞 数,其中男性360人,均数为4.6601012/L,标准 差为0.575 1012/L ;女性255人,均数为4.178 1012/L,标准差为0.291 1012/L,试问该地男、 女平均红细胞数有无差别?
30217某医生测得18例慢性支气管炎患者及1617酮类固醇排出量mgdl分别为314583735462405508498422435235289216555594440535380412412789324636348674467738495408534427654462592518310053200532成组设计的两样本几何均数的比较一般认为此类资料呈对数正态分布因此需将原始资料取对数后再作两组对数值均数的20名钩端螺旋体病人的血清随机分为两组分别用标准株和水生株做凝溶试验测得稀释倍数如下问两株的平均效价有无差别
如何判断? 统计上是通过假设检验来回答这个问题。 (1)建立假设:
H0: (检验假设或无效假设) 总体参数相等 为什么称其为无效假设?
H1: (备择假设) 总体参数不等
(2)确立检验水准 指拒绝实际上成立 H0 的所犯错误的概率
(I 类错误)。通常 = 0.05,但并不绝对。 为什么检验水准通常取0.05?
268
103
10609
443
22
484
d206 d221426
H0: d= 0
H : 0 2)
H0:
1 未知,但n足够大时;
1= 2
d
H0: d= 0
= 0.05 = 0.
4 据大量调查知,健康成年男子脉搏的均数为72次/分,某一身在山区随机调查了25名健康男子,其脉搏均数为74.
总体均数的估计和假设检验PPT课件
5、t’检验
当方差不齐时,两小样本均数的比较用t’
检验。 检验统计量:t'
x1 x2 s12 s22 n1 n2
临界值:
t'
s2 x1
t ,v1
s2
s2 x2
s2
t ,v2
x1
x2
如果t’ >t’α,则P<α,则拒绝原假设。
6、z检验
当样本含量较大时,可用z检验来进行
两样本均数的比较。它是用于两大样本均 数的比较,目的是推断两总体均数是否相 同。所用公式:
4、成组t检验
(3) 资料要求:两样本来自正态或近似正态 分布,并且两组总体方差相等。
(4) 对数正态分布的资料,在进行t检验时,
要先把数据进行对数转换,用对数值作为
新变量进行成组t检验。
4、成组t检验
(4) 公式: H0: μ1= μ2 H1:μ1 ≠ μ2
t x1 x2 s
x1 x2
(1) 小样本资料的估计(未知)
P(t ,<t<t , ) 1
由1-αx时 t,,计( 算sn )总<体<均x数的t,可( 信sn区)可间得的到通当式可为信:度
即:x
t
,
s x
例2:试求例1中该地1岁婴儿血红蛋白平 均值的95%的可信区间。
s
由ν于 =nn= -215=,24s=,11α.取9g双/L尾, 0s.x 05,n查t2界.3值8 g表/ L得:
准差s2=1.626 mg/dl,配对t检验结果,t =-
3.098,P<0.05,故认为脑病病人尿中类固醇排出 量高于正常人。
表3 正常人和脑病病人尿中类固醇排出量 (mg/dl)
正常人
2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.78脑ຫໍສະໝຸດ 病人差别是由抽样误差引起的。
医学统计学总体均数估计和假设检验课件
THANKS FOR WATCHING
感谢您的观看
检验步骤
提出假设、确定检验水准、 计算检验统计量、查表得P 值、作出推断结论。
结果解释与注意事项
结果解释
如果P值小于或等于预先设定的显著性水平(如0.05),则拒绝原假设,认为药物治疗前后患者某项指标的变化 具有统计学意义;否则接受原假设,认为变化不具有统计学意义。
注意事项
确保样本来自正态分布或近似正态分布的总体;注意样本量的要求;正确理解和解释P值的意义;避免第一类错 误和第二类错误的发生。
选择依据
根据数据类型(如连续型数据、离散 型数据)、样本量大小、总体分布是 否已知等因素选择合适的检验统计量。
P值计算及意义解读
01
P值定义
P值是在原假设成立的条件下,获得与当前样本数据相同 或更极端结果的概率。
02
P值计算
根据检验统计量的分布和样本数据计算得到。常见的方法 包括查表法、软件计算法等。
医学统计学总体均数估计和假设检 验课件
目录
• 总体均数估计基本概念与方法 • 假设检验基本原理与步骤 • 单样本t检验在医学研究中应用 • 双样本t检验在医学研究中应用 • 方差分析在医学研究中应用 • 非参数检验在医学研究中应用
01 总体均数估计基本概念与 方法
总体均数定义及意义
总体均数定义
双样本非参数检验方法
1 2
曼-惠特尼U检验
用于比较两个独立样本所来自的总体的分布位置 是否存在差异,适用于连续型数据。
威尔科克森秩和检验
用于比较两个配对样本的差异是否显著,适用于 等级或顺序数据。
3
科尔莫戈罗夫-斯米尔诺夫检验
用于比较两个独立样本所来自的总体的分布形状 是否存在差异,适用于连续型数据。
最新中国医科大学研究生医学统计学 第三讲 总体均数的估计与假设检验2_PPT课件ppt课件
Sn
x
u
x~N(,2) u~N(0,1)
x~N(,2n)
u x x
x ( x )~ N(0,1)
ux x x / n
未知
t x
S/ n
二、t 分布的图形与特征
t 分布是一簇曲线。当自由度ν不同时,曲线
的形状不同。当ν
时,t 分布趋近于标准正
态分布,但当自由度ν较小时,与标准正态分布差
异较大。其图形如下:
X
( X u 2 X , X u 2 X )
准正态分布是 t分布的特例。
自由度
单侧 双侧
1
2 3 4 5
6 7 8 9 10
21 22 23 24 25
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
0.686 0.686 0.685 0.685 0.684
中国医科大学研究生医 学统计学 第三讲 总体 均数的估计与假设检验
2_PPT课件
第一节 均数的抽样误差 与标准误
• 统计推断(statistical inference):
样本 推断 总体
(1)参数估计 (2)假设检验
S S Sx X nn
均数的标准误: (1)意义: (2)应用:
-t
0
t
0.005 0.01
63.657 9.925 5.841 4.604 4.032
0.0025 0.001
0.005 0.002
127.321 318.309
14.089 7.453 5.598 4.773
22.327 10.215 7.173 5.893
第五章总体均数估计与假设检验60页PPT
17
(二)方差不齐时两个样本均数比较的t’ 检验
假设:例5.6中,S12=180.72、 S22=125.52 21=22 ?
18
检验步骤如下:
H0:21=22; H1:21≠22; =0.10
代入公式5.13 F = 2.07, ν 1= 24; ν 2= 26 F 0.10/2,24,26=1.95,本例F = 2.07>1.95,P<0.10, P < 拒绝H0,接受H1,认为两总体方差不相同,
(一) t 检验 (二) Z 检验
3
小结 (单样本均数的假设检验)
▲目的:比较一个样本均数所代表的未知总体均 数与已知的总体均数有无差别。
▲计算公式:
t 统计量:(公式:5.7),自由度:n – 1
适用条件:样本均数服从正态总体,其总体未知;
Z 统计量:(公式:5.9 或5.8)
适用条件:样本例数n>=100,或已知其 ;
(1)公式
F S12 (较大)
S
(2 较小)
2
υ 1=n1-1,υ 2=n2-1
(5.13)
10
方差齐性检验
(2) 检验步骤 建立假设,及确定检验水准
H0:21=22,即,两总体方差相同 H1:21≠22,即, 两总体方差不同
=0.10
11
计算统计量 例5.6中, S21(较大)= 150.72, S22(较小)= 138.52,
第五章 总体均数的估计与假设检验
均数的抽样误差与标准误 中心极限定理 t 分布、 t 界值表 总体均数的区间估计 (1) t 分布法 (2) Z 分布法
1
Hypothesis Testing
假设检验的原因 假设检验的原理/思路 假设检验的一般步骤
(二)方差不齐时两个样本均数比较的t’ 检验
假设:例5.6中,S12=180.72、 S22=125.52 21=22 ?
18
检验步骤如下:
H0:21=22; H1:21≠22; =0.10
代入公式5.13 F = 2.07, ν 1= 24; ν 2= 26 F 0.10/2,24,26=1.95,本例F = 2.07>1.95,P<0.10, P < 拒绝H0,接受H1,认为两总体方差不相同,
(一) t 检验 (二) Z 检验
3
小结 (单样本均数的假设检验)
▲目的:比较一个样本均数所代表的未知总体均 数与已知的总体均数有无差别。
▲计算公式:
t 统计量:(公式:5.7),自由度:n – 1
适用条件:样本均数服从正态总体,其总体未知;
Z 统计量:(公式:5.9 或5.8)
适用条件:样本例数n>=100,或已知其 ;
(1)公式
F S12 (较大)
S
(2 较小)
2
υ 1=n1-1,υ 2=n2-1
(5.13)
10
方差齐性检验
(2) 检验步骤 建立假设,及确定检验水准
H0:21=22,即,两总体方差相同 H1:21≠22,即, 两总体方差不同
=0.10
11
计算统计量 例5.6中, S21(较大)= 150.72, S22(较小)= 138.52,
第五章 总体均数的估计与假设检验
均数的抽样误差与标准误 中心极限定理 t 分布、 t 界值表 总体均数的区间估计 (1) t 分布法 (2) Z 分布法
1
Hypothesis Testing
假设检验的原因 假设检验的原理/思路 假设检验的一般步骤
卫生统计学 总体均数估计和假设检验护理课件
总结与展望
本课程总结
总体均数估计和假设检验是卫生 统计学中的重要概念,本课程详 细介绍了其基本原理、方法和实
际应用。
通过案例分析和实践操作,使学 员能够熟练掌握总体均数估计和 假设检验的技巧,提高数据分析
能力。
本课程还强调了统计方法选择的 重要性,以及在护理领域中应用 统计学的注意事项和伦理要求。
方法。
02
应用场景
在护理研究中,非参数检验常用于比较分类变量或等级变量在不同组别
之间的分布是否存在显著差异。
03
注意事项
非参数检验的优点是不受总体分布限制,但检验效能相对较低。常用的
非参数检验方法包括Mann-Whitney U 检验和Kruskal-Wallis H 检验
等。
PART 05
实例分析
假设检验的注意事项
了解假设检验的注意事项有助于避免常见的错误和偏差。
在应用假设检验时,应注意以下几点:首先,应合理确定假设和样本量;其次,应选择适当的统计方 法;再次,应正确理解和解释分析结果;最后,应注意控制实验或观察的偏倚和误差。
PART 04
护理相关假设检验
t检验
定义
t检验是一种常用的统计假设检验 方法,用于比较两组数据的均值
总体均数是指总体中所有个体数值的总和除以总体容量得到 的数值,用于描述总体数据的集中趋势。在护理研究中,总 体均数可以用来评估护理措施的效果、病人的健康状况等。
总体均数的点估计
点估计是利用样本数据直接计算总体 均数的估计值。
点估计是直接利用样本数据计算出的 总体均数,其准确性取决于样本的代 表性。在护理研究中,点估计可以用 来初步了解总体均数的范围。
2023 WORK SUMMARY
本课程总结
总体均数估计和假设检验是卫生 统计学中的重要概念,本课程详 细介绍了其基本原理、方法和实
际应用。
通过案例分析和实践操作,使学 员能够熟练掌握总体均数估计和 假设检验的技巧,提高数据分析
能力。
本课程还强调了统计方法选择的 重要性,以及在护理领域中应用 统计学的注意事项和伦理要求。
方法。
02
应用场景
在护理研究中,非参数检验常用于比较分类变量或等级变量在不同组别
之间的分布是否存在显著差异。
03
注意事项
非参数检验的优点是不受总体分布限制,但检验效能相对较低。常用的
非参数检验方法包括Mann-Whitney U 检验和Kruskal-Wallis H 检验
等。
PART 05
实例分析
假设检验的注意事项
了解假设检验的注意事项有助于避免常见的错误和偏差。
在应用假设检验时,应注意以下几点:首先,应合理确定假设和样本量;其次,应选择适当的统计方 法;再次,应正确理解和解释分析结果;最后,应注意控制实验或观察的偏倚和误差。
PART 04
护理相关假设检验
t检验
定义
t检验是一种常用的统计假设检验 方法,用于比较两组数据的均值
总体均数是指总体中所有个体数值的总和除以总体容量得到 的数值,用于描述总体数据的集中趋势。在护理研究中,总 体均数可以用来评估护理措施的效果、病人的健康状况等。
总体均数的点估计
点估计是利用样本数据直接计算总体 均数的估计值。
点估计是直接利用样本数据计算出的 总体均数,其准确性取决于样本的代 表性。在护理研究中,点估计可以用 来初步了解总体均数的范围。
2023 WORK SUMMARY
卫生统计学:总体均数估计和假设检验课件
根据统计量和临界值进行统计 决策,判断是否拒绝或接受假 设。
提出假设
根据研究目的或问题提出一个 关于总体参数的假设。
确定临界值
根据研究目的和样本量确定临 界值,用于判断是否拒绝或接 受假设。
解释和报告
对统计决策进行解释和报告, 并给出相应的结论和建议。
04
参数检验
t检验
t检验是一种常用的参数检验方法,用于比较两组数据的均数差异。
区间估计的计算方法
根据样本数据和置信水平计算 出置信区间,常见的置信区间 包括95%置信区间和99%置信
区间等。
03
假设检验基础
假设检验的基本概念
假设检验是一种统计推断方法, 基于样本数据对总体参数进行推
断。
假设检验的基本思想是先提出一 个假设,然后根据样本数据对该 假设进行检验,判断是否拒绝或
检验效能
检验效能定义
检验效能是指假设检验中拒绝虚无假设 (H0)的概率,即检验的把握度或置信 度。检验效能越高,意味着该检验方法 越可靠,越能够准确地判断研究假设是 否成立。
VS
检验效能的影响因素
检验效能受到多种因素的影响,包括样本 量、标准差、效应大小、显著性水平等。 其中,样本量和效应大小是影响检验效能 的主要因素。
接受该假设。
假设检验的结论具有概率性质, 即有一定的不确定性。
双侧检验与单侧检验
双侧检验
同时考虑参数的两个方向,即大 于或小于某个值的情况。
单侧检验
只考虑参数的一个方向,即只考 虑大于或小于某个值的情况。
假设检验的步骤
选择合适的统计量
根据研究设计和数据特点选择 合适的统计量来描述样本数据 。
进行统计决策
提高检验效能的方法
提出假设
根据研究目的或问题提出一个 关于总体参数的假设。
确定临界值
根据研究目的和样本量确定临 界值,用于判断是否拒绝或接 受假设。
解释和报告
对统计决策进行解释和报告, 并给出相应的结论和建议。
04
参数检验
t检验
t检验是一种常用的参数检验方法,用于比较两组数据的均数差异。
区间估计的计算方法
根据样本数据和置信水平计算 出置信区间,常见的置信区间 包括95%置信区间和99%置信
区间等。
03
假设检验基础
假设检验的基本概念
假设检验是一种统计推断方法, 基于样本数据对总体参数进行推
断。
假设检验的基本思想是先提出一 个假设,然后根据样本数据对该 假设进行检验,判断是否拒绝或
检验效能
检验效能定义
检验效能是指假设检验中拒绝虚无假设 (H0)的概率,即检验的把握度或置信 度。检验效能越高,意味着该检验方法 越可靠,越能够准确地判断研究假设是 否成立。
VS
检验效能的影响因素
检验效能受到多种因素的影响,包括样本 量、标准差、效应大小、显著性水平等。 其中,样本量和效应大小是影响检验效能 的主要因素。
接受该假设。
假设检验的结论具有概率性质, 即有一定的不确定性。
双侧检验与单侧检验
双侧检验
同时考虑参数的两个方向,即大 于或小于某个值的情况。
单侧检验
只考虑参数的一个方向,即只考 虑大于或小于某个值的情况。
假设检验的步骤
选择合适的统计量
根据研究设计和数据特点选择 合适的统计量来描述样本数据 。
进行统计决策
提高检验效能的方法
卫生统计学:总体均数估计和假设检验课件
选取一个实际研究问题,如某地区儿童身高调查。首先,收集相关数据,并计算样本均数。然后,根据研究目的提出假设,并选择合适的统计方法进行假设检验,如t检验或Z检验。最后,根据检验结果得出结论,并解释其对实际研究的意义。
总结词
详细描述
总结词
介绍如何使用卫生统计学方法对配对设计的样本数据进行处理,并进行假设检验。
点估计是直接从样本数据出发,计算出样本均数,并将其作为总体均数的估计值。点估计是一种确定的数值,用于表示总体均数的估计结果。在统计学中,点估计的准确性取决于样本量和样本的代表性。
区间估计是通过给出一个置信区间来估计总体均数的范围,而非一个具体的数值。
区间估计考虑了抽样误差,并给出总体均数可能存在的范围。通常,区间估计是以一定的置信水平(如95%)来确定的,这意味着我们有95%的把握认为总体均数落在这个范围内。区间估计的准确性取决于样本量和样本的代表性,样本量越大,置信区间越窄,估计的准确性越高。
掌握总体均数估计的基本方法和步骤,包括样本均数的计算、总体均数的点估计和区间估计等。
掌握常用的统计分析方法和软件,如Excel、SPSS等,能够运用这些工具进行实际的数据分析。
理解假设检验的基本原理和方法,包括假设的提出、检验统计量的计算、P值的解读等。
提高学生对数据分析和解读的能力,培养其独立思考和解决问题的能力。
03
CHAPTER
假设检验基础
假设检验是一种统计推断方法,通过提出假设并对其进行验证,判断假设是否成立。
假设检验基于样本数据,通过统计量计算得出结论。
假设检验的结论具有概率性质,存在犯错误的可能性。
提出假设
选择合适的统计量
计算P值
解读结果
01
02
03
总结词
详细描述
总结词
介绍如何使用卫生统计学方法对配对设计的样本数据进行处理,并进行假设检验。
点估计是直接从样本数据出发,计算出样本均数,并将其作为总体均数的估计值。点估计是一种确定的数值,用于表示总体均数的估计结果。在统计学中,点估计的准确性取决于样本量和样本的代表性。
区间估计是通过给出一个置信区间来估计总体均数的范围,而非一个具体的数值。
区间估计考虑了抽样误差,并给出总体均数可能存在的范围。通常,区间估计是以一定的置信水平(如95%)来确定的,这意味着我们有95%的把握认为总体均数落在这个范围内。区间估计的准确性取决于样本量和样本的代表性,样本量越大,置信区间越窄,估计的准确性越高。
掌握总体均数估计的基本方法和步骤,包括样本均数的计算、总体均数的点估计和区间估计等。
掌握常用的统计分析方法和软件,如Excel、SPSS等,能够运用这些工具进行实际的数据分析。
理解假设检验的基本原理和方法,包括假设的提出、检验统计量的计算、P值的解读等。
提高学生对数据分析和解读的能力,培养其独立思考和解决问题的能力。
03
CHAPTER
假设检验基础
假设检验是一种统计推断方法,通过提出假设并对其进行验证,判断假设是否成立。
假设检验基于样本数据,通过统计量计算得出结论。
假设检验的结论具有概率性质,存在犯错误的可能性。
提出假设
选择合适的统计量
计算P值
解读结果
01
02
03
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体均数的估计 与假设检验
第二军医大学卫生统计学教研室 张罗漫
1
讲课内容
均数的抽样误差与标准误 t 分布 总体均数的估计 t 检验 假设检验的注意事项 正态性检验和两样本方差比较的F检验
2
第一节 均数的抽样误差与标准误
3
了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实 际中往往不可行。
附表2 t 界值表
-t
0
t
概 率,P
自由度 单侧
0.25
0.20
0.10
0.05
0.025 0.01
0.005 0.0025 0.001 0.0005
双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
5
0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
100
0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
200
0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340
附表2 t 界值表
-t
0
t
自由度
概 率,P
单侧 双侧
0.25 0.50
0.20 0.40
0.10 0.20
0.05 0.10
0.025 0.01 0.05 0.02
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
t分布为一簇单峰分布曲线,不同,曲线 形状不同
t分布以0为中心,左右对称 t分布与有关, 越小, t值越分散,t分
布的峰部越低,而两侧尾部翘得越高 当逼近, S X 逼近 X ,t分布逼近u分布
17
f(t)
=∞(标准正态曲线)
=5
0.3
=1
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
t值
自由度分别为1、5、∞时的t分布
500
0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310
1000
0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300
0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905
纪元,被认为是统计
学发展史上的里程碑
之一。 14
William Seely Gosset(1876~1937,英)
15
t 分布的概念
X ~N ( , 2) u X N (0,1)
X~N(,2) u X nN(0,1) n
X
X~N(,2)t S nt分 布
n
16
t分布的图形与特征
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
若 X i 不服从正态分布
n大(n>60):则ຫໍສະໝຸດ X近似服从正态分布
j
n小(n<60):则 X j 为非正态分布
10
样本统计量的标准差称标准误 (standard error, SE)
样本均数的标准差称均数的标准误 (standard error of mean, SEM)
X
n
S SX n
11
标准差与标准误的区别
抽样误差是不可避免的。 抽样误差是有规律的。
5
8
中心极限定理(central limit theorem)
从均数为、标准差为的总体中独立随机
抽样,当样本含量n较大时,
样本均数的分布将趋于正态分布
此分布的均数为
标准差为
X
n
9
中心极限定理(central limit theorem)
若 X i 服从正态分布 则 X j 服从正态分布
应
用 计算变异系数
计算标准误
估计参考值范围
均数的假设检验 估计的可信区间
12
第二节
t 分布
13
1908年,英国统计学
家 W.S.Gosset 以笔
名 “Student”在《
Biometrics》杂志上
发表论文,首次提出
t分布概念,后人又
称Student’s
t-
distribution,开创了
小样本统计推断的新
t分布曲线下面积与横轴t值间关系(附表2)
t界值表中一侧尾部面积称单侧概率 (α) 两侧尾部面积之和称双侧概率(α/2) t0.05/2,9=2.262 , t0.05,9=1.833
在相同自由度时,t 值增大,α减小
在相同α 时,单尾α 对应的t值比双尾α 的小
20
t0.05,9=1.833
t0.05/2,9=2.262 21
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3
0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4
0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
S
SX
意
义 描述个体值的离散程度; 反映抽样误差的大小;
衡量样本均数对样本个体 衡量样本均数估计总体均
值的代表性
数的可靠性
计
算 S (X X)2
n1
S
S
X
n
与均数的关系 S 越小, X 对样本个体值的 SX 越小, X 估计的可靠性
代表性越好
越大
与 n 的 关系 n →∞,S →
n →∞, SX → 0
对无限总体不可能对所有个体逐一观察, 对有限总体限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所 有个体逐一研究(如对一批罐头质量检查)。
借助抽样研究。
4
欲了解某地18岁男生身高值的平均水平, 随机抽取该地10名男生身高值作为样本。
由于个体变异与抽样的影响,抽得的样本 均数不太可能等于总体均数,造成样本统 计量与总体参数间的差异(表现为来自同一 总体的若干样本统计量间的差异),称为抽 样误差。
第二军医大学卫生统计学教研室 张罗漫
1
讲课内容
均数的抽样误差与标准误 t 分布 总体均数的估计 t 检验 假设检验的注意事项 正态性检验和两样本方差比较的F检验
2
第一节 均数的抽样误差与标准误
3
了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实 际中往往不可行。
附表2 t 界值表
-t
0
t
概 率,P
自由度 单侧
0.25
0.20
0.10
0.05
0.025 0.01
0.005 0.0025 0.001 0.0005
双侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
5
0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
100
0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
200
0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340
附表2 t 界值表
-t
0
t
自由度
概 率,P
单侧 双侧
0.25 0.50
0.20 0.40
0.10 0.20
0.05 0.10
0.025 0.01 0.05 0.02
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001
1
1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
t分布为一簇单峰分布曲线,不同,曲线 形状不同
t分布以0为中心,左右对称 t分布与有关, 越小, t值越分散,t分
布的峰部越低,而两侧尾部翘得越高 当逼近, S X 逼近 X ,t分布逼近u分布
17
f(t)
=∞(标准正态曲线)
=5
0.3
=1
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
t值
自由度分别为1、5、∞时的t分布
500
0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310
1000
0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300
0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905
纪元,被认为是统计
学发展史上的里程碑
之一。 14
William Seely Gosset(1876~1937,英)
15
t 分布的概念
X ~N ( , 2) u X N (0,1)
X~N(,2) u X nN(0,1) n
X
X~N(,2)t S nt分 布
n
16
t分布的图形与特征
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
若 X i 不服从正态分布
n大(n>60):则ຫໍສະໝຸດ X近似服从正态分布
j
n小(n<60):则 X j 为非正态分布
10
样本统计量的标准差称标准误 (standard error, SE)
样本均数的标准差称均数的标准误 (standard error of mean, SEM)
X
n
S SX n
11
标准差与标准误的区别
抽样误差是不可避免的。 抽样误差是有规律的。
5
8
中心极限定理(central limit theorem)
从均数为、标准差为的总体中独立随机
抽样,当样本含量n较大时,
样本均数的分布将趋于正态分布
此分布的均数为
标准差为
X
n
9
中心极限定理(central limit theorem)
若 X i 服从正态分布 则 X j 服从正态分布
应
用 计算变异系数
计算标准误
估计参考值范围
均数的假设检验 估计的可信区间
12
第二节
t 分布
13
1908年,英国统计学
家 W.S.Gosset 以笔
名 “Student”在《
Biometrics》杂志上
发表论文,首次提出
t分布概念,后人又
称Student’s
t-
distribution,开创了
小样本统计推断的新
t分布曲线下面积与横轴t值间关系(附表2)
t界值表中一侧尾部面积称单侧概率 (α) 两侧尾部面积之和称双侧概率(α/2) t0.05/2,9=2.262 , t0.05,9=1.833
在相同自由度时,t 值增大,α减小
在相同α 时,单尾α 对应的t值比双尾α 的小
20
t0.05,9=1.833
t0.05/2,9=2.262 21
2
0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3
0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4
0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
S
SX
意
义 描述个体值的离散程度; 反映抽样误差的大小;
衡量样本均数对样本个体 衡量样本均数估计总体均
值的代表性
数的可靠性
计
算 S (X X)2
n1
S
S
X
n
与均数的关系 S 越小, X 对样本个体值的 SX 越小, X 估计的可靠性
代表性越好
越大
与 n 的 关系 n →∞,S →
n →∞, SX → 0
对无限总体不可能对所有个体逐一观察, 对有限总体限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所 有个体逐一研究(如对一批罐头质量检查)。
借助抽样研究。
4
欲了解某地18岁男生身高值的平均水平, 随机抽取该地10名男生身高值作为样本。
由于个体变异与抽样的影响,抽得的样本 均数不太可能等于总体均数,造成样本统 计量与总体参数间的差异(表现为来自同一 总体的若干样本统计量间的差异),称为抽 样误差。