卫生统计学-第六章 参数估计基础
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SX
0.37 140
0.03 1012 / L
区别 统计符号
计算公式 统计学意 义
用途 联系
标准差
均数的标准误
总体标准差σ表示 均数的标准误 X
样本标准差S表示 其估计值用 S X
S (X X )2 n 1
标准差越小,个 体值相对越集中 ,均数对数据的 代表性越好。
350
300
250
200
150
1源自文库0
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
450 400 350
n 10; S X 0.1580
300
250
200
150
100
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数的标准误
样本均数的标准差也称均数的标准误(SEM),它
说明各样本均数 X 围绕总体均数μ的离散程度。 可用于衡量抽样误差的大小
X
n
因通常σ 未知,计算标准误采用下式: 通过增加样本
SX
S n
含量n来降低抽
样误差。
X
越大,样本均数的分布越分散,样本均
数与总体均数的差别越大,抽样误差越大,
┆ 样 本 含 99. 4.87, 0.59 量 n =10 100. 4.79, 0.39
100 个
将这100份样本的均数看成新变量值,按频数分布方法,得 到这100个样本均数得直方图见图1。
S 0.1722 X
3个抽样实验结果图示
频数 频数
450 400
n 5; SX 0.2212
描述个体值得变
异程度
SX
S n
SX
S n
标准误越小,样本均数 的分布越集中,样本均 数与总体均数的差别越 小,抽样误差越小,由 样本均数估计总体均数 的可靠性越大
描述均数抽样误差的大 小
第二节 t分布
随机变量X N( μ,s2)
均数 X
N (, 2 n)
z X
z变换
X z
population
sample
sampling
sample
抽样研究(sampling study)
在总体中随机抽取一定数量 观察单位作为 样本。
统计推断(statistical inference)
由样本信息推断总体特征,这一过程称为统 计推断
抽样误差( sampling error)
1012),中间多,两边少,左右基本对称,也服从正态 分布 样本均数的变异较之原变量的变异大大缩小
随着样本量的增大,样本均数的变异范围逐渐缩小
中心极限定理 central limit theorem
①即使从非正态总体中抽取样本,所得均 数分布仍近似呈正态。
②随着样本量的增大, 样本均数的变异范 围也逐渐变窄。
第六章 参数估计
吴立娟 流行病与卫生统计学系
第一教学楼230室
内容
均数的抽样分布与抽样误差 t 分布 总体均数的估计
复习
计量资料的统计描述
集中趋势的描述 均数、中位数、几何均数
离散趋势的描述 极差、四分位数间距、 方差和标准差、变异系数
正态分布及其应用
医学参考值范围的制定
由样本均数估计总体均数的可靠性越小。反
之亦然。
标准误反映了样本均数间的离散程度,也反 映了样本均数与总体均数的差异。
标准误与标准差成正比,当总体中各观测值 变异很小时,样本均数与总体均数的差异小, 抽样误差小。
标准误 与样本含量的平方根成反比,样本 含量越大,抽样误差越小
例:140名成年男子红细胞数的标准差为 0.37 ×1012/L, 则标准误为
X
z变换
标准正态分布
N(0,12)
标准正态分布
N(0,12)
实际工作中,σx 未知
X X
t
, v n 1
S n SX
统计量为t的分布称为t分布。t分布与自由 度有关,每个自由度都对应一条分布曲线。
英国统计学家W.S.Gosset于1908年以 “student” 笔名发表论文,首次揭示t分 布的特征,因此t分布又称”Student t 分 布”。它是总体均数的区间估计和假设检验 的理论基础。
通过样本推论总体时会存在一定的误差,这 种由抽样造成的样本统计量与总体参数的差 异称为抽样误差。抽样误差有两种表现形式:
样本统计量与总体参数间的差异 样本统计量间得差异
第一节 抽样分布与抽样误差
例如,从总体均数 =4.83×1012/L、标准差 =0.52×1012/L 的正态分布总体
N(4.83, 0.522)中,随机抽取 10 人为一个样本(n=10),并计算该样本的均数、标
准差。如此重复抽取 100 次( g =100),可得到 100 份样本,可得到 100 对均数
X 和标准差 S 。
正态总体
=4.83 =0.52
XS
1. 4.58, 0.38 2. 4.90, 0.45 3. 4.76, 0.49
William Sealey Gosset
Born: 13 June 1876 in Canterbury, England Died: 16 Oct 1937 in Beaconsfield, England 中国·首医
f(t)
ν─>∞(标准正态曲线)
ν =5
ν =1
f (t) ( 1) 2 (1 t 2 / )( 1) 2
( 2)
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图2 不同自由度下的t 分布图
t分布特征
-5 -4 -3 -2 -1
0
1
2
3
4
5
以0为中心,左右对称的单峰分布;
t分布曲线是一簇曲线,其形态变化与自由
度的大小有关。
均数
频数
450 400
n 30; S X
350
300
250
200
150
100
50
0
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数
0.0920
样本均数抽样分布的特点
各样本均数未必等于总体均数 样本均数之间存在差异 样本均数的分布很有规律,围绕着总体均数(4.83*