临床医学总体均数的估计与假设检验

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准误:描述样本均数的离散程度, 表示 抽样误差的大小, 标准误小, 表示抽样误差小, 样本均数与总体均数较接近, 用样本均数推 断总体均数的可靠性大。
2. 表示方法: 标准差: 标准误: 3. 计算公式: 标准差:
标准误:
xS xS
x
X 2 (X )2 / n S
n 1
S S/ n x
4. 用途: 标准差:用于估计变量值的分布范围,制定 医学参考值范围。 标准误:用于估计总体均数的可信区间、 假设检验。
第二节 t 分布
一、t 分布的概念
随机变量
X~N (,2)
标准正态分布
u~N ( 0,12 )
u X
1
0
X ~N ( ,2/n )
标准正态分布
u~N ( 0,12 )
u X
/ n
1
n
0
X ~N ( ,2/n )
标准正态分布
u~N ( 0,12 )
u X
/ n
1
n
t X
s/ n
0
1. t 分布的图形
t 分布曲线是一簇曲线。当自由度ν不同 时, 曲线的形状不同。当ν→∞时, t分布趋近 于标准正态分布, 但当自由度较小时, t分布 与标准正态分布的差异较大。t分布曲线的 形状随自由度的大小而变化。
2. t 分布的特征
⑴. 单峰分布, 以0为中心, 左右对称; ⑵. 自由度ν 越小, 则t 值越分散, t分布的 峰部越矮而尾部翘得越高; 因此, t分布曲线 下面积为95%或99%的界值不是一个常量, 而是随自由度大小而变化的;
在实际工作中, 通常未知, 常用S作 为的估计值, 但 (X )/(S / n) 已不再服 从标准正态分布, 而是服从自由度为 ν= n-1的 t 分布。
二、t 分布的图形与特征
ƒ(t)
ν→∞(标准正态曲线)
0.4
ν=5
0.3
ν=1
0.2
0.1
-4 -3 -2 -1 0 1 2 3 4 t
不同自由度下的 t 分布图
二、标准误的用途
1. 表示抽样误差的大小: 标准误越小说明 抽样误差越小, 样本均数与总体均数越 接近, 用样本均数推论总体均数的可靠 性越大;
2. 用于估计总体均数的可信区间; 3. 用于均数的假设检验。
例:为了解某地1岁婴儿的血红蛋白浓度, 从该地随机抽取 36名1岁婴儿, 算得血红蛋白的平均浓度为121.3g/L, 标准 差为8.2g/L。计算该次抽样的标准误。
抽样分布
抽样分布示意图
抽样分布
抽样分布示意图
4. 样本均数的标准差比原个体值的标准差
要小, 标准差为:
Xn
(理论值)
常未知,用S估计:S S (估计值)
X
n
标准误的意义(SE ):
即样本均数的标准差,反映样本均数间 的离散程度,也反映样本均数与总体均数 间的差异,说明均数抽样误差的大小。标 准误越大,说明抽样误差越大,用样本统计 量作为总体参数估计值的可靠程度越差。
S S 8.2 1.37 (g/L) X n 36
大量研究资料显示, 当地1岁婴儿血红蛋白的平均浓度为 123.7g/L, 标准差为11.9g/L。计算该次抽样的标准误。
11.9 1.98 (g/L)
X n 36
三、标准差与标准误的区别和联系
区别: 1. 意义: 标准差:描述观察值之间的离散程度,标准 差越小, 表示观察值围绕均数的分布比较集 中, 说明均数的代表性较好;
总体
参数
抽样 统计推断
样本
wenku.baidu.com统计量
若某市某年14岁健康女生身高资料服从 μ=155.4cm,σ=5.30cm 的 正 态 分 布 。 从 该 正态分布N(155.4, 5.32)的总体中随机抽 样, 每次样本含量n=10,共抽取100次,得到 100个样本的样本均数和标准差, 频数分布 见表。
100个样本均数的分布
⑶. 当ν→∞时, S 逼近 , t分布逼近标
X
X
准正态分布, 故标准正态分布是t分布的极限
分布(特例)。
⑷. t分布的唯一参数是自由度。
t 分布界值表
-t 0 t
自由
度ν
单侧 0.25 双侧 0.50
1
1.000
0.20 0.40 1.376
0.10 0.20 3.078
概率,P
0.05 0.025 0.01 0.005 0.0025 0.001 0.10 0.05 0.02 0.01 0.005 0.002 6.314 12.706 31.821 63.657
第四章
总体均数的估计与假设检验
第一节 均数的抽样误差与标准误
一、抽样误差与标准误
概念:抽样研究的目的就是要用样本信
息来推断总体特征。由于存在变异,抽样 后各个样本均数往往不等于总体均数,且 各样本均数间也不一定相等。这种由抽样 造成的样本均数与总体均数的差异或各样 本均数之间的差异称为抽样误差,抽样误 差是不可避免的。
组段
151~ 152~ 153~ 154~ 155~ 156~ 157~ 158~ 159~ 合计
频数
1 6 15 19 27 16 8 5 3 100
样本均数的频数分布图, 提示样本均数 的抽样分布具有如下特点:
1. 样本均数未必等于总体均数; 2. 各样本均数间存在差异; 3. 样本均数围绕总体均数, 呈正态分布; 4. 样本均数的变异范围较原变量的变异 范围大为缩小。
(100个样本均数的均数为155.52cm, 标准差为1.63cm)
理论可以证明:若从正态总体 N(, 2 )
中,反复多次随机抽取样本含量固定为n
的样本,这些样本均数 X 也服从正态分
布,即 X 的总体均数仍为 ,样本均数
的标准差为 / n 。
数理统计推论与中心极限定理
1. 从正态总体中重复随机抽取样本含量为 n的样本, 样本均数也服从正态分布; 2. 从偏态总体中重复随机抽样, 当样本含 量n足够大时( n >50), 样本均数也近似服 从正态分布; 3. 样本均数的总体均数’ 等于原总体均 数;
5. 与样本含量的关系: 标准差: 随着样本含量的增多, 逐渐趋于稳 定 (一般200例以上) 。 标准误: 随着样本含量的增多, 逐渐减少. 若样本含量趋近于总体观察单位的数量, 则标准误趋近于0, 抽样误差几乎消失。
联系:
1. 两者均是表示变异程度大小的指标: 说明观察值之间的变异程度用标准差, 说明统计量之间的变异程度用标准误。 2. 标准误与标准差的大小成正比, 当样本 含量不变时, 标准差越大标准误也越大。
相关文档
最新文档