第3章抽样误差陆

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

.3
.25
Fraction
.2
.15
.1
.05
0
-8 -6 -4 -2
0
2
4
6
8
t
t 分布的概念
用样本方差代替总体方差,此时
X
s X
不服从正态分布。
t 分布的概念
1908 年 , W.S.Gosset (1876-1937) 以 笔 名 Student发表了著名的t分布,证明了:
设从正态分布N(,2)中随机抽取含量为n的样本,
抽样分布规律
红细胞计数
μ = 5.0 σ = 0.5
样本含量n =10 抽样次数m =100
x =5.04
S = 0.44
x =5.19
S =0.42
x =5.03
S =0.52
Fraction
.3
.2
.1
0 2.5 2.8 3.1 3.4 3.7 4 4.3 4.6 4.9 5.2 5.5 5.8 6.1 6.4 6.7 7 7.3 7.6 7.9 x
的分X 布服从正态分布;
■样本均数的均数为 μ;
■样本均数的标准差为
x

n
中心极限定理
不同类型的总体分布,对于统计量分布有何影响?
正态分布总体 偏三角分布总体 均匀分布总体 指数F分布总体 双峰分布总体
中心极限定理
(二)从非正态(nonnormal)分布总体(均数为μ, 方差为σ)中随机抽样(每个样本的含量为n),可 得无限多个样本,每个样本计算样本均数,则 只要样本含量足够大(n>50),样本均数也近似服 从正态分布。
结论2
X 的分布很有规律,围绕着,中间多,两
边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围
大大缩小;
2.中心极限定理
Central Limit Theorem
抽样误差 中心极限定理 标准误 分布
中心极限定理(central limit theorem)
(一)从均数为、标准差为 的正态总体中, 独立随机抽取例数为n的样本,样本均数
图 正态分布N(5.00,0.502)总体分布
结论 1
各样本均数未必等于总体均数; 样本均数间存在差异;
由抽样实验所得的100个样本作出其均数分布 直 方 图 如 图 4.1 。 曲 线 是 对 抽 样 得 到 的 100 个 数据拟合的分布曲线。
Fraction
1 .9 .8 .7 .6 .5 .4 .3 .2 .1 0
➢ 样本统计量与总体参数间的差别 ➢ 不同样本统计量间的差别
抽样误差是不可避免的! 抽样误差是有规律的!
均数的模拟试验
假设一个已知总体,从该总体中抽样,对每 个样本计算样本统计量(均数、方差等),观察 样本统计量的分布规律--抽样分布规律。
均数的模拟试验
考察: 样本均数的均数与总体均数有何关系? 样本均数的标准差与总体标准差有何关系? 样本均数的分布形状如何? 不同的样本含量对上述性质的影响如何?
■样本均数的均数为 μ;
■样本均数的标准差为
x
n

3.标准误
standard error
抽样误差 中心极限定理 标准误 分布
标准误(standard error)
样本统计量的标准差称为标准误。样本均数的标准 差称为均数的标准误。
均数的标准误表示样本均数的变异度。
x
百度文库
n
当总体标准差未知时,用样本标准差代替,
3、与样本含量
标准差是随着样本含量的增多,逐渐趋于稳定。 标准误是随着样本含量的增多,逐渐减少。
与标准差的关系
首先,标准差和标准误都是变异指标,说明个体 之间的变异用标准差,说明统计量之间的变异用 标准误。
其次,当样本含量不变时,标准差大,标准误亦 越大,均数的标准误与标准差成正比。
联系
4. t分布
2.5 2.8 3.1 3.4 3.7 4 4.3 4.6 4.9 5.2 5.5 5.8 6.1 6.4 6.7 7 7.3 7.6 7.9
x
图 从正态分布N(5.00,0.502)总体中抽样样本均数的分布
.5
.4
.3
Fraction
.2
.1
0
4.1
4.4
4.7
5
5.3
5.6
5.9
x
图 从正态分布N(5.00,0.502)总体中抽样样本均数的分布
.15
Fraction
.1
.05
0
-4 -3 -2 -1 0 1 2 3 4 u
t 分布的概念
实际工作中,总体方差未知。所以,用样本 方差代替总体方差,
此时 X 的分布如何?
s X
从正态分布总体中1000次抽样的
X s
值的
分布(n=4)
X
.35
均数为 0.05696
标准差为 1.55827
样本均数和标准差分别为 X和s,设:
t X
s X
则t值服从自由度为n-1的t分布。
记为:
X
t s
~ t(n1)
X
t分布图形
f(t)
0.3
=∞(标准正态曲线) =5 =1
1. 抽样误差
Sampling Error
抽样误差 中心极限定理 标准误 统计分布
了解抽样误差的重要性
总体
随机 抽样
同质、个体变异
样本
代表性、抽样误差
总体参数
未知
样本统计量已
统计 推断

风险
抽样误差
sampling error,sampling variability 由抽样引起的样本统计量与总体参数间的 差别。 原因:个体变异+抽样 表现:
第三章 抽样误差
Sampling Error
Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University
主要内容
抽样误差 中心极限定理 标准误
t分布
2 分布
F分布
t-distribution
抽样误差 中心极限定理 标准误 分布
正态分布的标准化变化
若 X ~ N(μ,σ) , 则
X ~ N (0,1。)

X ~ N (, X ),则 u
X
~
N (0,1)。
X
从正态分布总体中1000次抽样的 u 值的分
布(n=4)
.2
均数为 0.007559
标准差为 1.006294
s sx n
前者称为理论标准误,后者称为样本标准误。
区别
与标准差的关系
1、意义上
标准差描述个体值之间的变异,即观察值间的离散程度; 而标准误是描述统计量的抽样误差,即样本统计量和总体
参数的接近程度;
2、用途上
标准差常用于表现观察值的波动范围; 标准误常表示抽样误差的大小,估计总体参数可信区间。
相关文档
最新文档