抽样误差_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
缩小。
16
NTU 2012
中心极限定理(central limit theorem)
Case 1:
从正态分布总体N (μ,σ) 中随机抽样(每个样本的含量 为n ),可得无限多个样本,每个样本计算样本均数,
则样本均数也服从正态分布。
– 样本均数的均数为 μ;
–
样本均数的标准差为 x
n
。
17
NTU 2012
– 不同的样本含量对上述性质的影响如何?
10
NTU 2012
从已知正态总体中抽样
μ =0 σ =1
X =0.3747
S= 1.2473
X =0.0681
S =0.7245
样本含量n =10 抽样次数m =1000
X =-0.1703 S = 0.9248
11
NTU 2012
A Simulation Study
概率论:规律性中的随机性 统计学:随机性中的规律性
3
NTU 2012
NTU 2012
NTU 2012
抽样误差的定义
【定义】由于个体变异的存在,在抽样研究中产生 样本统计量和总体参数之间的差异,称为抽样误 差(sampling error)。
各种参数都有抽样误差,这里我们以均数为研究对象
6
NTU 2012
n=2
X Population A
X
X Population B
X Population C
X Population D
n=4
X
X
n=10
X
n=25
Sampling Distribution of sample means
Sampling Distribution of sample means
Sampling Distribution of sample means
标准误的意义
NTU 2012
反映了样本统计量(样本均数,样本率)分布的离散 程度,体现了抽样误差的大小。
标准误越大,说明样本统计量(样本均数,样本率) 的离散程度越大,即用样本统计量来直接估计总体参 数越不可靠。反之亦然。
标准误的大小与标准差有关,在例数n一定时,从标
准差大的总体中抽样,标准误较大;而当总体一定时, 样本例数越多,标准误越小。说明我们可以通过增加 样本含量来减少抽样误差的大小。
中心极限定理(central limit theorem)
Case 2:
从非正态(nonnormal)分布总体(均数为μ,方差为σ)
中随机抽样(每个样本的含量为n ),可得无限多个样
本,每个样本计算样本均数,则只要样本含量足够
大(n >50),样本均数也近似服从正态分布。
– 样本均数的均数为 μ;
–
抽样误差的表现
样本均数和
抽
总体均数间
样
的差别 X i
误
差
的
表
样本均数和
现
样本均数间
的差别 X i X j
7
NTU 2012
抽样误差的规律性
抽样误差是不可避免的! 抽样误差是有规律的!
既然抽样误差是有规律的,那么它的 分布规律到底是怎样的?
8
NTU 2012
模拟试验
假设一个已知总体,从该总体中抽样,对每个 样本计算样本统计量(均数、方差等),观察样 本统计量的分布规律--抽样分布规律。
越小,表现为样本均数的分布范围越来越窄,其 高峰越来越尖。
15
均数的抽样误差之特点
NTU 2012
各样本均数未必等于总体均数; 样本均数间存在差异; 样本均数的分布很有规律,围绕总体均数,中间
多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大
缩小; 随着样本含量的增加,样本均数的变异范围逐渐
20
与样本含量的关系
NTU 2012
n 越大,均数的均数就越接近总体均数; n 越大,变异越小,分布越窄;
对称分布接近正态分布的速度,大于非对称分布。 分布越偏,接近正态分布所需样本含量就越大。
21
NTU 2012
抽样误差的规律性(1)
均数的抽样误差规律:
– 在样本含量足够大时,无论总体分布如何,其均数的 分布趋于正态分布(大数定律)
样本均数的标准差为 x
n
。
18
NTU 2012
标准误(standard error)
样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。
x
n
当总体标准差未知时,用样本标准差代替,
s
sx
n
前者称为理论标准误,后者称为样本标准误。
19
Sampling Distribution of sample means
14
NTU 2012
从正态总体中随机抽样,其样本均数服从正态分 布;
从任意总体中随机抽样,当样本含量足够大时, 其样本均数的分布逐渐逼近正态分布;
样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来
考察:
– 不同的分布 – 不同的样本含量
对统计量的影响。
9
均数的模拟试验
NTU 2012
从不同总体中进行抽样,观察均数的抽样分布规律。 – 正态分布总体 – 对数正态分布总体 – U型分布总体
考察: – 样本均数的均数与总体均数有何关系? – 样本均数的标准差与总体标准差有何关系? – 样本均数的分布形状如何?
– 在样本含量较小时: 总体为正态分布时:正态分布 总体为非正态分布时:?
22
NTU 2012
正态分布的标准化变化
若 X ~ N(μ,σ) , 则
X ~ N(0,1。)
因
X~N(,X),
则Fra Baidu bibliotek
u X ~ N(0,1)
。
X
23
NTU 2012
.2
从N(0,1)中1000次抽样的 u 值的分布(n=4)
SAMPLE 1:x11 x12 x13 x14...x1n
X1
原始
SAMPLE 2:x21 x22 x23 x24...x2n
X2
总体
μ
k个样本均数的频数分布图
SAMPLE k:xk1 xk2 xk3 xk4...xkn
Xk
12
NTU 2012
模拟试验
随机现象的模拟系统
13
NTU 2012
Sampling distribution for means
主要内容(Content)
NTU 2012
抽样误差及其规律性 标准误 抽样分布与t分布 总结
1
NTU 2012
了解抽样误差规律的重要性
总体
随机 抽样
同质个体、个体变异
样本
代表性、抽样误差
总体参数
未知
样本统计量
统计 推断
已知
风险
2
NTU 2012
两种研究思路
概率论:已知总体样本具有什么性质? 统计学:已知样本总体具有什么性质?
16
NTU 2012
中心极限定理(central limit theorem)
Case 1:
从正态分布总体N (μ,σ) 中随机抽样(每个样本的含量 为n ),可得无限多个样本,每个样本计算样本均数,
则样本均数也服从正态分布。
– 样本均数的均数为 μ;
–
样本均数的标准差为 x
n
。
17
NTU 2012
– 不同的样本含量对上述性质的影响如何?
10
NTU 2012
从已知正态总体中抽样
μ =0 σ =1
X =0.3747
S= 1.2473
X =0.0681
S =0.7245
样本含量n =10 抽样次数m =1000
X =-0.1703 S = 0.9248
11
NTU 2012
A Simulation Study
概率论:规律性中的随机性 统计学:随机性中的规律性
3
NTU 2012
NTU 2012
NTU 2012
抽样误差的定义
【定义】由于个体变异的存在,在抽样研究中产生 样本统计量和总体参数之间的差异,称为抽样误 差(sampling error)。
各种参数都有抽样误差,这里我们以均数为研究对象
6
NTU 2012
n=2
X Population A
X
X Population B
X Population C
X Population D
n=4
X
X
n=10
X
n=25
Sampling Distribution of sample means
Sampling Distribution of sample means
Sampling Distribution of sample means
标准误的意义
NTU 2012
反映了样本统计量(样本均数,样本率)分布的离散 程度,体现了抽样误差的大小。
标准误越大,说明样本统计量(样本均数,样本率) 的离散程度越大,即用样本统计量来直接估计总体参 数越不可靠。反之亦然。
标准误的大小与标准差有关,在例数n一定时,从标
准差大的总体中抽样,标准误较大;而当总体一定时, 样本例数越多,标准误越小。说明我们可以通过增加 样本含量来减少抽样误差的大小。
中心极限定理(central limit theorem)
Case 2:
从非正态(nonnormal)分布总体(均数为μ,方差为σ)
中随机抽样(每个样本的含量为n ),可得无限多个样
本,每个样本计算样本均数,则只要样本含量足够
大(n >50),样本均数也近似服从正态分布。
– 样本均数的均数为 μ;
–
抽样误差的表现
样本均数和
抽
总体均数间
样
的差别 X i
误
差
的
表
样本均数和
现
样本均数间
的差别 X i X j
7
NTU 2012
抽样误差的规律性
抽样误差是不可避免的! 抽样误差是有规律的!
既然抽样误差是有规律的,那么它的 分布规律到底是怎样的?
8
NTU 2012
模拟试验
假设一个已知总体,从该总体中抽样,对每个 样本计算样本统计量(均数、方差等),观察样 本统计量的分布规律--抽样分布规律。
越小,表现为样本均数的分布范围越来越窄,其 高峰越来越尖。
15
均数的抽样误差之特点
NTU 2012
各样本均数未必等于总体均数; 样本均数间存在差异; 样本均数的分布很有规律,围绕总体均数,中间
多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大
缩小; 随着样本含量的增加,样本均数的变异范围逐渐
20
与样本含量的关系
NTU 2012
n 越大,均数的均数就越接近总体均数; n 越大,变异越小,分布越窄;
对称分布接近正态分布的速度,大于非对称分布。 分布越偏,接近正态分布所需样本含量就越大。
21
NTU 2012
抽样误差的规律性(1)
均数的抽样误差规律:
– 在样本含量足够大时,无论总体分布如何,其均数的 分布趋于正态分布(大数定律)
样本均数的标准差为 x
n
。
18
NTU 2012
标准误(standard error)
样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。
x
n
当总体标准差未知时,用样本标准差代替,
s
sx
n
前者称为理论标准误,后者称为样本标准误。
19
Sampling Distribution of sample means
14
NTU 2012
从正态总体中随机抽样,其样本均数服从正态分 布;
从任意总体中随机抽样,当样本含量足够大时, 其样本均数的分布逐渐逼近正态分布;
样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来
考察:
– 不同的分布 – 不同的样本含量
对统计量的影响。
9
均数的模拟试验
NTU 2012
从不同总体中进行抽样,观察均数的抽样分布规律。 – 正态分布总体 – 对数正态分布总体 – U型分布总体
考察: – 样本均数的均数与总体均数有何关系? – 样本均数的标准差与总体标准差有何关系? – 样本均数的分布形状如何?
– 在样本含量较小时: 总体为正态分布时:正态分布 总体为非正态分布时:?
22
NTU 2012
正态分布的标准化变化
若 X ~ N(μ,σ) , 则
X ~ N(0,1。)
因
X~N(,X),
则Fra Baidu bibliotek
u X ~ N(0,1)
。
X
23
NTU 2012
.2
从N(0,1)中1000次抽样的 u 值的分布(n=4)
SAMPLE 1:x11 x12 x13 x14...x1n
X1
原始
SAMPLE 2:x21 x22 x23 x24...x2n
X2
总体
μ
k个样本均数的频数分布图
SAMPLE k:xk1 xk2 xk3 xk4...xkn
Xk
12
NTU 2012
模拟试验
随机现象的模拟系统
13
NTU 2012
Sampling distribution for means
主要内容(Content)
NTU 2012
抽样误差及其规律性 标准误 抽样分布与t分布 总结
1
NTU 2012
了解抽样误差规律的重要性
总体
随机 抽样
同质个体、个体变异
样本
代表性、抽样误差
总体参数
未知
样本统计量
统计 推断
已知
风险
2
NTU 2012
两种研究思路
概率论:已知总体样本具有什么性质? 统计学:已知样本总体具有什么性质?