抽样误差及其规律性

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n
x1
n
s1
t1
x1 s1 n
n
x2
s2
t2
x2 s2 n
x100
s100
t100
x 100 s100 n
f ( t)
=∞(标准正态曲线) =5 =1
0.3
0.2
0.1
-4
-3
-2
-1
0
1
2
3
4
图4.2 自由度分别为1、5、∞时的t分布
t分布的特征
100.00
25
20
Frequency
15
10
5
0 169 170 171 172 173 174 样本均数 175 176 177 178
100个样本均数的分布
Sampling distribution for means
X Population A Population B X Population C X Population D X
n=2
X
n=4
X
n=10
X
n=25
X
Sampling Distribution of sample means Sampling Distribution of sample means Sampling Distribution of sample means Sampling Distribution of sample means

样本统计量的标准差称为标准误
样本均数的标准差称均数为标准误
x

n
标准误(standard error,SE),

实际工作中, 往往是未知的,一般可用样本 标准差s代替 :
sx
s n


前者称为理论标准误,后者称为样本标准误。
标准差s随样本含量的增加而趋于稳定,故增加 样本含量可以降低抽样误差。
均数的抽样误差之特点



各样本均数未必等于总体均数; 样本均数间存在差异; 样本均数的分布很有规律,围绕总体均数,中 间多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大 大缩小; 随着样本含量的增加,样本均数的变异范围逐 渐缩小。
标准误(standard error,SE),

t分布为一簇单峰分布曲线 t分布以0为中心,左右对称
wk.baidu.com

t分布的形状与自由度有关

自由度越小,曲线越“扁平” ;

自由度越大,曲线越“瘦高” ;
当自由度为无穷大时, t分布曲线与标准正态分布 曲线完全吻合。

t分布的特征

每一自由度下的t分布曲线都有其自身分布规律
t分布表明,从正态分布总体中随机抽取的样本,
推断统计学的先驱
W. S. Gosset (1876-1937)

小样本理论和方法论的创立者,现代统计方 法及其应用于实验设计与分析的先驱。


研究并建立了相关系数的抽样分布;
研究了Poission分布应用中的抽样误差问题;
R.A.Fisher称他为“统计学中的法拉第”。
N( ,
2 )
S1= 5.23 x1,x2,x3…x10
x 2=175.07
S2= 4.72
x1,x2,x3…x10
样本含量n =10 抽样次数m =100
x
100=172.72
S100= 6.25
x1,x2,x3…x10
某市20岁男子身高均数的抽样分布
样本均数的组段 频数 频率(%)
已知:
μ=173.86cm σ= 5.18cm

从非正态(non-normal)分布总体(均数为 μ,方差为σ)中随机抽样(每个样本的含
量为n),可得无限多个样本,每个样本
计算样本均数,则只要样本含量足够大
(n>50),样本均数也近似服从正态分布。

样本均数的均数为
样本均数的标准差为
X

n
[例]某市140名20岁成年男子身高情况
2 u变换
X

X
~ N ( 0,1)
X ~ N ( , ) u
2 X u变换
X
~ N ( 0,1)
t分布

设从正态分布N(,2)中随机抽取含量为n的样本,样
本均数和标准差分别为 和s,设:
t X X sX s n

则t值服从自由度为n-1的t分布(t-distribution)。 Gosset于1908年在《生物统计》杂志上发表该论文时 用的是笔名“Student”,故t分布又称Student t分布。
抽样误差的规律性

抽样误差与个体变异有关,个体变异 越大,抽样误差越大,反之,越小;

抽样误差与样本含量有关,样本含量 越大,抽样误差越小,反之,越大; 样本含量接近总体数时,抽样误差逐 渐消失。
不同的统计指标有其特定的抽样分布。

正态分布的标准化变换
X ~ N ( , ) u

中心极限定理(central limit theorem)

从正态分布总体N(, 2) 中随机抽样(每 个样本的含量为n),可得到无限多个样 本,每个样本计算样本均数,则样本均 数也服从正态分布。

样本均数的均数为

样本均数的标准差为 X

n
中心极限定理(central limit theorem)
μ=173.86cm σ=5.18cm
Frequency
40 35 30 25 20 15 10 5 0 160 163 166 169 172 175 178 Height(cm) 181 184 187 190
μ=173.86cm σ=5.18cm
x1,x2,x3,x4… x140
x 1=173.37
由样本计算的t值接近0的可能性较大,远离0
的可能性较小。
1- α α/2 α/2
-tα,v

0
tα,v
t分布曲线下的面积分布
t分布曲线下的面积规律
Sampling error and its inherent attributes
抽样误差及其规律性
抽样误差的概念

由于总体中个体变异的存在,在抽样过程中 产生的样本统计量与总体参数间的差异

两种表现形式:

样本统计量与总体参数间的差异 样本统计量间的差异

抽样误差产生的基本条件

个体变异
抽样研究
x 5.18
10 1.64( cm )
169~ 170~
171~ 172~
2 4
9 21
2.00 4.00
9.00 21.00
X=173.63cm
Sx=1.69cm
173~ 174~ 175~ 176~ 177~178
合计
23 20 14 4 3
100
23.00 20.00 14.00 4.00 3.00
相关文档
最新文档