第五章 抽样分布

合集下载

5-抽样分布原理

5-抽样分布原理

2 1 0
1 2 3 4
样本均值的抽样分布(例续)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果如 下表
所有可能的n = 2 的样本(共16个) 第一个 观察值 第二个观察值 1 2 3 4
1
2 3 4
1,1
2,1 3,1 4,1
1,2
2,2 3,2 4,2
常用抽样分布 样本统计量的抽样分布

5.3.2.1 常用抽样分布


正态分布
χ2分布


t分布
F分布
χ2分布

设随机变量X~N(0,1),随机变量x1、 x2、…、x n为X的一个样本,x1、x2、…、 x n相互独立且均服从标准正态分布(0, 1),则χ2= x12 +x22 +…+xn2=∑xi2服 从自由度为n的χ2分布,记作χ2~χ2(n)。
P 1 P p ~ N P, n
wenku.baidu.com
样本方差的抽样分布
设总体服从正态分布N ~ (μ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 S2 的分布为
(n 1) S 2 ~ (n 1) 2
2
卡方 (2) 分布
选择容量为n 的
总体

第五章抽样分布的三张表

第五章抽样分布的三张表

表5-3 9个可能的样本及其样本平均数

表5-4 9个可能样本的平均数

表5-5 样本平均数的频数及概率分布

总体平均数和总体方差:

3

23

2)

-(32)

-(22)

-(1N

μ)

-(σ

2

33

21N

μ2

2

2

N

1

2

2

N

=

++=

=

=++=

=

=∑∑1

i i

i=i

x x

样本平均数的期望值k

)X (E k

1

∑==

i i

x

=(1.0+1.5+…+3.0)/9=18/9=2=μ

∑∑===

h 1

h

1

)X (E i i

i i

i

f f x

29

189

1

325.23225.111==

×+×+×+×+×=

样本平均数的方差为:

∑∑-h

1

h

1

2

2μ][)X (D ===

=i i

i i

i

x

f f x σ

3

19

39

1

2)-(322)-(2.532)-(222)-(1.512)-(12

2

2

2

2

=

=

×+×+×+×+×=

n 2

3

22

12

2

σ

σ

=

=

×

=

点估计的无偏性标准:

E(s2)=(0.5×4+2×2)/9=2/3=2

(05)第5章 抽样分布

(05)第5章  抽样分布
社会 统计学
第 5 章 抽样分布
刘向英
5-1
社会 统计学
第 5 章 抽样分布
§5.1 三种不同性质的分布
§5.2 一个总体参数推断时样本统计量分布 §5.3 两个总体参数推断时样本统计量分布
5-2
社会 统计学
学习目标
1. 了解总体分布、样本分布、抽样分布
2. 理解抽样分布与总体分布的关系
3. 掌握单总体参数推断时样本统计量的分布
2. 一种理论概率分布 3. 是推断总体均值的理论基础
5 - 11
社会 统计学
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。总 体的均值、方差及分布如下 总体分布
.3
均值和方差

x
i 1
社会 统计学
样本方差的抽样分布
5 - 27
社会 统计学
样本方差的分布
对于来自正态总体的简单随机样本,则比值 2 ( n 1) s 2 的抽样分布服从自由度为 (n-1) 2分布,即
(n 1) s 2 ~ (n 1) 2
2
5 - 28
社会 统计学
1. 设
X ~ N ( , 2 )
n=4 x 5 n =16 x 2. 5

第5抽样分布与参数估计

第5抽样分布与参数估计

例:在某省100多万农户抽取1000户调查 农户生产性投资情况。
第一阶段:从省内部县中抽取5个县; 第二阶段:从抽中的5个县中各抽4个乡; 第三阶段:从抽中的20个乡中各抽5个村; 第四阶段:从抽中的100个村中各抽10户。
样本n=100×10=1000(户)
返回
七、抽样调查中的几个基本概念
(1)简单随机抽样的抽样平均误差
对于重复抽样:
x
2
n
s2 n
p
P(1 P) n
p(1 p) n
对于不重复抽样:
x
s2 N n n N 1
修正系数
当 N 很大时,通常大于 500,N-1 近似为N,此时
x
s2 N n nN
s2 n
1
n N
抽样比
同理可得:
p
当 N 很大时
lim
n
p
1 n
n i 1
Xi
1
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使样本平均数稳定下来, 反映出事物变化的一般规律。
(二)正态分布的再生定理
如果变量 X 服从正态分布,总体的平
若不考虑顺序,则可把构成单位相同但抽 取顺序不同的视为同一个样本。

第五章 抽样分布与参数估计(程)

第五章 抽样分布与参数估计(程)
6-1
2015-4-11
第五章 抽样分布与参数估计
5


二战中的点估计— 德军有多少辆坦克? N的另一个点估计公式是:用观测到的最大编号乘以 因子1+1/n,其中 n 是被俘虏坦克个数。假如你俘虏 了10 辆坦克,其中最大编号是50,那么坦克总数的一 个估计是(1+1/10)50=55。此处我们认为坦克的实 际数略大于最大编号。 从战后发现的德军记录来看,盟军的估计值非常接近 所生产的坦克的真实值。记录仍然表明统计估计比通 常通过其他情报方式作出估计要大大接近于真实数目。 统计学家们做得比间谍们更漂亮!
统计推断是在对所要研究的总 体进行概率抽样的基础上,利用有 关的概率分布,根据样本数据去估 计或检验总体的数量特征。
抽样调查的特点
⒈抽样调查是非全面调查。 ⒉ 抽样调查的结果可以估计和推断总体的有关数 量特征。 ⒊ 遵循随机原则抽取调查单位。 ⒋ 抽样调查以概率论和数理统计为理论基础,所 以,抽样推断的结果具有一定的可靠程度,其 抽样误差可以估计和控制。
(一)全及总体和样本
1.总体 概念: 总体又称母体或全及总体,即 研究对象的全体。 总体的分类 总体按各单位标志性质不同,可分为 变量总体:各单位可用数量标志计量 无限总体:变量值无限, 有限总体:变量值有限 属性总体:各单位用品质标志描述
2.样本(或子样)
按随机原则从总体中抽取的部分单位所组 成的整体。 大样本: n 30 小样本: n<30

统计学基础 第5章抽样与抽样分布

统计学基础 第5章抽样与抽样分布
7
统计学 5.1.1 随机变量及其分布
STATISTICS
二、随机变量的概率分布 研究一个随机变量,我们总想知道它所有可能的取
值以及取这些值的概率。对应于所有可能取值的一系列 概率,称为随机变量的概率分布。 例:
如上表所示,列出随机变量的所有取值及相应概率 即为一个概率分布。
8
统计学 5.1.1 随机变量及其分布
统计学
的重要概率分布
STATISTICS
2、 分布


, 独立,则称随机变量
服从自由度为 的 分布,记为
3、F分布 设
变量
且 独立,则称随机 服从第一自由度为 ,第二自
由度 为的F分布,记为
24
5.1.3常用的几个由正态分布构造
统计学
的重要概率分布
STATISTICS
t分布与标准正态分布比 较图
STATISTICS
概率分布必须满足的基本条件: (1)概率是非负的,即必须大于或等于0; (2)所有可能取值的概率之和必须等于1。
csdf
9
统计学
5.1.2随机变量的概率分布
STATISTICS

离散型随机变量的概率分布:
公式法:


列表法:


图示法:
10
统计学
5.1.2随机变量的概率分布

第五章抽样分布

第五章抽样分布

(

x

)


第二节 几个常见的抽样分布
(一)总体服从正态分布 正态分布的再生定理:若总体变量
,从这个总体中抽取容量为
的样本,则样本均值

第二节 几个常见的抽样分布
独立同分布中心极限定理表明:无论
总体服从何种分布,只要其平均数和方差
存在,那么从中抽取的独立同分布样本
…, ,其均值在当 很大时,就会近似

x
都是常数,且
(5.7) ,则称
服从参数为 和 的正态分布,记作
。其概率密度函数图像见图5-1。
图5-1 正态分布概率密度函数图
第二节 几个常见的抽样分布
特别地,当参数 =0, =1时,这样的 正态分布为标准正态分布,记为 ,其 概率密度函数为:
(x)
1
x2

e
2
5
样本均值的方差

2 X

E( X 2 ) [E( X )]2
1000 900 100
总体方差
2 E( X 2) [E( X )]2 1100 900 200
由于n =2,从而验证了(5.1)的正确性。
第一节 抽样分布基本概念
由式(5.1)可知: 的平均数为 , 方差为 。随着 的增大,其方差越来越 小,从而 的取值越来越向着 靠拢,故用

第5章 抽样分布与抽样方法

第5章 抽样分布与抽样方法

统计量
1. 若X1, X2,…, Xn是来自总体X 的一个样本,
g(X1,X2,…, Xn)是X1,X2,…, Xn的函数, 若 g中 则称g(X1,X2,…, Xn)是一统计量。 不含任何未知参数,
注:统计量是随机变量。
x1,x2,…, xn是相应于样本X1,X2,…, Xn的样本值, 则称g(x1,x2,…, xn)是g(X1,X2,…, Xn)的观察值。
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数,用n表示。 • 样本个数:又称样本可能数目,指从一个总体中所 可能抽取的样本的个数。对于有限总体,样本个数 可以计算出来。样本个数的多少与抽样方法有关。 (这个概念只是对有限总体有意义,对无限总体没有 意义!)
例3:某大公司人事部经理整理其2500个中层干部 的档案。其中一项内容是考察这些中层干部的平 均年薪及参加过公司培训计划的比例。 总体:2500名中层干部(population ), 如果:上述情况可由每个人的个人档案中得知, 可容易地测出这2500名中层干部的平均年薪及标 准差。 假如:1:已经得到了如下的结果: 总体均值(population mean) =51800 总体标准差(Population standard deviation=4000
抽样的基本概念
• 抽样涉及的基本概念有: – 总体与样本 – 样本容量与样本个数 – 总体参数与样本统计量 – 重复抽样与不重复抽样 • 这些概念是统计学特有的,体现了统计学的基本 思想与方法。

第五章抽样分布

第五章抽样分布

第四章抽样与抽样分布

例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果:

例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:

1)随机抽取一人,收入超过18430元的概率?

2)抽取一个10人样本,平均收入超过18430元的概率?

例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少?

例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少?

例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、

1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表

2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7

例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。

应用统计学第5章抽样分布

应用统计学第5章抽样分布
14
⑵不重复抽样
——也称不放回抽样,指被抽到的单位不再放回总 体,每次仅在余下的总体单位中抽取下一个样本 的抽样方法。 特点: ①任一总体单位都不会被重复抽到; ②每次抽样结果都受到以前各次抽取结果的影响, 因此各次抽取结果是不独立的; ③可以一次抽取所需要的样本单位数。 在实际应用中通常采用的都是不重复抽样方法。
17
2.分层随机抽样
——也称类型抽样,是将总体按某一主要标志 进行分类(分组),分别从各类型组中随机抽取一 部分调查单位共同组成样本。 三种方法: (1)等数分配法 (2)等比分配法 (3)最优分配法
例如,对企业进行调查时将企业划分为特大型企 业、大型企业、中型企业和小型企业四个类型组。 对家庭收入进行调查时将居民家庭分为高收入、 中等收入、低收入三个类型组等。
6
(3)适用面广 许多社会经济现象不可能采用全面调查方法,如破坏性的产 品检验,矿藏资源的调查等等,只能用抽样调查。有些调查 则需要受过专业训练的人员或专用设备来获得有关数据,也 只能用抽样调查方法。此外当要调查的是无限总体时,就更 不可能进行全面调查。 (4)准确度高 由于抽样调查的工作较全面调查大大减少,调查人员可以 经过专门训练,因此可能取得更准确的结果。 例如对人口普查、统计报表制度等获得的全面调查结果, 通常需要采用抽样调查进行验证或修正。
25
2.影响抽样误差的主要因素

第5章统计量、抽样分布、探索性数据分析

第5章统计量、抽样分布、探索性数据分析
例5.3 设是 X1, X2, X3从正态总体 N (, 2 ) 中抽取的
一个样本,其中 为已知参数, 为未知参数,确定
下列那些量是统计量
X1X23X3 X123X2X3 X1X2X32
解 : 由 统 计 量 的 定 义 知 X 1 X 2 3X 3 , X 1 2 3X 2 X 3 是 统 计 量 ; X 1X 2 X 3 2 则 不 是 统 计 量 。
pM N
称 为 总 体 频 率 或 总 体 重 数 。
,2 ,p 统 称 为 总 体 特 征 数 。 显 然 , 它 们 是 由 总 体 唯 一
决 定 的 常 数 。 实 践 中 , 由 于 它 们 的 值 未 知 又 称 为 参 数 。
样本与统计量
一、样本
样本(Sample)
Def 按一定规则从总体中抽取一部分总体单元进行观 测或试验,这一抽取过程称为“抽样”,所抽取的部 分总体单元的整体称为总体的一个样本(子样)。 样本 中所包含的总体单元称为样本单元,样本中样本单元 的数目称为样本容量。
体分布相联系,一般求算比较麻烦,但对于iid样本有下列
结果。
如 果 总 体 X的 概 率 函 数 为 PXxpx, X1,X2, ,Xn
为 抽 自 总 体 X的 iid样 本 , 则 样 本 分 布 的 概 率 函 数 为
n
P(X1,X2, ,Xn)(x1,x2, ,xn) pxi i1

chapter5 抽样分布

chapter5 抽样分布
第5章 抽样调查和常用抽样分布
5.1抽样与抽样调查方法 5.2关于分布的几个概念 5.3由正态分布导出的几个重要分布 5.4样本均值的分布与中心极限定理 5.5样本比例的抽样分布 5.6两个样本平均值之差的分布 5.7关于样本方差的分布
5.1 抽样和抽样调查方法
抽样调查的四个阶段
抽样的种类
非概率抽样
分层的原则
层内变异性尽量小,层间变异 性尽量大。 分层抽样的分组标志,一般应 选择与被研究现象有关的重要标志。 通过分组,尽量缩小组内各单位标 志值的差异,增大组间各单位标志 值的差异,以便降低抽样误差。
分层抽样的适用情形
分层随机抽样是判断抽样和随机抽样相结合的一种混合型抽样
方法。 分层抽样适宜于由差异较大的单位所组成的总体。它将分组法 与随机原则结合起来,减少了各组内标志值的差异程度,使各组都有 抽取样本单位的机会,有利于提高样本的代表性,能得到比简单抽样 更为准确的结果,因此在实际工作中应用较广泛。 •需要获得有关总体的分类数据,将每类视为一层
t分布的定义
若X~N(0, 1),Y~2(n),X与Y独立,则
X T ~ t (n). Y n
称为自由度为n的t分布。
t分布的性质
(1) f(t)关于t=0(纵轴)对称; (2) f(t)的极限为N(0,1)的密度函数,即
1 lim f (t ) (t ) e n 2

第五章 抽样分布

第五章 抽样分布

分布顶端偏低, (3)和正态分布相比,t分布顶端偏低,尾部偏 )和正态分布相比, 分布顶端偏低 自由度df>30时,其曲线接近正态分布曲线, 高,自由度 时 其曲线接近正态分布曲线, df→∝时则和正态分布曲线重合。 ∝时则和正态分布曲线重合。
y → N (µ,σ )
2
当σ2已知
u=
y−µ
σy
= y − µ → N (0,1)
µy = µ
σy =
σ
n
样本平均数是一个服从正态分布的随机 变量, 因此可简写为: 变量,记为 Y ,因此可简写为:
Y 服 从 N µ, ) ( n 将平均数标准化, 将平均数标准化,则:
σ
2
u =
y−µ
σ
n
平均数的标 准误差
如果变量是正态的或近似正态分布, 如果变量是正态的或近似正态分布,则标准 化的变量服从或近似地服从N( , )分布。 化的变量服从或近似地服从 (0,1)分布。
2 P( x2≧ xα)=α (
例如: 自由度α=0.05的x2值 例如:查9自由度 自由度 的 P(x2 ≧16.919) P(χ2 ≧ 5.99)=0.05 5.99)=0.05 )=
df = 2
P(χ2 ≧ 9.21)=0.01 9.21)=0.01 )= P(χ2 ≧ 0.10)=0.95 0.10)=0.95 )=

第5章抽样分布与参数估计

第5章抽样分布与参数估计

x
2 N n
n N 1
(5.10)
上式中的 N 为总体单位数。与放回抽样相比,这里多了一个
N n 1 n ,这个系数称为不放回抽样的修正系数。由于
N 1
N
该系数在 0,1 之间,因此,不放回抽样的标准差比放回抽样小。
当 N 远大于 n 时,修正系数近似 1,修正与否对平均误差几乎没有
解: (1 2+3+4+5+6+7+8+9+10)/10=5.5
(1 5.5)2 (2 5.5)2 (10 5.5)2 /10 2.87228
E(X) 5.5
x
n
2.87228 /
2 2.0310
27
在不放回抽样的情况下,数学上可以证明,其样本平均数的期 望值同样等于总体的期望值。而样本平均数的标准差为:
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)

第5章抽样与抽样分布

第5章抽样与抽样分布

一个任意分 布的总体
σ σx = n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
µx = µ
X
4.2,4
样本均值抽样分布的特征
(均值与方差)ห้องสมุดไป่ตู้均值与方差)
1. 样本均值的数学期望
E(X ) = µ
2. 样本均值的方差
重复抽样 不重复抽样
σ =
2 X
σ
2
n
σ =10
n=4 σx = 5 n =16 σ x = 2.5
µ = 50
X
µx = 50
X
总体分布
抽样分布
中心极限定理
中心极限定理:设从均值为µ,方差为σ 2的一个任意总 中心极限定理: 的样本, 充分大时, 体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
4.1.1简单随机抽样 4.1.1简单随机抽样
sampling) (simple random sampling)
1. 从总体 个单位中随机地抽取n个单位作为 从总体N个单位中随机地抽取 个单位作为 个单位中随机地抽取 样本, 样本,每个单位入抽样本的概率是相等的 2. 最基本的抽样方法,是其它抽样方法的基础 最基本的抽样方法, 3. 局限性
样 本 均 值 的 抽 样 分 布 趋 于 正 态 分 布 的 过 程

第五章 抽样与抽样分布

第五章  抽样与抽样分布

第五章抽样与抽样分布

第一节抽样的基本概念

一、几个基本概念

1、目标总体和抽样总体

目标总体就是研究对象的全体。抽样总体是指从中抽取样本的总体。二者理应一致,但实际中有时难以保证。

2、抽样单元和抽样框

抽样总体的具体表现就是抽样框,通常是一份包含所有抽样单元的名单,好的抽样框应该尽可能多地提供与研究目标有关的辅助信息。抽样单元是构成抽样框的基本单位,可以是一个个体,也可以包含若干个个体,还可以分级。分级情况下,总体由若干个较大规模的抽样单元组成,为初级单元,每个初级单元又包含若干个规模较小的单元,为二级单元,以此类推。抽取哪一级,就需要有哪一级的抽样框。

3、抽样误差和非抽样误差

抽样误差是抽取样本的随机性造成的样本值和总体值之间的差异。只要采用抽样调查,抽样误差就不可避免,但可通过增大样本量来减小误差。非抽样误差是由于其他多种原因引起的样本值和总体值之间的差异。

三、抽样方案设计

1、抽样设计步骤:

明确调查目的,确定研究对象,确定目标量;

明确总体及抽样单元;(根据总体的定义,收集一份全部个案的名单)

对主要目标量的精度提出要求(误差控制在多大范围内);

选择抽样方法;

根据抽样方法、精度要求等确定样本量,并估计抽样误差;

制定具体步骤。

2、设计原则

(1)随机性原则——总体中所有个体被抽中机会相等。

(2)抽样效果最佳原则——在固定费用下,抽样误差最小;在要求精度下,费用最少。

第二节抽样方法

一、随机抽样

1、简单随机抽样:最基本的抽样方法,最符合随机原则,每个个体都有同样的被抽中概率。是其它复杂抽样设计的基础。使用随机数表。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章抽样与抽样分布

例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果:

例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:

1)随机抽取一人,收入超过18430元的概率?

2)抽取一个10人样本,平均收入超过18430元的概率?

例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少?

例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少?

例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、

1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表

2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7

例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。

例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少?

四、样本方差的抽样分布

设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布:

2χ=2222312(

)(

)(

).....(

)i x x x x μ

μ

μ

μ

σ

σ

σ

σ

----++++=

2

2

1

1

()

k

i

i x μσ=-∑

分子分母同乘n-1,进一步整理得2

χ=2

2

(1)n s σ-~2χ(n-1)

练习题:

1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为?

2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为?

3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是?

4、样本量为10的样本均值方差为12,则总体的方差为?

5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本

均值落在2-3.3之间的概率是?

6、某类球员的平均年薪为150万元,标准差为80万元,如果随机抽取100名球员,计算他们的平均年薪,超过100万元的概率为:()

A 0.2375 B近似等于0 C近似等于1 D 0.7357

7、正态总体均值为17,标准差为10,从总体中抽取一个容量为25的随机样本,样本均值的抽样分布为()

A N(17,4)

B N(10,2)

C N(17,2)

D N(10,1)

8、假设总体比例为0.4,采用重复抽样方法从中抽取一个容量为100的简单随机样本,则样本比例的分布为?

9、假设总体服从卡方分布,从该总体中抽取容量为100的样本,则样本均值的抽样分布()

A服从卡方分布B近似正态分布C二项分布 D F分布

相关文档
最新文档