chapter5 抽样分布.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并且X1,X2 相互独立,则X1+X2 ~2(n1+n2)
2分布表及有关计算
(1)构成 P{2(n)<λ}=p,已知n,p可查表求得λ;
(2)有关计算
P 2 (n) p



2 p
(n)
上侧分位数
λ
2分布的极限分布
• 2分布的极限分布是正态分布
5.3.2 t分布
f (t)
1、定义 若X~2(n1),Y~2(n2) ,X,Y独立,则
F

X Y
n1 n2
~
F (n1,
n2 )
称为第一自由度为n1 ,第二自由度为n2的F—分布, 其概率密度为
h(
y)


(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1

0,
n2
n1 n2
) y n1 / 2
lim f (t) (t)
1
t2
e 2 , x
n
2

t分布表及有关计算
上侧分位数:
P{t(n)>λ}=p
双侧分位数:
p
P{|t(n)|>λ}=2p,λ=tp(n)
t1 p (n)
t p (n)
t1 p (n) t p (n)
t分布的极限分布是正态分布
5.3.3 F分布
分层抽样的适用情形
分层随机抽样是判断抽样和随机抽样相结合的一种混合型抽样 方法。 分层抽样适宜于由差异较大的单位所组成的总体。它将分组法 与随机原则结合起来,减少了各组内标志值的差异程度,使各组都有 抽取样本单位的机会,有利于提高样本的代表性,能得到比简单抽样 更为准确的结果,因此在实际工作中应用较广泛。
•需要获得有关总体的分类数据,将每类视为一层 •总体的内部结构差异显著,为保持样本的代表性必须分层 •为提高总体指标或参数的估计的精度,需要分层 •为适应行政管理的需要而分层
分层抽样中抽样单位数的分配
•按比例分配法 •定额抽样法 •奈曼分配法 •经济分配法
按比例分配法
N----------- 总体容量 Ni ----------第i层的容量 n -----------样本容量 ni ----------来自第i层的样本数目
有意抽样 机会抽样 判断抽样 ……
概率抽
主要依据研究者的主观意愿、判断或是否 方便等因素抽取样本;误差大,难以估计,代 表性小,适合探索性研究。也叫判断抽样,主 要有:偶遇抽样、判断抽样、定额抽样、滚雪 球抽样等等。
概率抽样
依据概率论的基本原理,按照随机原 则进行抽样;主要有:简单随机抽样、系 统抽样、分层抽样、整群抽样、多段抽样 等等。
容初步认识或者建立假设.
判断抽样
• 重点抽样 • 典型抽样 • 代表抽样 • 特点:判断抽样是主观的,样本选择的好坏取
决于调研者的判断、经验、专业程度和创 造性.
• 优点:成本低,易操作 • 局限性:调查结果不能用于对总体的推断
自愿样本
• 调查结果不能用于对总体的推断 • 能提供许多有价值的信息,反映某类群体的
常用统计量
• 样本均值
• 样本(修正)方差、样本(修正)标准差
• 样本变异系数 • 样本的原点矩 • 样本的中心矩 • 样本偏度 • 样本峰度
• 中位数 • 分位数 • 四分位数 • 样本极差
抽样分布
统计量从一个具体的样本来看,是一个值;从 广义上看,具有随机性 ,是一个随机变量,有自己 的分布——抽样分布。
系统抽样时用来排队的标志
一种是与被调查的内容无关,称为无关标
志,在这种情况下,等距抽样与简单抽样相 仿,因为被研究总体是随机总体。
另一种是与被调查的内容有关,称为有关
标志。在这种情形下,等距抽样与分层抽样 相仿,因为它类似于按某个标志等距分组, 利用了总体的有关信息。
系统抽样的抽选步长
h=【N/n】
• 例如:对城市职工进行家计调查,先把职工
按所有制形式分为国有经济单位职工。集体 经济单位职工和其他所有制单位职工,然后 再从各组职工中随机抽样本单位。
分层的原则
层内变异性尽量小,层间变异 性尽量大。
分层抽样的分组标志,一般应 选择与被研究现象有关的重要标志。 通过分组,尽量缩小组内各单位标 志值的差异,增大组间各单位标志 值的差异,以便降低抽样误差。
•排队中的周期性 •h=【N/n】是自然数
系统抽样的抽选方法
原则:保证样本的代表性 方法:
随机起点等距抽样法、中点定位等距抽样法、 对称等距抽样法、半步长定位等距抽样法、循环等 距抽样法
系统抽样的特点
系统抽样在实际工作中广为采用,它能 使被抽选的各单位更均匀地分布在总体各个 部分,提高了样本对总体的代表性。
第5章 抽样调查和常用抽样分布
5.1抽样与抽样调查方法 5.2关于分布的几个概念 5.3由正态分布导出的几个重要分布 5.4样本均值的分布与中心极限定理 5.5样本比例的抽样分布 5.6两个样本平均值之差的分布 5.7关于样本方差的分布
5.1 抽样和抽样调查方法
抽样调查的四个阶段
抽样的种类
非概率抽样
,,
X
n
iid
~
N
(,

2
)
则U
X
~ N(0, 1)
证明
X
系统抽样与分层抽样的区别
• 系统抽样在所分的每个相等部分中只抽取一个
单位,且中选单位总处在每个部分中的同样位 置或对称位置。
• 分层抽样在所分的每个组中抽取若干个单位,
每个组的单位可以相等或不等。即使每个组只 抽一个单位,但每组的中选单位不一定处于相 同位置或对称位置。
(5)多阶段抽样
多阶段抽样又称多级抽样,分为两个或两个以上 阶段实施的抽样。在不同阶段抽样单位的概念不同。 在抽样的第一阶段,抽选若干个较大的单位入样; 在第二阶段,首先将入样的各一级抽样单位分为若 干较小的二级单位,然后从入样的二级单位中各抽 选若干二级单位入样,依次类推,直到最终获得全 部样本。
5.2.1总体分布&抽样分布 5.2.2渐近分布&精确分布 5.2.3随机模拟获得的近似分布
5.2.1 总体分布&抽样分布
• 总体 • 总体分布 • 样本 • 样本的分布 • 抽样分布
回顾:统计量
•统计量的概念
统计量是样本的函数,并且不依赖于任何未知的 参数。比如:样本均值、样本方差等等。
•统计量是统计推断的基础。 •常用统计量
n

t 2 p1
2p
p
t2Np1 p n N2p t2 p1 p
简单随机抽样的实施
1. 抽签法 2. 随机数法
(2)分层抽样
• 又称类型抽样,先对总体各单位按主要标志
加以分组成两两不相交的典型组,每个典型 组称做一层(类或者组)然后再从各组中按 简单随机抽样的原则抽选一定单位构成样本。
实际中,大量抽样调查多是分阶段抽样进行的, 并且在不同阶段可能采用不同的抽样方式和方法。 分阶段抽样的总误差等于各阶段抽样误差之和。
你还能举一些抽样的例子吗?
非概率抽样
• 方便抽样 • 判断抽样(重点、典型、代表抽样) • 自愿样本 • 滚雪球样本 • 配额抽样
方便抽样
• 优点:容易实施,调查的成本低 • 局限性:调查结果不能用于对总体的推断 • 使用方便样本可以产生一些想法,对研究内
普查&抽样调查
概率抽样的特点
• 按照一定的概率以随机原则抽取样本 • 每个单位被抽中的概率是已知的 • 推断时要考虑到每个样本单位被抽中的概率
概率抽样并不意味着等概率抽样
抽样调查中常见的概率抽样方法
简单随机抽样 分层抽样 整群抽样 系统抽样 多阶段抽样
(1)回顾:简单随机抽样的特点
群的划分通常是自然形成的。比 如:成箱包装的同种产品、在校学生的 教学班等。群中的单位数称做该群的容 量,群的容量可以相同也可以不同。
整群抽样的特点
便于选择抽样框 费用低,方便实施调查 估计的精度较差
费用和效果的权衡
整群抽样与分层抽样的区别
• 分层要求增大组间差异,缩小组内差异,以利
于提高样本代表性;而分群要求缩小群间差异, 增大群内差异来提高样本代表性。因为对中选 群是作全面调查,群间差异越小,中选群的代 表性就越大。
ni = n Ni /N
每层入样单位的比例,恰好等于该层的单 位总数Ni在总体单位总数N中所占的比例。
定额抽样法
定额抽样法,又称配额抽样法。 是根据调查的目的和要求按照事先规 定的比例配额确定从每层抽取的单位 数的一种抽样方法。
奈曼分配法
从每层抽选的单位数ni与该层的单位总 数Ni和样本标准差Si之积成正比例的一 种分配方法,即
按随机原则直接从总体N个单位中抽取 n 个单位作为样本。
抽样时分还原抽样和非还原抽样。
(1)回顾:简单随机抽样样本容 量的计算方法
想一想,为什么是这样?
通过抽样极限误差公式计算必要的样本单位数。
抽样平均数
重复抽样:
n

t
2
2 x
2x
不重复抽样:n

t
2
N
2 x
2x N t 2
2 x
抽样成数
——样本的均值的分布
(总体为自由度为3的卡方分布,样本容量20 )
抽样次数=2000
抽样次数=5000
想一想
X
S2 n
5.2.3随机模拟获得的近似分布
• ADF检验
5.3由正态分布导出的几个重要分布
5.3.1 卡方分布 5.3.2 t分布 5.3.3 F分布
5.3.1 卡方分布
• 卡方分布的定义
抽样分布的例子 ——样本均值的抽样分布
对来自正态总体X~N(,2)的简单随机样
本,样本均值
n
xi
x i1 n
n
X

Xi
i 1
n
~
N


,
2
n

X ~ N0,1
2
n
5.2.2渐近分布 ——以中心极限定理为例
不同自由度的卡方分布
中心极限定理的一个例子
分层 高 中 低
分群
大中 小
大中 小
大中 小
大中 小
(4)系统抽样
又称机械抽样、等距抽样。是指先将总体各单
位按照一定规则(或某个标志)将抽样单位依次 排列,并随意确定一个抽样的起点,按样本容量 n将所有总体单位N分为n个相等的部分,每个部 分包含K个单位。然后依固定抽样的间隔(步长) 抽取单位。再用随机抽样方法确定在每个部分中 的抽样序号i(i=1,2,…,K),从每个部分 的K个单位中抽取排序为i的那一个单位组成样本 的一种抽样组织形式
n1 1 2
,
y)(n1 n2 ) / 2
y0
y0
F分布表及有关计算
p

P{F(n1,n2)>λ}=p,记做上侧分位数λ=Fp(n1,n2)
F分布与t分布的关系 • 自由度为v的t分布是F(1,v)分布
5.4样本均值的分布与中心极限定理
一、正态总体的样本均值的抽样分布
1、若
X1,
X
2
抽样原 则
非随机 抽出样 本,主 观性强
误差判 断
不能计 算和判 断抽样 误差
应用
可随 时随 地采 用
优缺点
不够科学规 范,但省钱 、省事、灵 活方便
随机 抽样
以部分 推断总 体
随机抽 出样本 ,客观 性强
不能计 算和判 断抽样 误差
只能 定期 采用
科学规范, 但费时、费 钱、不够灵 活方便
5.2关于分布的几个概念
一般看法.
滚雪球样本
• 适用于对稀少特定群体的调查 • 调查成本低
配额抽样
• 什么是配额抽样 • 特点:操作简单,可以保证总体中不同类别的
单位都能包括在所抽取的样本中.
• 调查结果不能用于对总体的推断
概率抽样与非概率抽样的比较
因调查目的不同而不同
抽样 方法
非随 机抽 样
作用
研究总 体的局 部现象
2分布的密度函数曲线
f
( y)

1 2n/ 2 (n/ 2)
n 1 y
y2 e 2
,
y

0
0,
y0
2分布的性质
(1) 2分布的数学期望
E( 2) n
(2) 2分布的方差
D( 2 ) 2n
(3) 2分布的可加性 X1 ~ 2 (n1 ) X 2 ~ 2 (n2 )
( n 1) 2
(1
t
2
n1
)2
,
n ( n) n
2
t
概率密度曲线
t分布的定义
若X~N(0, 1),Y~2(n),X与Y独立,则
T X ~ t(n). Yn
称为自由度为n的t分布。
t分布的性质
(1) f(t)关于t=0(纵轴)对称;
(2) f(t)的极限为N(0,1)的密度函数,即
ni=n NiSi NiSi
经济分配法
同时考虑变异性和费用的一种分配抽样 单位的方法。
NiSi/Ci ni=n NiSi/Ci
(3)整群抽样
将总体各单位划分成许多两两不相交的 群,然后从其中随机抽取部分群,对中选群 的所有单位进行全面调查的抽样组织形式。
整群抽样中群的划分原则
群内变异性尽量大,群间变异性 尽量小。
相关文档
最新文档