第四章抽样与抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率抽样(probability sampling) 概率抽样
1. 2.
根据一个已知的概率来抽取样本单位, 根据一个已知的概率来抽取样本单位 , 也 称随机抽样 特点 按一定的概率以随机原则抽取样本 每个单位被抽中的概率是已知的, 每个单位被抽中的概率是已知的,或是 可以计算出来的
4.1.1简单随机抽样 简单随机抽样(simple random 简单随机抽样 sampling)
4.1.4整群抽样 整群抽样(cluster sampling) 整群抽样
将总体中若干个单位合并为组(群 抽样时直 将总体中若干个单位合并为组 群 ),抽样时直 接抽取群, 接抽取群,然后对中选群中的所有单位全 部实施调查 调查的地点相对集中, 节省调查费用, 调查的地点相对集中 , 节省调查费用 , 方便调查的实施 缺点是估计的精度较差
2.
3. 4.
二、抽样分布的形成过程
总 体
样 本
计算样本统计量 如:样本均值、 样本均值、 比例、 比例、方差
三、样本均值的抽样分布(举例说明) 举例说明)
【 例 】 设一个总体 , 含有 4 个元素 ( 个体 ) , 即总 设一个总体,含有4 个元素(个体) 体单位数N 体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 个个体分别为X 总体的均值、 、X4=4 。总体的均值、方差及分布如下 总体分布 总体均值和总体方差
E(x) =
2.
样本均值的方差 重复抽样 不重复抽样
2 σx =
σ2
n
百度文库
2 σx =
σ 2 N n
n N 1
抽样分布与总体分布的关系
总体分布
正态分布
非正态分布
大样本 小样本
正态分布
正态分布
非正态分布
4.4样本比率(成数)的抽样分布 样本比率(成数) 样本比率
总体中具有某种特征的单位占全部单位的 比例称为总体比例(总体成数),记为P; 比例称为总体比例(总体成数),记为 ; 总体比例 ),记为 样本中具有此种特征单位占全部样本单位 的比例称为样本比例 样本成数),记为p 样本比例( ),记为 的比例称为样本比例(样本成数),记为 可证明总体均值为P,总体方差为P(1-P), 证明总体均值为 总体均值 总体方差为 根据中心极限定理, 根据中心极限定理, 在大样本下(一般保证nP和 nP 在大样本下(一般保证nP和n(1-P)皆大于 5),样本比例近似服从正态分布: ),样本比例近似服从正态分布 样本比例近似服从正态分布: /n) p N(P,P(1-P)/n)
16个样本的均值 个样本的均值 第一个 观察值 1 2 3 4 第二个观察值 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 4 3 2 1 0 1 1.5 2 2.5 3 3.5 4
P(x)
x
样本均值的抽样分布
.3 .2
=
∑X
i=1
N
i
N
N i
= 2.5
2
.1 0 1 2 3 4
σ 2 = i=1
∑(X )
N
= 1.25
样本均值的抽样分布
现从总体中抽取 n = 2 的简单随机样本 , 的简单随机样本, 重复抽样条件下 共有4 16个样本 条件下, 个样本。 在 重复抽样 条件下 , 共有 42=16 个样本 。 所 有样本的结果如下表
4.1.3系统抽样 系统抽样(systematic 系统抽样 sampling)
将总体中的所有单位(抽样单位 按 将总体中的所有单位 抽样单位)按 抽样单位 一定顺序排列, 一定顺序排列,在规定的范围内随机地 抽取一个单位作为初始单位, 抽取一个单位作为初始单位,然后按事 先规定好的规则确定其他样本单位。 先规定好的规则确定其他样本单位。又 等距抽样、 称等距抽样、机械抽样
一个任意分 布的总体
σx =
σ
n
当样本容量足够 大时( 大时(n ≥ 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x =
x
中心极限定理 (central limit theorem)
x 的分布趋 于正态分布 的过程
数学期望与方差) 样本均值的抽样分布(数学期望与方差 数学期望与方差
1.
样本均值的数学期望
2)抽签法 )
4.1.2分层抽样 分层抽样(stratified sampling) 分层抽样
将总体单位按某种特征或某种规则 划分为不同的层, 划分为不同的层,然后从不同的层中独 随机地抽取样本,又称类型抽样 立、随机地抽取样本,又称类型抽样 保证样本的结构与总体的结构比较 相近, 相近,从而提高估计的精度
σ =10
n=4 σx = 5 n =16 σ x = 2.5
= 50
X
x = 50
x
总体分布
抽样分布
中心极限定理(central limit theorem) 中心极限定理
中心极限定理:设从均值为,方差为σ 2的一个任 中心极限定理: 意总体中抽取容量为n的样本, 充分大时, 意总体中抽取容量为n的样本,当n充分大时,样本 均值的抽样分布近似服从均值为 方差为σ 均值的抽样分布近似服从均值为、方差为σ2/n的正 态分布
i= 1 i
∑x
n
M (1.0 2.5)2 +L+ (4.0 2.5)2 σ2 = = 0.625 = 16 n
式中: 式中:M为样本数目 比较及结论:1. 样本均值的均值(数学期望)等于 比较及结论: 样本均值的均值(数学期望) 总体均值; 样本均值的方差等于总体方差的1/n 总体均值; 2. 样本均值的方差等于总体方差的1/n
所有可能的n 的样本( 所有可能的 = 2 的样本(共16个) 个 第一个 观察值 1 2 3 4 第二个观察值 1 1,1 2,1 3,1 4,1 2 1,2 2,2 3,2 4,2 3 1,3 2,3 3,3 4,3 4 1,4 2,4 3,4 4,4
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。 并给出样本均值的抽样分布
样本均值的分布与总体分布的比较
总体分布
.3 .2 .1 0 1 2 3 4
P(x)
4 3 2 1 0
抽样分布
1 1.5 2 2.5 3 3.5 4
= 2.5
σ2 =1.25
x = 2.5 2 σ x = 0.625
x
所有样本均值的均值和方差
1.0 +1.5 +L+ 4.0 x = = = 2.5 = M 16 n ∑(xi x )2 2 σ x = i=1
第四章 抽样与抽样分布
抽样与抽样估计的过程
总体
推断估计
样 本
样本统计量 例如:样本 例如: 均值、 均值、比例 、方差
4.1 常用的抽样方法 抽样方法 概率抽样
简 单 随 机 抽 样 等 距 随 机 抽 样 分 层 随 机 抽 样 整 群 随 机 抽 样
多 阶 段 随 机 抽 样
非概率抽样
方 便 抽 样 主 观 抽 样 定 额 抽 样 样 滚 雪 球 ” 抽 “
1.
2.
从总体N个单位中随机地抽取 个单位作 从总体 个单位中随机地抽取n个单位作 个单位中随机地抽取 为样本, 为样本,使得每一个容量为样本都有相同 的机会(概率) 的机会(概率)被抽中 抽取元素的具体方法有重复抽样 重复抽样和 抽取元素的具体方法有重复抽样和不重复 抽样
1)直接抽选法 ) 3)随机数码表法 )
4.2 抽样分布
一、抽样分布(sampling distribution)的概念 抽样分布 的概念
1.
样本统计量的概率分布, 样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时, 在重复选取容量为 的样本时,由该统计量 的样本时 的所有可能取值形成的相对频数分布 随机变量是 样本统计量 样本均值, 样本比例, 样本均值 样本比例,样本方差等 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 容量相同 提供了样本统计量长远而稳定的信息, 提供了样本统计量长远而稳定的信息,是进行推 断的理论基础, 断的理论基础,也是抽样推断科学性的重要依据
4.3样本均值的抽样分布与中心极限定理 样本均值的抽样分布与中心极限定理
当总体服从正态分布N 当总体服从正态分布 N(,σ2)时 , 来自该总体的所有 容量为n的样本的均值 也服从正态分布, 容量为n的样本的均值x也服从正态分布,x 的数 学期望为 方差为σ 学期望为,方差为σ2/n。即x~N(,σ2/n)