统计学第4章抽样调查

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样调查的理论基础 概率论
大数定律
中心极限定理
大数定律
• 大数定律是指在随机试验中,每次出现的结
果不同,但是大量重复试验出现的结果的平
均值却几乎总是接近于某个确定的值。其原 因是,在大量的观察试验中,个别的、偶然 的因素影响而产生的差异将会相互抵消,从 而使现象的必然规律性显示出来。
• 例如,观察个别或少数家庭的婴儿出生情况,
发现有的生男,有的生女,没有一定的规律
性,但是通过大量的观察就会发现,男婴和
女婴占婴儿总数的比重均会趋于50%。
中心极限定理(P97)
• 大数定律揭示了大量随机变量的平均结果,但
没有涉及到随机变量的分布的问题。而中心极
限定理说明的是在一定条件下,大量独立随机 变量的平均数是以正态分布为极限的。
论证了:
地图:在地图上将调查单位分布在各个地区, 然后根据地区进Hale Waihona Puke Baidu抽样。
(五)样本可能数目
样本可能数目又称样本个数,是指从一个有N
个单位的总体中抽取容量为n的样本时,有
可能出现的所有样本的个数。
重置抽样考虑顺序时,样本可能数目 M Nn 不重置抽样时,样本可能数目为: N! M n!( N n)!
后,再把这个单位重新放回总体,使之继续参加下次抽 选。这种抽选法也称为回置抽样或重置抽样。
重复抽样法由于前一次抽中的单位又被放回总体中, 不会影响后面的抽选,所以总体中每个单位被抽中的机
会均等连续抽选各单位都是独立进行的的。
2、不重复抽样 不重复抽样是指每次从总体中抽取一个单位进行观察 后不再把这个单位重新放回总体,这个总体单位不再继续 参加下次抽选。这种抽选法也称为不回置抽样或不重置抽 样。 不重复抽样法由于每次抽中的单位不再放回总体中, 每抽选一次,总体中的单位就减少一个,使连续抽选的 各个单位不相互独立。但是总体中各单位被抽中的机会 仍然是均等的! 不重复抽样按是否考虑抽选样本单位的顺序,又可分 为有顺序不重复抽样和无顺序不重复抽样两种。有顺序 不重复抽样即通常所说的不重复排列。按这种抽样方法 只要有一个单位不同,就算不同的样本。
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计 量(已知量)
特点之二:按随机原则抽取样本
并非所有 随机样本: 与总体分布 的抽样估 特征相同 计都按随 机原则抽 取样本。 非随机样本: 也有非随 与总体分布 特征不同 机抽样。
特点之三:存在估计误差,并可加以控制。
抽样 推断 误差
登记误 差 代表性误 差
xX x Xx x x x
p P p P p p p p
p 其中 x 、 分别表示抽样平均数和抽样成数的极限误 差。
五、抽样估计的可靠程度
抽样极限误差通常要以抽样平均误差为尺度来度
量,也就是说,抽样极限误差的大小相当于几个抽样
抽样误差范围的实际意义是要求被估计的 全及指标 X 或P落在抽样指标一定范围内,即
落在 x x 或 p p 的范围内。 例
当F(t)=68.27%时,抽样极限误差等于抽样平均误差 的1倍(t=1);
( x x) 2

计算平均数即平均工资:
xf 28000 x 560 ( 元) f 50
2 ( x x ) f 52640 样本 s 标准差 32 . 45 ( 元) f 50
s 32 . 45 抽样平 均 误 差 4 . 59 ( 元) x n 50
(二)区间估计
是根据样本指标和抽样误差去推断全及
指标的可能范围,它能说清楚估计的准确程
度和把握程度。
根据中心极限定理,得知当n足够大时,抽样 总体为正态分布,根据正态分布规律可知,样本 指标是以一定的概率落在某一特定的区间内,统
计上把这个给定的区间叫抽样极限误差,也称置
信区间,即在概率F(t)的保证下: 抽样极限误差△=tμ ,(t为概率度) 可见,抽样极限误差,即扩大或缩小了以 后的抽样误差范围。
平均误差,能有多大的概率保证误差不超过此范围。
t是测量估计可靠程度的 一个指标,称为抽样误 差的概率度 概率保证程度用 F ( t) 表示。 其中 t x 或 t. x x
x
• • • •
当t=1时,F(t)=0.6827; 当t=1.5时,F(t)=0.8664; 当t=2时,F(t)=0.9545; 当t=3时,F(t)=0.9973.
x

n 2 n
x
抽样平均数的平均误差例题: 某工厂有1500个工人,用简单随机重复抽样的 方法抽出50个工人作为样本,调查其工资水平 资料如下:
月平均工资(元) 52 4 工人数 4 53 4 6 54 0 9 55 0 10 56 0 8 580 6 60 0 4 660 3
计算样本平均数和抽样平均误差。
2.不重置抽样:
x
2
Nn

n
N 1
但 实 际 中 , 往 往 N 很 大 , n 很 小 , 故 改 用 下 列 公 式 :
2 n ( 1 ) x n N
上 例 中 , 若 为 不 重 复 抽 样 , 则 : 4 0 0 1 0 0 (1 ) 1 .9 9 (小 时 ) x 1 0 0 1 0 0 0 0
调查(随机抽样):按照随机原则从总体中抽 取一部分单位进行观察,并运用数理统计的 原理,以被抽取的那部分单位的数量特征为
代表,对总体作出数量上的推断分析。
抽样调查的特点:
1.按随机原则抽选调查单位; 2.用样本推断总体; 3.在调查之前可以计算和控制抽样误差。
抽样调查(抽样推断)的概念
抽样推断:即根据样本统计量推断总体参数的 过程。也叫抽样估计。 抽样调查的特点之一:由部分推断总体
误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。
2. 说明样本指标和总体指标相差的一般范围。
抽样误差的意义:
指所有可能样本的指标(所有的统计量)
与总体指标(参数)的平均离差,反映 抽样误差的一般水平。
二、抽样平均误差
抽样平均误差指所有可能样本(统计量)的指 标与总体指标(参数)的平均离差。通常用μ 表示。其定义为:
(二) 总体成数的抽样平均误差
1.重置抽样
p ( 1 p ) p n n

2.不重置抽样:
n
2
p
N n

N 1


p( 1-p) N n n N 1
抽样成数的平均误差例题:
某钢铁厂生产某种钢管,现从该厂某月生产的500根产 品中抽取一个容量为100根的样本。已知一级品率为 60%,试求样本一级品率的抽样平均误差。 解:已知p=60% 、n=100、N=500
(一)点估计
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x 直 接 代 表 X , 用 p 直 接 代 表 P 。
例 在 全 部 产 品 中 , 抽 取 1 0 0 件 进 行 仔 细 检 查 , 得
到 平 均 重 量 x1 0 0 2 克 , 合 格 率 p 9 8 % , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1 0 0 2 克 , 合 格 率 P 9 8 % 。
解:先列表 x 524 534 540 550 560 580 600 660 f 4 6 9 10 8 6 4 3 50
(x x)2 f xf 2096 1296 5184 3204 676 4056 4860 400 3600 5500 100 1000 4480 0 0 3480 400 2400 2400 1600 6400 1980 10000 30000 28000 52640
第四章
抽样调查
• 重点与难点:
• 重点:
抽样调查的意义 抽样平均误差的意义及计算
总体参数的点估计与区间估计的方法
• 难点:
抽样平均误差的计算
总体参数的区间估计
• 学习内容:
一、抽样调查的基本问题 二、抽样误差 三、参数估计 四、抽样调查的组织形式
第一节 抽样调查的基本问题
一、抽样调查的意义 一般所讲的抽样调查,即指狭义的抽样
(四)抽样框
抽样框 ——是指包含有全部总体单位及其主要指标特
征的一个框架或列表。
以确定总体的抽样范围和结构。设计出了抽 样框后,便可采用抽签的方式或按照随机数
表来抽选必要的单位数。若没有抽样框,则
不能计算样本单位的概率,从而也就无法进
行概率选样。
(四)抽样框
抽样框 的形式一般有两种: 一览表:表中列出所有总体单位。
重复抽样下:
p ( 1 p ) 60 % 1 60 % 4 . 9 % p n 100
不重复抽样下:
p

p 1 p n 1 n N
60% (1 60%) 100 (1 ) 4.4% 100 500
四、抽样极限误差
样本指标围绕总体指标左右两侧波动形成的一定范围。 把可允许的误差范围叫做抽样极限误差,即
X

2
总体成数P
总体标准差 总体方差
样本成数p
样本标准差S 样本方差 S
2

(三) 抽样方法
重置抽样:即有放回抽样。 不重置抽样:即无放回抽样,每个总体只能 有一次被抽中的机会。
样本单位的抽选方法
在组织抽样调查时,根据样本单位是否重复抽取,
分别有重复抽样和不重复抽样两种方法。
1、重复抽样 重复抽样是指每次从总体中抽取一个单位进行观察
2 ( x X ) 总 体 平 均 数 的 抽 样 平 均 误 差 x
M
p ( 1 p ) 总 体 成 数 的 抽 样 平 均 误 差 p M 其 中 , M 表 示 所 有 可 能 的 样 本 数 目 。
三、抽样平均误差的计算
(一) 总体平均数的抽样平均误差
1.重置抽样

• 这就表明,抽样误差范围与可靠程度之间的数 量关系。当抽样误差范围扩大时,就可以提高 抽样推断的可靠程度;反之,缩小抽样误差范
围,推断的可靠程度就降低。
第三节 参数估计
一、点估计和区间估计
只要在样本代表性大,且对全及指标精确
性要求不高的情况下,可采用点估计法。如
能满足下列三个准则: 无偏性 一致性 有效性 就会得到合理的估计。
用设计、培训、管理等 方法消除 用抽样方法、样本容量 等手段控制
二、抽样调查的适用范围
抽样调查方法是市场经济国家在调查方
法上的必然选择,和普查相比,它具有准确
度高、成本低、速度快、应用面广等优点。
一般适用于以下范围:
1.总体范围较广,不需要了解每一个别单位的情况;
2.对破坏性或消耗性产品的质量进行检验;
1、如果总体很大,而且服从正态分布,样本平均数的 分布也同样服从正态分布。 2、如果总体很大,但不服从正态分布,只要样本容量 足够大,样本平均数的分布趋近于正态分布。 3、样本平均数的的平均数,等于总体平均数。
第二节 抽样误差
一、抽样误差的概念 抽样误差是指在抽样调查中,由于随机抽样的 偶然性因素,使样本的结构不足以代表总体的 结构,而引起的样本指标与总体指标之间的绝
(二) 参数和统计量
参数:描述总体特征的指标。 统计量:描述样本特征的指标。
抽样推断的目的就是要通过对样本的平均数、成数的标 准差(或方差)的测量来推断总体的相应特征值。
主要统计特征数及符号
总体参数 特 征 数 及 符 号 总体单位数N 总体平均数 样本统计量 样本(单位数)容量n 样本平均数 x
对离差。
即指随机误差,这种误差是抽样调查固有的误 差,是无法避免的。
即 xX 、 p P 。
抽样误差的影响因素:
1. 总体标志变异程度。——正方向变化关系 2. 抽样单位数目的多少,即样本容量。 ——反方向变化关系 3. 不同的抽样方法。 4. 不同的抽样组织形式。
抽样误差的作用:
1. 在于说明样本指标的代表性大小。
3.对普查或全面调查的统计资料进行检查和修正。
三、抽样调查的几个基本概念
(一) 总体和样本
总体:所要调查观察的全部事物。 总体单位数用N表示。 总体可以分为有限总体和无限总体。 样本:从总体中抽取出来那部分单位所组成的集合体。 样本是总体的一个缩影。 抽样总体的单位数,即样本容量,用n表示。 n ≥ 30 大样本 n < 30 小样本
相关文档
最新文档