社会调查之抽样误差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

其中:Xi 为分布中任何一个值,µ是平均数;σ是标准 差。
Z是距离平均数µ的标准差单位,又称Z分数。
三、抽样平均误差
——即抽样平均数(或抽样成数)的标准差, 它反映抽样平均数(或抽样成数)与总体平 均数(或总体成数)的平均误差程度
重复抽样条件下:
样本平均数 的抽样平均误差
重复抽样条件下:
能出现的样本统计值的分布情况。
例:
我们先来看一个总体为10个个案的平均数 抽样分布。
假如这10个人参加工作的年限分别为6、7 、8、9、10、11、12、13、14、15年。
举例:总体为10个个案的平均数的抽样分布
百度文库本容量为1,10次取样
样本容量为2,45次取样
样本容量为3,120次取样
样本比例p 的抽样平均误差
不重复抽样条件下:
样本平均数 抽样平均误差
不重复抽样条件下:
样本比例p 抽样平均误差
四、抽样极限误差
—— 在抽样推断中,抽样指标是一个围绕全 及指标上下随机波动的变量,波动的幅度 可以根据需要事先给定,这个可允许的误 差范围,被称为抽样极限误差,又称绝对 误差
〈例〉某校同学的身高为正态分布,平均值为170cm, 标准差为10cm。
解:根据已知条件得:
根据给定的极限误差范围,确定总体 成数的上限和下限
结论:
(1)点估计:估计该市居民空调机普及率 为80%,其误差不超过3.5的可靠程度为
90% (2)区间估计:在90%的概率保证程度下 ,估计该市居民户空调机的普及率在 76.5%-83.5%之间
处理该类问题的要点:
1) 抽样分布的规律性:样本均值或样本比例 的分布是以总体均值为均值,抽样误差为标 准差的正态分布,即(以简单随机重复抽样 为例):
问:(1)高于平均数1.5个标准差的同学身高是多少?
(2)162cm身高的同学距离平均数有几个标准差?
(3)95%的同学身高会在什么范围内?
解1: 解2:
解3: (150.4~189.6)
五、样本规模
(一)影响样本规模的因素 1、抽样精度 2、总体标准差
(二)样本规模的估算 (基本样本量)
样本容量为4, 210次取样
样本容量为5,252次取样
变化趋势
平均数的范围将逐步缩小(即底部越来越 窄);相同的平均数会相应增多;全部平均数 的分布向总体平均数集中的趋势也会越来越 明显。
中心极限定理
在一个含有N个元素且平均数为μ,标准差为σ的总体 中,抽取所有可能含有n个元素的样本。全部可能的样 本数目为m:
2)Z值即是将这种正态分布标准化 标准化后的变量值与相应的概率是唯一的 对应关系
回顾:正态分布变量的标准化:
针对样本均值
针对样本比例
3)Z值其实是绝对误差与抽样误差的比值( 为简单化,将Z取正值)针对样本均值
针对样本比例
上述公式涵盖三个方面:一般的问题 总是已知其中两个,求第三个
4)实际问题中总体平均数、比例、标 准差是用样本来估计的。
首选品牌


小计
品牌A
800
350
1150
品牌B
150
125
275
品牌C
350
75
425
小计
1300
550
1850
解:根据已知条件得:
例3:为了了解某市居民住户拥有空调机 的普及率,随机抽取350户居民,其中有 280户居民有空调机.要求抽样绝对误差 不超过3.5%,试对该市居民住户空调机 的普及率进行估计.
例1:对某型号电子元件10000只进行耐用性 检查,根据以往抽样测定,元件合格率为 95%,并求得耐用时数的标准差为600小 时,问:
1)在重复抽样条件下,概率保证程度是 68.27%,元件平均耐用时数的误差范围不 超过150小时,要抽取多少元件做检查?
2)在重复抽样条件下,概率保证程度是 99.73%,允许误差范围不超过4%,试确定 所抽取的元件数目.
解:
(三)对基本样本量进行调整
1、有限总体调整 2、设计效应因子 3、回答率 4、配额需要 5、经费
例2:
某次市场调查的一个问题是“如果让您只在下列三 个品牌中进行选择,您的首选品牌是:①品牌A ②品牌B ③品牌C
调查是采用简单随机抽样方式从某地区共1850000 个电脑用户中抽取1‰进行的,目的是了解这三个 品牌在该地区的竞争力,试根据下表数据,以95% 的置信度估计该地区首选品牌为A的男性用户在整 个用户中的比例。
社会调查之抽样误差
抽样误差
——由于随机抽样的偶然性因素使样本各 单位的结构不足以代表总体各单位的结 构而引起的抽样指标(统计值)与全及 指标(参数值)之间的偏差
◆影响抽样误差大小的因素
1、全及总体各单位标志值的差异程度 2、抽样单位数的多少 3、抽样组织方式 4、抽样方法
二、抽样分布
抽样分布是根据概率的原则而成立的理性分布。 显示出:从一个总体中不断抽取样本时,各种可
若用
, , … 来分别表示这m个
样本的平均数,那么,样本平均数
的分布将
是一个随n愈大而愈趋于具有平均数μ和标准差
的正态分布。
定理说明
当n足够大时(通常假定大于30),无论总体的 分布如何。其样本平均数所构成的分布都趋于 正态分布。
正态分布图
正态分布的特点:
1、单峰对称;
2、平均数、中位数、众数合一,都在峰点 ;
相关文档
最新文档