(笔记整理)统计基础知识与统计实务 第七章 抽样调查基础知识培训讲学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章抽样调查基础知识
第一节抽样调查的概念、特点及分类
一、抽样调查的概念与特点
抽样调查的概念
●从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调
查结果来推断总体,以达到认识总体的一种统计调查方法。如:平均工资、1%人口调查
●随机原则:在抽取调查单位时,完全排除人为的主观因素影响,保证每一个调查单位都有相等的中选可能的原则。就概率意
抽样调查的特点
●按照随机原则抽取样本这个原则要求总体中每个单位都有同等被抽中的机会,使样本结构近似于总体结构,具有代表性
●根据样本的资料推断总体的数值这种推断存在一定的抽样误差,但误差范围是可以计算和控制的,有一定可信度
●费用低
●时效性强比如:电视节目收视率调查
●抽样调查有时是唯一的选择如:产品破坏实验、检验一批灯泡的平均寿命、水质调查
二、抽样调查的种类
(一)用主观(非随机)方法从总体中抽选单元进行调查,它是一种快速、简便且省钱的抽选样本的方法。风险大,代表性差
假定总体是同质,总体单元都相似,那么可抽选任何单元入样。例如:街道拦截访问法是最常见的随意抽样,弊端
就是调查员倾向有差别,所遇到的人差别较大
例如:研究非典疫苗,需要人体试验,需要志愿者
专家或者熟悉行业的人事,对抽样对象有所了解,采用判断抽样
例如:按男女比例抽样。
(二)
体的推断更具有代表性概率抽样的两条基本准则:第一,样本单位是随意抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。
总体单位数始终是相同的,每个总体单位有多次
,每抽一次,总体会相应减少,每个总体单位只能被抽中一次。
按(组织方式不同),分为:
●-----一步抽样法,不分组,随机原则进行抽样
●机械随机抽样)或(等距随即抽样)等距抽样,按照一定的距离抽取样本
例如:4000户居民中抽40人,平均每100户抽取1户;1-100号中随机抽取1个号码在第一组中抽取了5号,则5、105、205、以+100为单位抽取
●分层抽样又称(类型随机抽样)或(分类随机抽样)先分组,后抽组内
比如每个组抽5人;某地区三种地形:平原、丘陵、山区的粮食产量,先分地区,然后按每个组内按简单随机抽样抽取调查地块,构成样本
●
比如:全市居委会为不同群,抽不同的群,整群进行研究;了解某地区职工家庭生活状况,按居民委员会分群,一个居委会为一群,对抽中的居民委员会所辖每户职工家庭一一调查。
●
●
率要大一些,而规模较小的农场其入样概率要小一些。
第二节抽样推断的几个基本概念
一、总体和样本
●总体是指包括调查对象所有单位的全体,它是由具有某种共同性质的许多单位组成的。N
样本从总体中按随机原则抽取出来的部分单位所组成的集合体就称为样本。n
二、总体指标和样本指标
●总体指标又称总体参数是根据总体各单位标志值计算的综合指标。
常用的总体指标有:总体平均数X 、总体成数P、总体方差和标准差
●样本指标是根据样本各单位标志值计算的综合指标。
常用的样本指标有:样本平均数 x、样本成数 p、样本方差、样本标准差
第三节抽样误差
一、抽样误差的概念
(一)代表性误差:在抽样调查中,用部分样本推断总体时,由于样本各单位的结构不足以代表总体的状况而产生的误差。
●系统误差:破坏了抽样的随机原则而产生的误差,带有主观性的抽样
●随机误差:是遵守了随机原则,但可能抽到不同的样本而产生的误差。是不可避免的
(二)抽样平均误差
●抽样估计中所说的抽样误差一般就是指抽样平均误差,用μ表示
●抽样平均误差利用数理统计方法是可能计算并控制在所允许的范围之内的
(三)影响抽样误差的因素
●样本单位数目-------在其他条件不变的情况下,抽样数目越多,抽样误差越少。当n=N(样本=总体)时,就是全面
●总体标志变动程度
●抽样方法
●抽样组织方式---分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
二、抽样平均误差的计算
(一)样本平均数的抽样平均误差的计算(用μ表示)
(二)样本成数的抽样平均误差的计算
(三)总体方差未知时的解决办法
例:某企业生产一批产品共10000件,随机抽取500件作重量检验。检验结果,平均重量为1200克,样本标准差为80克,500件中发现10件不合格。试求:在重复抽样情况下,该产品重量的抽样平均误差和不合格率的抽样平均误差。
解:由于不掌握总体标准差,需用样本资料代替。
三、抽样误差的允许范围
(一)抽样极限误差
(二)抽样误差范围估计的可靠程度
扩大极限误差的范围,可以提高抽样推断的可靠程度。这个可靠程度在统计中称为概率,它对应的数值就是概率度,用t表示。概率度越大,可靠程度欲高;反之,概率度越小,可靠程度也越低。
∆=tμ
(三)极限误差的计算
例如:某企业生产一批产品共10000件,随机抽取500件作重量检验。检验结果,平均重量为1200克,样本标准差为80克,500件中发现10件不合格。如果概率度是t=2
解:由于不掌握总体标准差,需用样本资料代替。
第四节 参数估计
一、点估计是直接用一个样本指标估计总体指标的推断方法。适用于对推断的准确程度与可靠程度要求不高的情况下采用。 二、区间估计是在一定的概率保证下,根据点估计值,联系一定的误差范围估计总体指标值的一种推断方法。
x -∆
x
≦
X ≦x +
∆
x
p -
∆p
≦P ≦p +∆
p
例如:某企业生产一批产品共10000件,随机抽取500件作重量检验。检验结果,平均重量为1200克,样本标准差为80克,500件
中发现10件不合格。如果我们认为总体均值与样本均值一样的可能程度是95%,那么我们的误差是多少。
P=95% 则t=1.96
x μ=3.58 我们如果要推断极限误差∆
=t μ=t
n
s =3.58*1.96
因此我们可以利用公式: x -
∆
x
≦
X ≦x +
∆
x
1192.98≦
X
≦1207.02