论统计与抽样调查
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查
李启才
南京师范大学数学与计算机学院
07级统计学
目录
第1章绪论 (3)
第2章简单随机抽样 (18)
第3章分层抽样 (48)
第4章不等概率抽样 (76)
第5章整群抽样 (3)
第6章系统抽样 (3)
第7章多阶抽样 (3)
第8章二重抽样 (3)
第10章复杂样本的方差估计 (3)
第11章调查中的非抽样误差 (3)
第12章案例及其它 (3)
1
参考文献:
1《抽样技术》金勇进蒋妍李序颖编著人大出版社(教材)2《抽样技术与应用》杜子芳编著清华大学出版社
3《抽样调查》倪加勋广西师范大学出版社
4《抽样调查》L.Kish[USA] 倪加勋主译中国统计出版社
5《抽样调查》樊鸿康高教出版社
1致谢:本讲义大量参考引用了文献1、2、3、4、5以及其它文献内容,在此一并致谢!
第一章绪论
§1.1 统计与抽样调查
引言:什么是统计?你觉得我们需要统计嘛?
比如你想知道江苏省2008年人均年收入及其收入分布状况怎么办?像人口普查那样?你想要了解南师同学们每个月平均消费水平怎么办?一个个同学去询问?
你想过下列问题嘛?
当你买了一台电视时,被告知三年内可以免费保修。你想过厂家凭什么这样说吗?说多了,厂家会损失;说少了,会失去竞争,也是损失。到底这个保修期是怎样决定的呢?
如何通过大众调查来得到性别、年龄、职业、收入等各种因素与公众对某项事物(比如商品或政策)的态度的关系呢?
如何才能够客观地得到某个电视节目的收视率,以确定广告的价格是否合理呢?
“调查结果表明20%的观众喜欢某节目”
“抽样调查结果的误差为±3%”
“支持率的95%置信区间为(25%,30%)”
“某学校排名第一”
“消费价格指数为120%”
“该药品疗效99%”
“该国贫富差距大”
“该型号电器的实用年限是20年”
……你可以举出很多例子。
实际上,上述诸多问题都是统计问题,统计学可以解决。所以你即将学习的数理(推断)统计很重要。
一般来说,统计先从现实世界收集数据(抽样),然后根据数据作出判断。那么数据你怎么得到呢?
像人口普查那样?
当然你其实也可从报纸、电视、互联网、年鉴等方面看到各种数据并且从这些数据可以提取对自己有用的信息。
这些间接得到的(并非自己收集的)数据都是二手数据。
获得第一手数据要困难得多。
某方便面企业每年至少花三四千万元来收集和分析数据,调查其产品及竞争者在市场中的状况、各种类型消费者对其产品的态度、收集各地方的经济交通等信息等等。
可见获得统计数据,并对它分析,提取需要的信息是非常重要的,你的预测决策都需要。
你可以有很多方法去获取数据,而我们即将进行的抽样调查就是科学获得局部数据并对它进行分析的一种有效手段。
一、什么是抽样调查(Sample survey)
调查(survey)是系统的信息搜集(或收集)与分析活动。它一般包括调查主体、调查客体、调查目标、调查目的、调查方案等要素。人类社会在发展过程中离不开对数据、资料、信息的统计调查和分析,比如人口普查、工业生产普查等等这些都是我们常见的。然而政府统计中的普查和定期报表只适于对基本国情(国势、国力等)等调查,而大量的社会现象都不可能作全面调查(一方面费时费力费财,是否值得?我们是否会“为了知道牛肉的滋味而吞噬掉整头牛”(萨缪尔森Samuelson)?另一方面某些现象根本无法作合理的普查,因为被调查对象可能不完全清晰),因此发展非全面调查非常必要,通过局部数据推断全局特征,这正是统计的一条主线。广义意义上的抽样调查就是非全面调查。
非全面调查根据抽取方式不同,又可以分为非概率抽样和概率抽样。
(一)非概率抽样
非概率抽样没有严格的定义,也称非随机抽样,是一种不按照随机原则、总体中各单位被抽中概率事先未知或难以确定的抽样,样本的抽取主要根据人们的主观判断或简便性原则来进行。
其致命的缺点是,难以计算和控制抽样误差,难以保证推断的准确性和可靠性。
非概率抽样有很多形式:随意抽样、典型抽样、重点抽样、判断抽样、定额抽样和流动总体抽样等等。
随意抽样:也称任意抽样,即抽样者随意地或任意地(通常遵循便利原则)从总体中抽取样本。如我们常见的街头拦访、商场在柜台分发的问卷调查等。这样的样本往往有偏,不能代表总体。比如调查18~40岁女性关于某品牌化妆品观点,则在柜台拦到的单元很可能属于更倾向于经常购买某类或某品牌的人群,她们的观点显然不能代表全体18~40岁的女性。
典型抽样:只对总体中的典型(有代表性的)单元调查。如调查一个地方农村经济发展情况,根据调查者对当地情况的了解,选择有代表性的村调查;典型案件的调查等。
重点调查:只对总体的重点单元调查。这些被选择的单元虽然数目不多,但它们的标志总量在总体总量中占据了绝大部分。如调查我国钢铁行业的现状,则只对宝钢、鞍钢、首钢等几家国有特大型企业调查,因为这几家产量占全国产量大半,把握了它们的情况就可以把握总体情况。
典型调查和重点调查中如果抽样者对典型或重点把握比较准确,则会有较高精度,否则精度比价低。还有其它非概率抽样不一一赘述,本课程重点是在概率抽样上。
(二)概率抽样
概率抽样也称随机抽样,是遵循随机性的原则,使总体中的每个单位都有一个事先已知的、非零概率被抽中的抽样。从总体中抽取部分单元,采取科学的统计方法,以其所得到的结果对总体的数量特征作出具有一定精度和信度的估计与推断的一种非全面调查方法。