抽样调查
抽样调查、抽样误差与抽样估计
总体所有单位的标志值或标志特征计算的、反 映总体某种属性的综合指标。 总体指标是一个确定的值。 2、样本指标(抽样指标、统计量):它由样 本各个单位标志值或标志特征计算的综合指标 。 样本指标是一个随机变量。 3、抽样调查中常用的指标 平均数(均值)、方差或标准差、比例(是 非标志比重)
3、可以对全面调查的结果进行评价和修正。 4、抽样调查可用于工业生产过程中的质量控制
。 5、可以对某些总体的假设进行检验,来判断假
设的真伪,为决策提供依据。
82020/1/8
(四)抽样调查的两种类型 一类是参数估计: 它是根据对样本进行观测取得的数据,然后对
研究对象整体的数量特征取值给出估计方法。 另一类是假设检验: 它是根据对样本进行观测取得的数据,然后对
42020/1/8
一、抽样调查的概念、特点及作用
(一)抽样调查的概念
抽样调查是按照随机原则从总体中抽取样本进行 调查,得到样本资料,并根据样本资料对总体数 量特征作出具有一定可靠程度的估计和推断,以 达到认识总体的一种统计方法。
也称为 抽样推断、抽样估计或统计推断。 例:某地进行水质监测,考察河水中某种污染
0.9500 0.9545 0.99 0.9973
可以看出:当确定的抽样极限误差愈大,则概
率度z也就愈大,相应的概率也愈大,即样本指 标落在指定范围的可能性也愈大;反之,则相
应的概率就减少。
92020/1/8
说明:对总体指标估计的范围(置信区间)的测定 总是在一定的概率保证程度下进行的,因为既然 抽样误差是一个随机变量,就不能指望抽样指标 落在置信区间内成为必然事件,只能视为一个可 能事件,就要用一定的概率来给予保证。
抽样调查报告12篇
抽样调查报告12篇抽样调查报告1为了解我市近期建筑节能设计选用的节能技术(产品)情况,由市墙材革新与建筑节能办公室对我市____年民用建筑节能设计资料进行抽样调查、统计分析,形成以下报告。
一、抽样调查情况本次调查对象为我市____年民用建筑节能设计审查备案表,共抽样280项工程,其中公共建筑59项,居住建筑221项。
涉及到的建设单位有64家,设计院38家。
本次调查内容主要是在民用建筑中采用的各项建筑节能技术(产品)情况。
(一)外墙节能设计在外墙节能设计方面,目前使用的主要墙材是加气混凝土砌块,占85.7%,其次是烧结粉煤灰砖、蒸压泡沫粉混凝土砖和灰砂砖。
外墙使用灰砂砖的比例为1.8%,比____年抽查统计数据下降78%。
采取保温隔热措施的比例为31.4%,比____年抽查统计数据增长32.5%,其中外墙外保温做法占77.3%。
使用的保温隔热材料主要是聚苯颗粒保温砂浆,占60.2%,其次是普通砂浆,占13.6%。
其中,居住建筑中采用加气混凝土砌块的比例为86.9%;加气混凝土砌块+聚苯颗粒保温砂浆(外保温)的比例为14.9%;公共建筑中采用加气混凝土砌块的比例为81.4%,加气混凝土砌块+聚苯颗粒保温砂浆(外保温)的比例为15.3%。
外墙采用的墙材和保温隔热材料情况见表1、表2:表1外墙采用的墙材外墙采用的墙材抽样调查报告2国家统计局继首次开展全国群众安全感调查之后,已于11月份组织开展了第二次全国群众安全感抽样调查工作。
现将本次抽样调查的主要数据公布如下:一、被调查者的基本情况本次共抽取全国31个省、自治区、直辖市年满16周岁以上的101988人进行了问卷调查。
在被调查者中,男性59760人,占被调查人员总数的58.6%;女性42228人,占41.4%。
从被调查者的年龄来看,16岁至17岁的2192人,占2.1%;18岁至25岁的10396人,占10.2%;26岁至34岁的23674人,占23.2%;35岁至49岁的38407人,占37.7%;50岁至59岁的13694人,占13.4%;60岁以上的13625人,占13.4%。
第7章 抽样方法
分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第五章 抽样调查
第二种方案:洛阳市所有小学的名单(第一抽样框), 从中抽取10所学校(抽样单位是学校);被抽中 学校的所有班级名单(第二抽样框),每个学校抽 10个班级,共抽取100个班级。(抽样单位是 班级);被抽中班级的所有学生名单(第三抽样 框),每个班级抽20名学生,共抽取2000名 学生,(抽样单位是学生).
18-30 31-50 50以上 小计 总计
200
缺点 虑其中的几种,不可能做出很细的分类
1. 分层不可能兼顾总体的众多属性,只能考 2. 总体分布变化的最新信息不容易得到,因
而配额的合理性很难保证
3. 主观性很大。如一个访问员会本能地避免 访问难以找到的受访者。
四、滚雪球抽样(Snowball Sampling)
(4)依据从随机数表中选出的数码,到抽样 框中寻找它所对应的元素。 练习: 试用简单随机抽样方法在洛阳师范学院抽取 2000名学生。 请思考:操作的难点是什么?
优点:概率抽样的理想类型,简单易行,误差小。 缺点: 1. 需要为总体每个要素编号,当总体所含个 体的数目太多时采用这种方法费时费力; 2. 总体内分类明显时,这种抽样无法按类别 特征自动分配样本数,若想保证样本的代表性,必 须增大样本量,使工作量增大。
院系——专业——班级——学生
抽样框 抽样单位 院系 专业 班级
第一抽样框:所有院系的名单 第二抽样框:抽中院系的所有专 业名单 第三抽样框:抽中专业的所有班 级名单
第四抽样框:抽中班级的所有学 生名单
学生
四、 抽样的原则
随机原则(random principle):在完全
排除主观上人为选择的前提下,使总体中 每一个单位有相同被抽中的机会。——概 率抽样
抽样调查
一、抽样调查是什么?抽样调查是,一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。
显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
二、抽样调查有什么特点?1、按随机原则抽选样本;2、总体中每一个单位都有一定的概率被抽中;3、可以用一定的概率来保证将误差控制在规定的范围之内。
三、具体的抽样调查方法有哪些?1、简单随机抽样简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
简单随机抽样一般可采用掷硬币、掷骰子、抽签、查随机数表等办法抽取样本。
在统计调查中,由于总体单位较多,前三种方法较少采用,主要运用后一种方法。
按照样本抽选时每个单位是否允许被重复抽中,简单随机抽样可分为重复抽样和不重复抽样两种。
在抽样调查中,特别是社会经济的抽样调查中,简单随机抽样一般是指不重复抽样。
简单随机抽样是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。
但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。
首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。
因此,在实际中直接采用简单随机抽样的并不多。
2、分层抽样分层抽样又称为分类抽样、或类型抽样,它首先是将总体的N 个单位分成互不交叉、互不重复的k个部分,我们称之为层;然后在每个层内分别抽选n1、n2、...... nk个样本,构成一个容量为个样本的一种抽样方式。
分层的作用主要有三:一是为了工作的方便和研究目的的需要;二是为了提高抽样的精度;三是为了在一定精度的要求下,减少样本的单位数以节约调查费用。
因此,分层抽样是应用上最为普遍的抽样技术之一。
按照各层之间的抽样比是否相同,分层抽样可分为等比例分层抽样与非等比例分层抽样两种。
第六章 抽样调查
第六章抽样调查第一节抽样调查的意义及全然概念一、抽样调查的意义抽样调查(随机抽样):按照随机原那么从总体中抽取一局部单位进行瞧瞧,并运用数理统计的原理,以被抽取的那局部单位的数量特征为代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必定选择,和普查相比,它具有正确度高、本钞票低、速度快、应用面广等优点。
一般适用于以下范围:1.实际工作不可能进行全面调查瞧瞧,而又需要了解其全面资料的事物;2.虽可进行全面调查瞧瞧,但比立困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的瞧瞧,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,能够关于某种总体的假设进行检验,判定这种假设的真伪,以决定取舍。
三、抽样调查的全然概念(一)全及总体和抽样总体(总体和样本)全及总体:所要调查瞧瞧的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查瞧瞧的单位。
抽样总体的单位数用n表示。
n≥30大样本n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。
抽样指标:抽样总体的那些指标。
第二节抽样调查的组织形式通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如:1.直截了当抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原那么抽取样本,组成一个总的样本。
类型的划分:一是必须有清楚的划类界限;二是必须明白各类中的单位数目和比例;三是分类型的数目不宜太多。
类型抽样的好处是:样本代表性高、抽样误差小、抽样调查本钞票较低。
要是抽样误差的要求相同的话那么抽样数目能够减少。
两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
第四节抽样调查
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
抽样调查的名词解释
抽样调查的名词解释抽样调查是社会科学研究中常见的一种数据收集方法。
它通过从研究对象中选取一部分样本进行调查,然后对样本数据进行分析和总结,以推断出整个群体的特征和规律。
抽样调查的目的是为了在有限的资源和时间条件下,获取全面和真实的信息。
对于社会研究、市场调查、舆情分析等领域来说,抽样调查是一种重要的工具,有助于揭示现象背后的原因和关联。
1. 抽样方法的选择抽样方法是抽样调查中的关键环节。
它决定了样本的代表性和可靠性。
常用的抽样方法包括简单随机抽样、系统抽样、分层抽样、整群抽样等。
简单随机抽样是一种基本的抽样方法,通过将研究对象列入抽签或抽号,随机选取样本。
系统抽样是按照一定规则,如每隔一定间隔选取一个样本。
分层抽样是将研究对象按照某种特征分组,再从每个组中随机选取样本。
整群抽样是将群体划分为若干个群组,然后从中随机选取部分群组进行调查。
2. 抽样误差的控制抽样误差是指样本数据与目标总体的真实情况之间的差异。
在抽样调查中,如果样本容量足够大,且抽样方法随机且代表性好,那么抽样误差会相对较小。
然而,由于资源、时间等限制,完全消除抽样误差是不可能的。
因此,研究者需要在控制误差和成本之间进行权衡。
常见的控制抽样误差的方法有增加样本规模、选择更适合的抽样方法、提高调查问卷的设计质量等。
3. 抽样调查的优缺点抽样调查相比于全面调查的主要优点在于节约资源、时间和人力成本。
通过对样本数据的分析,可以推断出整个群体的特征和情况。
而全面调查则需要对整个群体进行调查,成本和时间消耗较大。
然而,抽样调查也存在一定的局限性。
一是抽样误差无法完全避免,样本在一定程度上无法代表整个群体。
二是调查结果受到调查问卷设计、调查方式以及受访者个人主观因素等的影响。
因此,在抽样调查中应注意合理选择抽样方法,确保样本的代表性和可靠性。
4. 抽样调查在实际应用中的案例抽样调查在实际应用中有广泛的应用。
例如,在市场调查中,通过对样本消费者的需求和偏好进行分析,可以为企业的产品开发和营销策略提供决策依据。
5.抽样调查
1
1.5 2 2.5 3
1.5
2 2.5 3 3.5
2
2.5 3 3.5 4
2.5
3 3.5 4 4.5
3
3.5 4 4.5 5
3.5
4 4.5 5 5.5
6点
3.5
4
4.5
5
5.5
6
5.2 抽样原理
• 样本均值的分布可整理为表
Y
P
1
1/36
1.5
2/36
2
3/36
2.5
4/36
3
5/36
3.5
6/36
5.2 抽样原理
–抽样误差的估算 假设用来 ^ 表示通过样本获得的对总体某个参数 的估 计,定义抽样误差为样本估计量 与总体参数 之间差异平 ^ 方的平均数,即 MSE(mean square error) =
( ) E ( ) 2
^ ^
其中E表示数学期望,即对所有可能情况求平均。在上面 ^ 的例子中, 表示总体平均数, 表示样本平均数 如上例,其抽样误差为:
5.1 抽样调查的概念及特点
• (5)单位
–抽样调查要通过对样本单位的观察或调查来取得有关 数据或记录有关特征,这些单位称之为调查单位。与 此同时,还有据以作为抽样之用的中介单位,称为抽 样单位 –抽样单位与调查单位可以统一,也可能一个抽样单位 包含多个调查单位,也可能一个调查单位可能包含多 个抽样单位 –单位可以是自然形成的,也可以是人为规定的。但单 位之间必须互不重选且能合成总体,尤其是在人为规 定单位或对基本单位进行组合时,更要注意这一点
2
总体
样本
单位数(单元) N n –样本指标是根据样本各单位标志值计算。常用样本指标有:
第7章抽样调查
二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E
如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u
1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第六讲 抽样调查
第三,抽样调查有广泛的应用领域。目前, 第三,抽样调查有广泛的应用领域。目前,世界上许多国家在以下 方面广泛采用抽样调查法: 农产品产量调查; 土地资源利用调查; 方面广泛采用抽样调查法:①农产品产量调查;②土地资源利用调查; 城乡居民家庭收支调查; 工业产品质量检验; 劳动就业调查; ③城乡居民家庭收支调查;④工业产品质量检验;⑤劳动就业调查;⑥ 市场、物价和购买力调查; 饮水、住宅、人民健康和社会福利调查; 市场、物价和购买力调查;⑦饮水、住宅、人民健康和社会福利调查; 科学实验效果调查; 环境污染调查; 人口、工业、 ⑧科学实验效果调查;⑨环境污染调查;⑩人口、工业、农业等各种普 查后的复查; 民意测验等。 查后的复查;⑾民意测验等。 在我国,抽样法已被广泛应用于生产技术及社会生活各个领域。 在我国,抽样法已被广泛应用于生产技术及社会生活各个领域。目 国家统计调查制度中所包括的统计指标, 前,国家统计调查制度中所包括的统计指标,依靠抽样方法取得的资料 已达到三分之一左右。在城乡住户调查、农产品调查、价格统计、 已达到三分之一左右。在城乡住户调查、农产品调查、价格统计、市场 调查等领域,应用抽样调查已取得很好的成果,在人口统计、社会统计、 调查等领域,应用抽样调查已取得很好的成果,在人口统计、社会统计、 交通统计、商业统计等领域,抽样调查也正在发挥越来越重要的作用。 交通统计、商业统计等领域,抽样调查也正在发挥越来越重要的作用。 随着我国社会主义市场经济的发展,抽样调查的应用范围将逐渐扩大, 随着我国社会主义市场经济的发展,抽样调查的应用范围将逐渐扩大, 所发挥的作用也将越来越大。 所发挥的作用也将越来越大。 抽样调查也尤其自身的局限性:首先,由于总体构成的复杂性, 抽样调查也尤其自身的局限性:首先,由于总体构成的复杂性,通常无 法提供总体中各个组成部分的资料。其次, 法提供总体中各个组成部分的资料。其次,组织抽样调查要遵守某些条 被调查对象也有一定限制。一些重要的反映国情、国力的统计资料, 件,被调查对象也有一定限制。一些重要的反映国情、国力的统计资料, 仍然必须组织全面调查。因此,既要大力推广和应用抽样调查, 仍然必须组织全面调查。因此,既要大力推广和应用抽样调查,又不能 用抽样调查取代其他调查,应根据资料的性质和调查对象的不同, 用抽样调查取代其他调查,应根据资料的性质和调查对象的不同,采用 不同的统计调查形式。 不同的统计调查形式。
第七章 抽样调查
第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。
简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点⑴随机原则。
所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。
也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。
抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念⑴总体也称为母体、一般总体等。
是指具有某种统计特征的一类事物的全部个案。
也即,研究对象的全体称为总体。
例如,某批产品、某类病人、某个生产过程等。
总体的单位数通常用符号N来表示。
⑵个体也称为个案、元素。
组成总体的每个元素称为个体。
有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。
也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。
总体是大群体,样本是小群体。
在社会研究中,资料的收集工作往往是在样本中完成的。
样本的单位数(即样本容量)常用符号n来表示。
⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。
(5)抽样单位就是一次直接的抽样所使用的基本单位。
名词解释抽样调查
名词解释抽样调查抽样调查是指在整体人口或样本的基础上,通过统计方法和技术手段,采用一定的抽样方法选取一部分个体进行研究,以获取其特定信息、观点或意见的一种调查方法。
抽样调查是社会科学研究中常用的数据收集方式,通过分析抽样数据可以得到关于总体的推断性结论,具有较高的效率和可靠性。
抽样调查的主要目的是通过选取样本来代表总体,并通过研究样本数据来了解和推断总体状况。
抽样调查可以广泛应用于各个领域,包括社会学、经济学、教育学、医学等。
在具体实施抽样调查时,需要确定以下几个重要要素:1. 总体:是指研究对象的全部个体或现象。
例如,如果研究全国大学生对某一政策的态度,则总体是所有全国大学生。
2. 样本:是指从总体中选取的部分个体的集合。
样本应具有代表性,即反映总体的重要特征。
样本的大小应根据总体大小和调查目的确定,通常采用随机抽样或分层抽样等方法来选取样本。
3. 抽样方法:是指在决定样本的过程中所使用的方法。
常见的抽样方法包括随机抽样、整群抽样、分层抽样等。
不同的抽样方法适用于不同的研究场景,可以提高数据的可靠性和有效性。
4. 数据收集:是指通过设计问卷、面访、电话调查等方式获取样本个体的信息。
数据收集应当遵守一定的科学原则,确保数据的准确性和可比性。
5. 数据分析:是指对收集到的数据进行整理、统计和分析的过程。
通常使用统计学方法,如描述性统计分析、推断性统计分析等,从样本数据中推断出总体特征和总体参数。
抽样调查的优点在于降低调查成本和时间,提高效率和可靠性。
同时,抽样调查也存在一些限制和偏差,例如样本选择偏差、非回应偏执、抽样误差等。
因此,在进行抽样调查时,需要注意样本选取的科学性和合理性,以及数据分析的方法和技巧,以获取准确可靠的研究结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查填空题:1.若样本统计量w的期望和方差分别为E(w)和var(w),那么以样本统计量w 估计总体的数字特征W,有偏量B(w)=E(w)-W;均方偏差MSE(w)=E(w-W)2;且偏量、统计量w的方差与均方偏差三者之间的关系为:MSE(w)= var(w)+[B(w)]2.2.在概率抽样调查中,有简单随机抽样、不等概抽样、分层抽样、多阶抽样、系统抽样、多相抽样等基本的抽样方法。
3.抽样框:又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。
若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
抽样框除包含有抽样单位的编号及抽样单位与总体、个体单位的联系外,还应包含一些有用的辅助信息。
这些辅助吸血可用于抽样方案的设计和数据处理,有益于提高调查的质量。
4.抽样方案的设计要求:利用抽样框的辅助信息,综合各种基本的概率抽样方法来制定一个可行的、精度满足要求而且费用最省的抽样方法。
5.一个完整的抽样策略由抽样方法应配合有一个相适应的估计结合在一起组成。
6. 总体采用简单随机抽样时,对总体目标量的均值或总数,可以有多种估计方法。
在没有辅助信息是,可以采用简单估值法,以样本的均值估计总体的均值;当有适宜的辅助信息利用时,可以采用比估计和回归估计。
7.二相抽样是对总体进行一次以上的抽样。
第一次抽样的样本单元并不是调查所需的目标量,而是调查一些可通过较小的工作量快速获得辅助信息;第二次抽样则是在获得辅助信息的基础上,再作一个样本量较小的调查,调查所需的目标量。
8.分层随机抽样适用于总体单位数量较多、内部差异较大的调查对象。
在分层时,要使层内的个体单元有较好的同一性,层间的差异较大。
9.多阶段抽样与整群抽样都是将总体分成若干小的群体,这些小的群体为第一性抽样单元。
再对抽中的第一性抽样单元抽样,其中的个体为第二性抽样单元。
10.有放回不等概抽样是每个单元入样概率正比于规模测度的抽样方法;实施无放回不等概抽样的方法主要有:布鲁尔法和德宾法。
定义:即抽取概率。
计算题:1.假设总体容量为N=6,其标志值分别为1,2,3,5,6,7.若分为两个群(1,2,3)和(5,6,7),计算群内相关系数。
求出的群内相关系数能说明什么问题。
又若分为(1,5,7)和(2,3,6), 计算群内相关系数。
求出的群内相关系数又能说明什么问题。
2.给定一个包含25个单元的目标为总体,先排成5行5列的形式,每行每列均包含5个单元,单元排列先按列排列,考虑n=k=5的系统抽样,以行为群组成系统样本,而以列为层。
若按从小到大的顺序排列,比较该系统抽样,简单抽样,及分层抽样的效率。
1 2 3 4 5 1 12 26 29 36 44 2 18 28 29 36 46 3 19 28 30 39 48 4 24 28 33 39 50 52529344052解:依题意可知:分为以下两种情况讨论。
i)以行为群,组成系统抽样。
此时25N =,5o K N ==。
根据公式:11Ki ij j Y Y K•==∑ , ()22111K i i ij j S Y Y K ••==--∑有: 表c12345i Y •2i S •1 12 26 29 36 44 29.40 142.8 2 18 28 29 36 46 31.40 107.83 19 28 30 39 48 32.80 122.74 24 28 33 39 50 34.80 103.7 52529344052 36.00 111.5_1132.88K i i Y Y K •===∑2211=117.7K i i S S K•==∑内()2211 6.9321Ki i S Y Y K •==-=-∑外()()0022211103.8611N K K N S S S N N --=+=--外内所以:()02211 1.62281sy K N N V Y S S N N ∧-⎛⎫-=-= ⎪-⎝⎭内201116.6176V Y S N N ∧⎛⎫⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭由上述可知:sy V Y V Y ∧∧⎛⎫⎛⎫< ⎪ ⎪⎝⎭⎝⎭3.某县农村共有14个乡509个村,在实现小康的过程中欲计算该县农村的恩格尔系数(居民的食品支出占总指出的比例)。
首先要调查全县的食品总支出,现采用了二阶段抽样,第一阶段先在14个乡中,按村的的数目多少进行了PPS 抽样,共抽取5个乡,第二阶段在抽取的乡中随机地抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:样本乡序号 k 村数 i N样本村数 in样本村平均食品支出(万元) 1 19 6 48 2 41 6 175 3 72 6 108 4 54 6 90 5366100要估计全县的食品支出总金额及估计的标准差。
问题分析:此题为第一阶段是以14个乡中所含村的个数为规模测度的PPS 抽样,第二阶段是取等额的简单随机抽样的二阶抽样。
故^11k iPPS i i iN G y k P ==∑(*) 由题意可知:总村数N=509,样本乡数k=5,第i 个样本乡的入样概率ii N P N=,抽取的样本总村数n=30,第二阶段为取等额的简单随机抽样故/1n kij i j k y y n ==∑其中ij y 表示第i 个样本乡中第j 个样本村的食品支出总额。
解:^11k i PPS i i iN G y k P ==∑ 将iiN P N =代入后得 111k ki i ii i i N Ny yk N N k====∑∑【①】代入数据可得估计值为:()^509481751089010053037.85PPS G =++++=(万元)均方偏差的无偏估计量:2^^11(1)ki PPS PPS i i i N v G y G k k P =⎛⎫⎛⎫=- ⎪ ⎪-⎝⎭⎝⎭∑ 将【①】式与iiN P N =代入左式得()22^1(1)k PPS i i N v G y y k k =⎛⎫=- ⎪-⎝⎭∑ 【②】 其中__11k i i y y k ==∑ 再代入数据^PPS v G ⎛⎫ ⎪⎝⎭=1088776199.4(万元)故标准差为:^^()()PPS PPS s G v G =(万元)注意:其中公式【①】与公式【②】的运用是在第一阶段是正比于子总体规模的PPS 抽样,第二阶段是取等额的简单随机抽样的二阶抽样的前提条件下才能进行的。
4.若假设已知该县有380千人,并有各个乡的人口资料,则第一阶段按与乡的人口多少成比例地抽样,也抽取5个乡。
第二阶段用简单随机抽样抽取6个村得数据如下表,再估计全县的食品支出总金及估计的标准差。
样本乡序号 人口数村数样本村平均食品支出k X iN i(万元) 1 24 30 96 2 50 41 175 3 38 35 167 4 60 48 188 53039130问题分析:此题与前一题的差别不大,抽样方法都是第一阶段是PPS 抽样,第二阶段是取等额的简单随机抽样的二阶抽样。
唯一不同的是两者的规模测度不同,此题是按与乡的人口数为规模测度的PPS 抽样。
故此题中ii X P X =,其中X 为该县的总人数,i X 为抽中样本乡的总人数。
没有与子总体的i N 成正比,不能用直接公式【①】与公式【②】解:^1111155991k k ki i iPPS i i i i i i i i iN N N X G y y y k P k X X kX ======≈∑∑∑(万元) 2^^119261315.8(1)ki PPS PPS i i i N v G y G k k P =⎛⎫⎛⎫=-≈ ⎪ ⎪-⎝⎭⎝⎭∑(万元) 标准差为:^^()()PPSPPSs v GG=(万元)注意:两题抽样方法的选择虽然相同,但PPS 抽样中的规模测度选择不同导致估计的效率不同,从而影响到估计的准确度。
ii N/i i w N N =yi s i n5.某市进行家庭收入调查,分城镇居民与农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果是城镇平均年收入标准差为3000元,农村年平均户收入标准差为2000元. 且对城镇居民与农村居民抽样平均每户费用比为1:2. 给出城镇与农村两层比列分配与最优分配的样本量的分配。
解:已知总体总量 171980()N =户, 城镇居民总量123560()N =户, 农村居民总量2N =148420(户),, 总样本容量 n=550, 城镇占总体比例11N =0.137NW =,农村占总体比例22N W ==0.863N, 费用比12C 1=C 2。
1. 按比例分配:城镇样本量:11*0.137*55075()n W n ===户 农村样本量:22W *0.863*550475()n n ===户2. 考虑费用前提下的最优分配由定理4.3.2知i ii in k c = k 为待求得比例系数又因为:i i i i n n k c ==∑ 则 /()i i ik n c = *(/i i i i i i in n c c = 2111110.137*30000.137*30000.863*2500/)550*/()117()112i i i in n c c ===+=户 21433()n n n =-=户1 (城镇) 23560 0.137 15180 3972 300 2(农村) 148240 0.863 9856 2546 250 合计 171980(若不考虑费用)(奈曼最优分配): 由定理4.3.1知 i n n =∑ 固定 有1*i ii kjjj W S n n W S==∑考虑本题有21*i ii jjj W S n n W S==∑10.137*3000550*88()0.137*30000.863*2500n ==+户21432()n n n =-=户6. 三种样本量估算的比较条件n 值(样本量) 简化公式按绝对精度 │y Y -│≤d221/22221/2(u )n=1(u )NS d S αα--+221/22(u )n S d α-≈按相对精度 │y Y Y-│≤h. 221/22221/2(u )n=1(u )C h C Nαα--+221/22(u )n=C h α-考虑费用2011(1)nF F F n a S n N=++-21aS n F =注:1/2uα-是N(0,1)分布的12α-分位数,2S 是总体方差,d 是绝对精度, N :总体种抽样单位的数额,/C S Y=为变异系数,0F 是调查的基本费用,1F 是每调查一个样本单元所需费用,a 是常数。