抽样调查3-1,2,3
第3章抽样调查
3、决定抽样方案. 4、确定样本规模. 5、实际抽取样本. 6、评估样本质量.
五、抽样基本方法 (一)概率抽样Probability sampling
简单随机抽样simple andrandom sampling 系统抽样systematic sampling 分层抽样stratified sampling 整群抽样cluster sampling 多段抽样multistage sampling
2、普查的特点
1)调查范围广,调查对象多 2)资料全面、准确,调查项目有限 3)工作量大,调查成本高 我国人口普查定为每十年举行一次,十年间的空白则用 定期举行的抽样调查来补充。 4)调查周期长,资料深入难 5)普查资料必须与其他调查方法获得的资料结合,才能使 认识点面结合,比较深入。
二、普查的作用与适用范围
二、典型调查的作用与适用范围 1、典型调查可用来研究新生事物。 2、可用来研究事物变化发展的规律。 3、可用来深入研究事物的不同类型。 4、能克服其他调查方法“深入性差的 缺陷”。 5、局限性:
三、典型调查的一般步骤 1、对调查总体作初步研究 2、拟定详尽的调查提纲 3、选择具有代表性的典型 4、实地调查占有第一手资料 5、整理分析资料,作出推论
4、抽样调查的特点
1)按随机原则抽样 2)样本推论总体 3)抽样误差可以控制 4)节省人力财力和时间
5、局限性:
1)抽样调查适用定量调查,不大适用定性调查; 2)由于抽样调查主要适合大范围的定量调查,所以其深度 和广度有限,难以深入细致研究。 3)抽样需要较多的数学知识,特别是概率论和数理统计方 面的知识,专业性比较强,对调查者的要求比较高。
1、普查能对社会的一般状况作出全面、准确的描述;
抽样调查方法
抽样调查方法抽样调查是社会科学研究中常用的一种数据收集方法,通过对样本进行调查和研究,来推断总体的特征和规律。
在实际调查中,选择合适的抽样方法对于研究结果的准确性和可靠性至关重要。
本文将介绍几种常见的抽样调查方法,并对它们的特点和适用范围进行简要分析。
一、简单随机抽样。
简单随机抽样是最基本的抽样方法之一,其特点是每个样本被选中的概率是相等的,且相互独立。
这种方法适用于总体中各个个体的特征分布均匀的情况,操作简单,且具有较好的代表性。
但是在总体分布不均匀或者样本容量较大时,可能会导致抽样误差较大,需要较大的样本容量来保证结果的可靠性。
二、分层抽样。
分层抽样是将总体按照某种特征分成若干层,然后在每一层中进行简单随机抽样,最后将各层的样本组合在一起,形成最终的样本。
这种抽样方法可以有效控制样本的代表性,保证各个层次的特征都能得到充分的反映。
但是在实际操作中,需要提前了解总体的分层情况,并对各层样本的比例进行合理的确定,操作相对复杂一些。
三、整群抽样。
整群抽样是将总体分成若干个群体,然后随机抽取其中的若干个群体作为样本。
这种方法在总体分布不均匀,且群体内部差异较大的情况下比较适用,可以减小抽样误差,提高调查效率。
但是需要注意的是,群体内部的差异也可能会影响样本的代表性,需要根据实际情况进行合理的选择。
四、系统抽样。
系统抽样是按照一定的规则从总体中选择样本,例如每隔若干个个体进行抽样。
这种方法操作简单,适用于总体有序排列的情况,且样本容量较大的情况下比较有效。
但是需要注意的是,如果总体的周期性规律与抽样规则相吻合,可能会导致样本的偏倚,需要进行合理的调整。
综上所述,不同的抽样调查方法各有特点,适用于不同的调查对象和研究目的。
在实际应用中,需要根据具体情况选择合适的抽样方法,并结合其他调查技术和分析方法,以确保研究结果的准确性和可靠性。
同时,对于抽样调查过程中可能出现的偏倚和误差,也需要进行合理的控制和修正,以提高研究的科学性和实用性。
重点调查、抽样调查、典型调查三种调查方式
重点调查、抽样调查、典型调查三种调查方式有什么异同?
相同点:
1、调查范围都属于非全面调查。
2、调查目的相同,都是通过对个体的分析来了解总体的情况。
不同点:
1、样本的选取不同:
a、重点调查是在调查对象中,选择一部分重点单位作为样本进行调查。
b、典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密、系统地调查研究。
c、抽样调查是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。
2、调查的目的不同
a、重点调查是为了反映主要情况或基本趋势。
b、典型调查的主要目的在于了解与有关数字相关的生动具体情况。
c、抽样调查目的在于取得反映总体情况的信息资料。
3、调查的作用不同
a、重点调查的主要作用在于反映调查总体的主要情况或基本趋势
b、典型调查的作用主要有:在特定的条件下用于对数据的质量检查和了解与数字相关的生动具体情况。
C、抽样调查可起到全面调查的作用。
4、特点不同
a、重点调查的主要特点是:投入少、调查速度快、所反映的主要情况或基本趋势比较准确。
b、典型调查的特点在于在于调查范围小、调查单位少、灵活机动、具体深入、节省人力、财力和物力等。
但其不足是在实际操作中选择真正有代表性的典型单位比较困难,而且还容易受人为因素的干扰,从而可能会导致调查的结论有一定的倾向性,且典型调查的结果一般情况下不易用以推算全面数字。
C、抽样调查的特点是:按随机原则抽选样本;总体中每一个单位都有一定的概率被抽中;可以用一定的概率来保证将误差控制在规定的范围之内。
(完整版)抽样调查习题及答案
第四章习题抽样调查一、填空题1.抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。
2.采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)……(N-N+1)。
3.只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。
4.参数估计有两种形式:一是点估计,二是区间估计。
5.判别估计量优良性的三个准则是:无偏性、一致性和有效性。
6.我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。
7.常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8.对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。
若Δ扩大一倍,则抽样单位数为原来的1/4。
9.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。
二、判断题1.抽样误差是抽样调查中无法避免的误差。
(√)2.抽样误差的产生是由于破坏了随机原则所造成的。
(×)3.重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。
(√)4.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。
(√)5.抽样调查所遵循的基本原则是可靠性原则。
(×)6.样本指标是一个客观存在的常数。
(×)7.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。
(×)8.抽样平均误差就是抽样平均数的标准差。
(×)三、单项选择题1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A.2倍B.3倍C.4倍D.5倍2.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3.计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A.最小一个B.最大一个C.中间一个D.平均值4.抽样误差是指(D)A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.随机性的代表性误差5.抽样成数是一个(A)A.结构相对数B.比例相对数C.比较相对数D.强度相对数6.成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大B.成数越接近于1,成数方差越大C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大7.整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A.全面调查B.非全面调查C.一次性调查D.经常性调查8.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4%B. 4.13%C. 9.18%D. 8.26%9.根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)A.甲产品大B.乙产品大C.相等D.无法判断10.抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A.甲企业较大B.乙企业较大C.不能作出结论D.相同四、多项选择题抽样调查中的抽样误差是(ABCDE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的2.重复抽样的特点是(AC)A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于(ABE)A.总体中各单位标志间的变异程度B.允许误差C.样本个数D.置信度E.抽样方法4.分层抽样误差的大小取决于(BCD)A.各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度5.在抽样调查中(ACD)A.全及指标是唯一确定的B.样本指标是唯一确定的C.全及总体是唯一确定的D.样本指标是随机变量E.全及指标是随机变量五、名词解释1.抽样推断2.抽样误差3.重复抽样与不重复抽样4.区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
《全面调查与抽样调查》 导学案
《全面调查与抽样调查》导学案一、学习目标1、理解全面调查和抽样调查的概念。
2、掌握全面调查和抽样调查的特点、适用范围。
3、学会根据具体问题选择合适的调查方式。
二、学习重难点1、重点(1)全面调查和抽样调查的概念和特点。
(2)如何根据实际问题选择恰当的调查方式。
2、难点理解抽样调查中样本的代表性和随机性。
三、知识链接在日常生活和工作中,为了了解某些情况或解决问题,我们常常需要进行调查。
例如,要了解全班同学的视力情况,需要对全班同学进行视力检查;要了解某品牌电视机的质量,需要对该品牌电视机进行质量检测等。
四、学习过程(一)全面调查1、概念全面调查是对调查对象的所有单位一一进行调查的调查方式。
例如,要了解一个班级中所有学生的身高、体重、视力等情况,就需要对班级中的每一个学生进行测量和检查,这种调查方式就是全面调查。
2、特点(1)调查的结果准确、全面。
(2)需要耗费大量的人力、物力、财力和时间。
3、适用范围(1)调查对象的范围较小。
(2)调查的结果要求准确、全面。
(二)抽样调查1、概念抽样调查是从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的一种调查方式。
例如,要了解一批灯泡的使用寿命,不可能对每一个灯泡都进行测试,而是从这批灯泡中抽取一部分灯泡进行测试,然后根据这部分灯泡的测试结果来推断这批灯泡的使用寿命,这种调查方式就是抽样调查。
2、特点(1)节省人力、物力、财力和时间。
(2)调查结果是近似的。
3、抽样调查中的相关概念(1)总体:所要考察对象的全体。
(2)个体:组成总体的每一个考察对象。
(3)样本:从总体中抽取的一部分个体。
(4)样本容量:样本中个体的数目。
4、适用范围(1)调查对象的范围较大。
(2)调查具有破坏性。
(3)调查经费和时间有限。
(三)全面调查与抽样调查的选择在实际问题中,如何选择全面调查还是抽样调查呢?一般来说,如果调查的对象范围较小、调查的结果要求准确、全面,或者调查不具有破坏性、调查经费和时间充足,那么应该选择全面调查;如果调查的对象范围较大、调查具有破坏性、调查经费和时间有限,那么应该选择抽样调查。
第三章抽样调查
分层比例抽样计算公式:ni =〔Ni /N〕 × n
ni :第i层应抽取的样本数
Ni :第i层样本总数
N
N :调查母体的样本总数
ቤተ መጻሕፍቲ ባይዱ
n :设定的样本数
分层比例抽样法适用于各层具有清楚差异,各
层外部具有较好分歧性,各层在母体中所占比例不 过火悬殊的市场母体的调查之中。
【例题1】某地域有百货商店10 000户,其中大型、 中型与小型百货商店区分为1000、2000、7000户,当 抽样数为200户时,假定用分层比例抽样法应从各层中 各抽多少个样本?
2、可以依据需求对各层的特性加以比拟;
3、从管理和实施上看,比复杂随机抽样便利得多。
二、分群随机抽样
分群随机抽样是将市场调查母体划分为假定干 个群体,然后将假定干群体作为抽样样本,采用单 纯随机抽样方法确定并对选定群体内的全体样本停 止普遍调查的一种方法。
分群随机抽样与分层随机抽样的区别在于:分 层随机抽样要求层间异质,层内同质;而分群随机 抽样正好相反,它要求群间同质,群内异质。
常用的非随机抽样法主要有:恣意抽样法、 判别抽样法、配额抽样法、系统抽样法。
一、恣意抽样法〔Convenient Sampling〕
恣意抽样法也称便利抽样法,是一种恣意选取 样本的方法。街头拦人法和方便选择法是恣意抽样 法的两种最罕见的方式。 优点:〔1〕无须精心选取样本
〔2〕能及时取得所需的信息 〔3〕省时、省力,浪费调查支出
〔3〕运用范围普遍,特别适用于研讨市场现象的数量 表现;
第二节 抽样调查的基本顺序
抽样调查,特别是随机抽样,有比拟严厉的设计 顺序,只要按一定步骤,才干保证调查的顺利完成, 取得应有的效果。抽样调查普通分为以下几个步骤: 一、确定调查总体和抽样单元 二、确定置信度和最大允许误差 三、确定样本数量 四、选择抽样方式停止抽样 五、搜集样本资料计算样本目的 六、用样本目的推断调查总体目的
抽样技术调查课程设计
抽样技术调查课程设计一、课程目标知识目标:1. 学生能够理解抽样调查的基本概念,掌握抽样方法及其适用场景。
2. 学生能够描述并比较各种抽样技术的优缺点,解释其在本地区环境调查中的应用。
3. 学生能够运用统计学原理,对样本数据进行基本的处理和分析。
技能目标:1. 学生能够运用不同的抽样方法设计简单的调查问卷,进行实际的数据收集。
2. 学生能够利用课堂所学,对采集到的数据进行整理、分析,并撰写调查报告。
3. 学生能够通过小组合作,展示调查过程和结果,进行有效的交流与表达。
情感态度价值观目标:1. 培养学生对调查研究的兴趣,认识到数据在解决实际问题中的重要性。
2. 增强学生的合作意识,培养团队协作解决问题的能力。
3. 提高学生的社会责任感,使其认识到通过科学方法可以为社会和环境的改善贡献力量。
分析课程性质、学生特点和教学要求:本课程为初中生设计,旨在帮助学生掌握抽样调查的基本知识和技能。
结合学生好奇心强、动手能力逐步提高的特点,课程注重实践操作和小组合作。
在教学过程中,关注学生的个体差异,鼓励主动探究和思考,强调在活动中培养学生的数据意识和科学态度。
通过具体的学习成果分解,使学生在知识、技能和情感态度价值观方面得到全面提升。
二、教学内容1. 抽样调查基本概念:介绍抽样调查的定义、作用和基本步骤。
- 教材章节:第二章第一节- 内容:抽样调查的意义、类型及基本流程。
2. 抽样方法:讲解简单随机抽样、分层抽样、系统抽样等常见抽样方法。
- 教材章节:第二章第二节- 内容:各种抽样方法的原理、适用场景及其优缺点。
3. 调查问卷设计:指导学生如何设计简单、实用的调查问卷。
- 教材章节:第二章第三节- 内容:问卷设计原则、问题类型及注意事项。
4. 数据收集与整理:教授如何进行实地调查,收集和整理数据。
- 教材章节:第二章第四节- 内容:数据收集方法、数据整理技巧及数据清洗。
5. 数据分析:介绍常用的数据分析方法,如频数分析、交叉分析等。
统计调查方法与抽样调查技术介绍-新进公务员
第二种是具有统计特征的划类选点典型调查,即将调 查总体划分为若干个类,再从每类中选择若干个典型进行 调查,以说明各类的情况。如2011年开展的《未成年人思 想道德情况调查》时,就分别选择了若干高中、初中、职 业技术学校、小学,开展相关调查。
例如:在取得总体单位的名单或名册后,先给每个单 位编上一个号码,然后使用随机数表,查出所需抽选的调 查样本,或将总体各单位的号码或名称,逐个写在纸条或 卡片上,再在全部纸条或卡片中随机抽选出所需调查的样 本。
4、普查的优缺点
(1)优点:收集的信息资料比较全面、系统、准确 可靠;
(2)不足:涉及面广、工作量大、时间较长,而且 需要大量的人力和物力、组织工作较为繁重。
(三)重点调查
1、重点调查的概念
重点调查是一种非全面调查,它是在调查对象中,选 择一部分重点单位作为样本进行调查。所选择的重点单位 虽然只是全部单位中的一小部分,但它们在所调查的某一 主要标志总量方面在总体中占绝大比重。
3、重点调查的特点
重点调查的主要特点是:投入少、调查速度快、所反 映的主要情况或基本趋势比较准确。
(四)典型调查 1、典型调查的概念 典型调查也是一种非全面调查,它是从众多的调查研
究对象中,有意识地选择若干个具有代表性的典型单位进 行深入、周密、系统地调查研究。
进行典型调查的主要目的不在于取得社会经济现象的 总体数值,而在于了解与有关数字相关的生动具体情况。
5、置信度:置信度也称为可靠度,或置信水平、置信系数,即在对总体 参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一 种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数 在一定允许的误差范围以内,其相应的概率有多大,这个相应的概、样本:样本是总体的一部分,它是由从总体中按一定程序抽 选出来的那部分总体单位所作成的集合。
抽样调查的理论与方法参考答案
抽样调查的理论与方法参考答案一、填空题1 随机原则 概率估计 总体数量特征 非全面调查2 调查对象的全部单位 全及总体 有限总体 无限总体3 单位数目 30个4 总体数量特征 确定()∑-=N i Y Y i N 1215 样本数量特征 随机变量 ()∑-=-Ni y y i n 1211统计量6 有顺序不重复抽样 无顺序不重复抽样7 比值比较 差值比较8 偶然性 规律性9 不可能事件 必然事件10 常数 统计规律性11 稳定性 稳定值12 随机因素 所有可能事件13 离散随机变量 连续随机变量14 非负 115 统计量 样本平均数16 不重复抽样 重复抽样17 代表性误差 反比关系18 正比关系 反比关系19 概率度(平均误差μ的倍数) 固定 误差范围(允许误差,误差置信限)20 总体相应指标值 {}αθθθ-=≤≤121P21 精确程度 可靠程度 置信系数 可靠程度22 样本平均数 区间估计 所在区间 抽样调查资料对比全面调查资料23 总体均值 总体方差24 )1(2N n n -δ或)1(2N n n S -, )1(1)1()1(N n n P P n P P ----或, )1()1(N n n P P Z --或)1(1)1(Nn n P P Z ---25 总体的方差 要求的概率保证程度 给定的抽样误差范围26 样本方差27 固定的顺序和间隔 选择排队标志28 有关标志排队法 无关标志排队法29 抽取样本方便易行 样本单位在总体中均匀地分布30 随机原则 系统偏差31 随机原则 较好的代表性32 各系统样本内部方差的平均值sy ωα2 sy ωα2 各系统样本的内部方差 系统样本 内部各单位的差别33 各部分K 个个体 各个部分的差别 系统样本内部的差异34 单纯随机抽样 抽样原理35 总体在第i 层的权数或权重 每一层的总体单位数 总体单位数36 比较均匀 层内方差37 选择分层标志 调查的核心项目 与调查项目关系密切的项目 引起分散的主要原因 38 各个单位标志值的差异 最小 该层标志变异指标39 越少 调查费用40 调查费用 抽样误差41 层内方差 层间方差42 调查变量 层数的选择43 单纯随机抽样 全面调查44 各群内部调查变量的各个标志值 各个群内部各个标志值 总体的群45 被调查总体 均匀 总体可能取到的值46 均匀分布在总体各个部分 低于 群内部差别大而群间差别小47 各个群内部单位数相等 总体单位 群平均数Y 随机抽样估计48 总体单位数49 大样本50 总体单位 抽样群数 抽样群数51 横向 纵向52 有偏 抽样分布53 增大相关系数ρ的值,X 、Y 的相关程度54 分别比估计 组合比估计55 线性 回归方程 样本指标 总体指标56 辅助变量的选择 较好的线性 有关资料57 性质不同 密切线性关系 基期指标58 回归系数b 样本相关系数 越高59 r=0 r ≠060 等于 小于61 小于 分别回归估计 组合回归估计62 居民家计调查 居民家庭63 三阶段系统抽样 系统抽样64 抽取各阶段样本 实割实测 推算产量65 近三年粮食平均亩产 当年预计亩产 相应总体各单位的累计播种面积 累计播种面积样本单位数66 抽样误差 调查误差 实割实测67 系统抽样68 中轴对称69 多阶段抽样 系统抽样 双重抽样70 整群随机抽样 系统抽样二、单项选择题1 C2 A3 B4 D5 A6 B7 A8 B9 C 10 C 11 B 12 B 13 D14 B 15 C 16 C 17 B 18 C 19 C 20 C 21 B 22 B 23 C 24 C 25 A 26 C 27 B 28 D 29 D 30 A 31 B 32 C 33 C三、简答题1 抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并依据概率估计原理,应用所得到的资料,对总体的数量特征进行推断的一种调查方法。
第七章 抽样调查
数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x
2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
则:
1 x 0.8165 1.5n 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:
第3章抽样技术 市场调查与预测(第二版) 邓剑平
3.1 抽样调查概述
3.1.1 市场抽样调查的涵义 3.1.2 抽样调查的特点 3.1.3 抽样调查的作用 3.1.4 市场抽样调查的程序
3.1.1 市场抽样调查的涵义
市场抽样调查有广义和狭义之分。广义的抽样 调查包括随机抽样和非随机抽样;狭义的抽样调查 只包括随机抽样。下面市场抽样调查的涵义是狭义 的。 所谓抽样调查,就是按某种规则从调查对象总 体中选取一定数目的单位,作为代表总体样本,运 用样本单位的调查,结果推断总体一般情况的一种 调查方式。
3.1.2 抽样调查的特点
抽样调查是市场调查中应用最多的方法, 它具有一下明显的特点(见图3-1)。
图3-1 抽样调查的特点
3.1.3 抽样调查的作用
在市场调查中,调查的内容很多(见图3-2)。
图3-2 抽样调查所使用的范围
市场抽样调查,特别是随机抽样,有比较严格 的程序,只有按一定程序进行调查,才能保证调查 顺利完成,取得应有的效果。抽样调查一般分为以 下几个步骤(见图3-3)。
分层抽样必须注意以下问题(见图3-4)。
图3-4 分层抽样必须注意的问题
3.2.2 分层随机抽样技术及其应用
分层抽样的步骤包括(图3-5)。
图3-5 分层抽样的步骤
3.2.2 分层随机抽样技术及其应用
分层抽样的具体做法有以下两种(见图3-6)。
图3-6 分层抽样的具体做法
上海市民出行状况调查报告
上海市民出行状况调查报告
2.逾六成受访者上下班出行选择公共交通 公交与轨道交通成为市民上下班的主要交通工具。调查显示,有 26.9%的受访者选择乘坐公交,17.2%选择乘坐轨道交通,21.4%选择乘 坐公交加轨道交通,合计为65.5%;另有12%上下班出行使用助动车, 13.%使用私家车,9.3%使用自行车或其他。这表明,逾六成受访者上 下班出行选择公共交通,这与目前上海公共交通方便快捷、花费少有 着重要关系。 分区域看,居住在内环的受访者选择公共交通出行的占66.8%,居 住在内中环间的受访者选择公共交通出行的占70.1%,居住在中外环间 的占71.9%,居住在外环外的占56.9%。这表明,在公共交通较为便捷 的区域,市民更倾向于选择公共交通出行。 3.受访者上下班交通单程平均时间为50.4分钟 有9.3%的受访者上下班单程耗时在15分钟以内,16.4%耗时在1530分钟,18.7%耗时在30-45分钟,24.2%耗时在45-60分钟,22.4%耗时 在60-90分钟,9%耗时在90分钟以上。经加权平均计算,受访者上下班 单程平均时间为50.4分钟。按居住地到单位距离的分组来看,距离越 长,相对耗时越多。
社会调查方法03抽样一
不等概率抽样的后期统计一般要做特殊处理。
举例:20000户居民,按经济收入高低分类,高收 入居民4000户,占总体20%;中等收入12000户, 占总体60%;低收入户4000户,占总体20%,从 中抽取200户,进行购买力调查。
等比例分层抽样 高收入层样本数:200× 20%=40户 中收入层样本数:200× 60%=120户 低收入层样本数:200× 20%=40户
★ 划分 ●★ ■ 子群 ■▼■●● ★■ ▼▼ ★
★● ★● ▼★ ■ ■ ▼ ■ ★● ▼■
随机 抽样
★● ▼■
N
5000 R1 R2 R3 R4 48 …… R130 45 R98 R110
总体
确定分群 特征
53
R1
50
R4
58
R33
群(互不
重叠)
子群
53
48
52
50
47
n
样本
250
等距抽样与简单随机抽样相比,样本分布更为 均匀,抽样误差更小 注意: 等距抽样是以总体的随机排列为前提的, 如果总体的排列出现有规律的分布时,会使等距抽 样产生极大的误差,降低样本的代表性 等距抽样最适用于同质性较高的总体,当总体 内个体类别之间的数目悬殊过大时,样本的代表性 可能较差。在这种情况下应采用另一种分层抽样方 法。
直线等距抽样练习题:
某大学有12000名学生,欲了解 其生活态度,决定采用系统抽样的方法 从中抽查200名学生,用简单随机抽样 的方法抽出第一名学生序号为12,请计
算第十位,第十五位学生的序号是多少?
(二)循环等距抽样(k不为整数)
方法1. 1. 将总体N首尾相连, N K=——,取接近K的整数; 2. 随机起点r从1-N中随机抽取 n 方法2. 调整直线等距抽样 1. 将K的小数点后移,便为整数[K] 2. 确定整数的随机起点[r],从10-[K]中选 3. 确定非整数的随机起点r,即将[r]的小数点移回来 4. 从r开始,每隔K各单位抽取一个单位 5. 再将所有抽取的号码的小数点略去 特点:所有单位有相同的中选概率1/K
抽样调查举例
调查 1.我们班级不近视的同学有多少人? 2.我们学校不近视的同学又有多少人? 像这样为一定目的而全面的调查叫做全面调查。例如人口普查;
你愿意采用普查的方式了解一批日光灯管的使用寿命吗?
具有破坏性,最好不要使用全面调查。 的方式。
想一想
要了解全国初中生的视力情况,有人设计了下面三种调查方法: 1、对全国所有的初中生进行视力测试。
数据处理的一般过程
全面调查
收 集 数 据
制表
整
理
数
绘图
据
描 述 数 据
分 析 数 据
得 出 结 论
抽样调查
再见
统计表和统计图的区别
统计表反映的数据准确且容易查找; 统计图很直观地表示出变化的情况和最大最小值。
在实际问题中常把统计表、统计图结合起来描述数据,要能根据不同问题选择适当的统计图描述数据, 以利于数据的分析,最终做出合理的决策。
同时抽样调查选取的对象数量应合理。
为了了解学生对学校伙食的满意程度,小红访问了50名女生;小聪访问了50名男生;小明访 问了24名男生和24名女生,其中七年级、八年级和九年级的男生和女生各8名。你认为小红、 小聪、小明三人的不同抽样方法那一种最好?为什么?
答:小明的方法最好。小明抽得样本既有男生,又有女生,而均匀分布在各年级,这样的抽样较具 有代表性,反映的情况具有普遍意义。
1希腊奥委会为了防止运动员服用违禁药物从1万多名运动员中抽取了万多名运动员中抽取了3千名运动员进行尿样检验2导弹部队为了了解某种新型导弹的射程而发射了该种型号的一枚导弹作试验导弹部队为了了解某种新型导弹的射程而发射了该种型号的一枚导弹作试验3学校要为同学们订做校服调查了全校888名学生每人的身高名学生每人的身高该校共888名学生4为了了解八年级学生体能情况教育局工作人员在辖区内抽取了教育局工作人员在辖区内抽取了4所中学对其中学号是6的倍数的八年级学生进行的倍数的八年级学生进行400米跑步测试答
第三讲 抽样调查[1]
等距离随机抽样的优缺点
• 优点: (1)操作简便,省时间,费用低; (2)如果有关设定特征的信息较易得到,则比简单随机抽样
样本的代表性更强,且更可靠; (3)不需要抽样框的知识。 • 缺点: (1)按有关标志排队时,需要有较为详细、具体的相关资料; (2)抽样的效率取决于对总体进行排列时所使用的标志值; (3)抽样误差计算较为复杂。
3
简单随机抽样应用实例
➢ 总体中每个单位在抽选时具有相等的被抽中机会。 ➢ 抽样概率公式为:抽样概率=样本单位数/总体单位数 ➢ 例如,如果总体单位数为10000,样本单位数为400,那么抽样概率为
4%,计算过程为: 0.04=400/10000 ➢ 如果一个抽样框是可以得到的,简单随机抽样方式步骤如下:
➢ 某公司有500人,其中35岁以下的125人,35-49 的280人,50以上的95人。为了调查员工的身体健 康情况,从中抽取100人,怎样用分层抽样抽?
16
➢ 某大学食堂为了了解新生的饮食习惯,以分层抽样方 式从1500名新生中抽取200人进行调查,新生中南 方学生500人,北方学生800人,西部学生200人, 如何抽?
(1) 对总体的每个单位进行编号,总体单位数为10000的总体可编 号为1—10000;
(2) 在随机数表中从任意的一个编号数开始向上数或向下数或跳 跃数选编号,在00001和10000之间选出400个(样本单位数);
(3) 在有明确总体单位的数字表中选出的数字将包括在样本中。
4
等距离随机抽样
• 等距离随机抽样:又称机械抽样或系统抽样,先 在总体中按一定标志把个体顺序排列,并根据总 体单位数和样本单位数计算出抽样距离,然后按 相同的距离或间隔抽选样本单位。
统计学复习第6章+抽样调查
机械抽样按样本单位抽选的方法不 同,可分为三种: 1.随机起点等距抽样
示意图:
a k k k+a 2k+a k (n-1)k+a (k为抽取间隔)
k
2.半距起点等距抽样
示意图:
k 2
k
k
k k 2 2k k 2
k
(n 1)k k 2
k
(k为抽取间隔)
解: N 4000, 0.2,t 3, 1.5 t 2 2 N 32 (1.5) 2 4000 n 2 450(人) 2 2 2 2 2 N t (0.2) 4000 3 (1.5) 1 若误差范围缩小 (即0.1M 3 ),保证程度不变 2 32 (1.5) 2 4000 则 n 1344(人) 2 2 2 (0.1) 4000 3 (1.5)
在抽样调查中应用的总体指标和样本指标还有: 方差:总体方差 、样本方差s
2 2
标准差:总体标准差 、样本标准差s
抽样框 ——即总体单位的名单,是指对可以选择作为
样本的总体单位列出名册或顺序编号,以 确定总体的抽样范围和结构。 样本个数——指从总体中可能抽取的样本的数量。
样本容量——指一个样本所包括的单位数。
第二节 抽样调查的组织形式
• • • • • 一、简单随机抽样(纯随机抽样) 二、类型抽样(分类抽样) 三、机械抽样(等距抽样) 四、整群抽样 五、多阶段抽样
一、简单随机抽样(纯随机抽样)
即从总体单位中不加任何分组、排队, 完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如: 1.直接抽选法; 2.抽签法; 3.随机数码表法;
2普查和抽样调查
2普查和抽样调查2 普查和抽样调查 1.搜集数据的一般步骤和常见方法(1)、搜集数据的一般步骤:①、明确调查目的——数据的用处;②、确定调查对象——数据搜集的范围;③、选择调查方法——搜集数据所采用的方法;④、详细进展调查——数据搜集;⑤、记录调查结果——数据整理. 2、调查的方式主要有两种:一是普查;一般来说,当调查的问题非常重要或调查对象的数目有限,易于一一考察时,选用普查去获取整体情况.普查得到的数据真实,没有估计的成分,是一种全面的调查二是抽样调查.当要考察的对象数目较多,且不可能一一考察时,选择抽样调查显得简单的多,可由局部的特征估计全体的特征. 3、调查方式的选择 (1)当调查的对象个体数较少,调查容易进展时,一般采用普查;当调查的对象个体数较多,调查不容易进展时,一般采用抽样调查. (2)不管调查对象是多是少,当对调查结果有较高要求时,或调查的结果有特殊意义时,必须采用普查方式;当调查具有破坏性时,或者会产生一定的危害时,通常采用抽样调查. 1、假如你想知道你的同学遇到不开心的事时,主要用哪几种方法(如向同学倾诉、看书、睡觉)排解烦恼,还想知道男女同学排解烦恼的主要方式是否一样,然后对调查结果进展总结,请答复以下问题. (1)、你调查的目的是__________; (2)、你调查的对象是__________; (3)、你调查的方法是__________; (4)、假如是访问调查,你打算向调查对象提出的问题是__________. 2、扬州市的旅游宣传口号是“诗画瘦西湖,人文古扬州.给你宁静,还你活力”.为了理解广阔市民对这一旅游宣传口号的知晓率,应采用的适宜的调查方式为__________.(选填“普查”或“抽样调查”) 3、同学为了调查全市初中生人数,他对自己所在城区的人口数和城区初中生人数作了调查:城区人口约 3 万,初中生人数约 1 200.全市人口实际约 300 万,为此他推断全市初中生人数为 12 万.但市教育局提供的全市初中生人数约 8 万,与估计数据有很大偏向.请你用所学的统计知识,找出其中错误的原因______________________________. 4、以下调查方式中适宜的是( ). A.要理解一批节能灯的使用寿命,采用全面调查方式 B.调查你所在班级同学的身高,采用抽样调查方式C.调查沱江某段水域的水质情况,采用抽样调查方式 D.调查全市中学生每天的就寝时间,采用普查方式 5、要理解全校学生的课外作业情况,你认为以下抽样方法中比拟合理的是( ). A.调查全体女生 B.调查全体男生 C.调查九年级全体学生 D.调查七、八、九年级各 100 名学生 6、以下抽样调查中抽取的样本适宜吗?为什么? (1)、数学教师为了理解全班同学数学学习中存在的困难和问题,请数学成绩优秀的 10名同学开座谈会; (2)、在北京市调查我国公民的受教育程度; (3)、在七年级学生中调查青少年对网络的态度;(4)、调查每个班学号为 5 的倍数的学生,以理解全校学生的身高和体重.。
第3章抽样与抽样调查
第三章抽样与抽样调查抽样调查作为一种现代调查技术,在社会调查研究中有特殊的地位。
抽样调查不仅有其他非全面调查省时间与经费的优点,同时又有普查能够了解总体的优点。
因而,抽样调查被公认为是一种最完善、最有科学根据的调查方法,在现代社会调查中被越来越广泛地应用。
3.1 抽样调查的涵义及原理一、抽样与抽样调查抽样调查为科学研究方法中重要的技术之一,是指按照科学的原理和计算从所要研究的现象的全部分析单位中按随机原则,抽取部分单位进行调查,取得资料后,再根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断的方法。
抽样调查旨在以样本的资料来推断调查对象总体的相关统计数据。
抽样调查的特点之一:抽取样本时要遵循“随机原则”,即产生样本时,调查对象总体中的所有单位都有同等被抽中的机会。
抽样调查的特点之二:大数规律起作用的条件是样本容量足够大,如此样本对总体才有充分的代表性。
抽样调查的特点之三:抽样误差可以事先经过计算而控制在一定范围内,并且能采取一定的组织措施来控制这个误差。
二、抽样的术语●抽样单位。
在社会调查研究中,分析单位是我们进行信息收集和分析的基本单位。
而当我们确定采用抽样调查进行社会调查时,习惯于把分析单位称为抽样单位。
●总体。
总体就是抽样调查中所有调查对象的集合体,也称母体。
总体中含有的分析单位的数目,叫总体规模或总体单位数(一般用英文字母N表示)。
●样本。
样本是指从总体中抽取出来的那一部分进行调查的分析单位的集合体。
样本中含有的分析单位的数目,叫样本容量(一般用英文字母n表示),也称样本大小。
如上例中,500就是样本容量。
●抽样。
抽样特指从总体中抽取部分单位(即从总体中获得样本)的过程。
●抽样框。
抽样框就是抽样单位的具体化的实际名单。
●随机原则。
随机原则是指抽样时,在完全排除主观上人为选择的前提下,使总体中每一个单位有相同的被抽中的机会。
所谓随机原则,也叫机会均等原则(或等概率原则)。
遵循随机原则的抽样,叫做随机抽样或概率抽样,否则叫做非随机抽样或非概率抽样。
抽样调查-(PDF)
第3章分层随机抽样第一节概述第二节简单估计量及其性质第三节比率估计量及其性质第四节回归估计量及其性质第五节各层样本量的分配第六节总样本量的确定第七节分层抽样的其他方法2015/4/21第一节定义与符号2015/4/22一、定义定义3.1层:如果一个包含N 个单位的总体可以分成“不重不漏”的L 个子总体,亦即每个单元必属于且仅属于一个子总体,则称这样的子总体为层(stratum )。
设L 个子总体所包含的单位数分别为12,,L N N N ,则有:12L N N N N +++=2015/4/23定义3.2分层抽样(stratified sampling ):又称为类型抽样或分类抽样。
即抽样在每一层中独立进行,总的样本由各层样本组成,总体参数则根据各层样本参数的汇总做出估计,这种抽样就称为分层抽样,所得样本称为分层样本。
设总的样本量为n ,从L 个子总体中所抽取的样本量分别为12,,L n n n ,则有:12L n n n n +++= 。
定义3.3 分层随机抽样(stratified random sampling):如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随机抽样,所得的样本称为分层随机样本(stratified random sample)。
2015/4/24作用分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。
这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。
分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。
层内抽样方法可以不同,而且便于抽样工作的组织。
2015/4/25二、分层原则:总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。
1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。
2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。
抽样调查教案-3分层随机抽样法
第3章 分层随机抽样在前面一章,我们介绍了简单随机抽样。
应该说简单随机抽样在实际中具有广泛的应用,尤其是在总体N 较小或者总体方差2S 与任意局部方差基本相当的情况下,简单随机抽样的优势明显。
然而,当总体单元数N 较大或者总体各单元之间差异较大时,采用简单随机抽样对总体指标进行估计通常会产生很大的误差。
例如,欲通过调查了解我国居民的人均年收入水平。
这时总体是全国人口的13亿人,倘若采取简单随机抽样从中抽取10万人入样,则需要将全国人口依次编号,然后在1~13亿中生产10万个随机数,然后将这些随机数一一对应成具体某个人。
显然这样做是不实际的,就算可以,由于某些人口较少的省市或民族的样本量过小,甚至没有样本点,从而降低了样本对总体的代表性。
不仅如此,由于类似的全国性调查总是需要地方政府的大力协调与配合,如果地方政府不能通过此次调查获取辖区内的相关信息,达到一举两得的效果,那就勉为其难了。
为了克服简单随机抽样上述缺陷和不足,本章引入——分层随机抽样(Stratified sampling )。
§3.1 定义与符号一、定义与符号 (一)定义定义3.1 层(类):如果一个包含N 个基本单元的总体可以分成“不重不漏”的L 个子总体,即每个单元必属于且只属于其中一个子总体,则称这样的子总体为层(stratum )。
设L 个子总体所包含的单元数分别为L N N N ,,,21 ,即有: L N N N N +++= 21},,,{21N N Y Y Y =π,},,,{21i h hN h h N Y Y Y =π,L h ,,2,1 =定义3.2 分层抽样 又称为类型抽样或分类抽样,即抽样在每个层中独立进行,总的样本由各层样本构成。
定义3.3 分层随机抽样若在每层中的抽样采用SRS ,这样得到的样本为分层随机样本(stratified random sample )。
即从第h 层简单随机抽样h n 个单元,构成第h 层子样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即数学期望为:
1 1 E( y) n (Yi1 Yi2 Yin ) N n 其中 表示对 (1,2,, N )中所有组合 ( i1 , i2 ,, in ) 求和
对于(Y1 , Y2 ,, Yn ) 中的每个元素,比如 Y1 ,它与其它元
(1)抽签法:实际上就是一个盒子模型,将编号为1~N的 N个形状与质地完全相同的纸签放在盒子里,用上述两种方 法之一从盒子中摸出 n 张签。
(2)随机数法:设想N相当大,你会做那么多的签放在盒子 里以供抽取吗?随机数法用来解决这个困难。利用随机数表、 随机数骰子或计算机可以获得随机数。 ①随机数表:本书最后附有随机数表,它应当被看成0~9数 字随机地横竖排列,我们可以随机地从某行某列的数字开始 如果需要一至二位数字,则从该数字开始从左向右接连地截 取,该行不够则换下一行开始;如果需要三位或三位以上数 字,则从开头数字开始向右取三位或三位以上的数从该数纵 向往下接连获取其它随机数,不够可另换列执行,直到取到 我们所需要的个数 n ,当然这中间应该去掉可能发生重复的 数以及超出N的数字。
(3.6)式中的因子(N-n)/(N-1),称为随机无放回的校正 系数,它是对随机有放回情况的校正。
如果 N 相当的大,则总体可视为无限总体,由(3.7)式,
2
S2 n n
即为 y 的方差,这是无限总体情况样本平均数的方差。
而有限总体的 y 的方差为:
n S2 S2 (1 ) (1 f ) N n n
N 1 素构成样本的可能次数显然为 n 1 ,因此 N 1 中出现的次数均为 n 1 ,于是
Y1 ,乃至 Yi在
1 N 1 N 1 E( y) n 1 n Yi N i 1 n
1 2
1 1 1 1 [y ( ) Su , y ( ) Su ] 1 1 n N n N 2 2 其中 S 为未知参数,用其无偏估计 s 来代替,则得置信区间 1 1 1 1 2 1 1 2 [y ( ) su , y ( ) su ] 1 1 n N n N 2 2
n
(2)从盒子中随机摸取 1 张票,相应该票的单元入样后, 票并不放回盒子,从余下的票中再随机摸取 1 张票,相应此 票的单元也入样且票也不返回盒子;依此实施,直到第n个 样本入样。
这两种方法都使用了随机的方法,而且样本并不重复, 那么这两种方法是否都算是简单随机抽样呢?要检验一下这 两种方法中每一单元的入样概率是否相等。只要验证第二种 方法中总体的每 n 个单元一组的样本入样的可能性等于第
2 2 可以证明: E( s ) S
即 s 是S 2 的无偏估计
2
S 2的估计,利用正态近似理论可以建立 Y 的置信区间 用 s 作为 y Y 当N,n,N-n 相当大时, 的分布近似可用正 Var( y )
2态曲线表示,由于所以1 1 2 Var ( y ) ( ) S n N 1 1 1 y Y 2 P ( ) t ( t ) S n N
( N 1)! n!( N n)! 1 N 1 N Yi Yi Y ( n 1)!( N n)! N! n i 1 N i 1 ~ ~ ˆ y 是 Y 的无偏估计。同样 Y 也是总体总量Y 的无偏估计 即
例3.1 某班第一小组10人的数学考试成绩分别为: 100,95,92,88,83,75,71,62,60,50 平均分为77.6。先从中任选3个为一组样本,其选法共有120种 每种选法都有概率1/120。以4组样本为例(100,95,92),(100,83, 50),(88,83,62),(62,60,50)它们的样本平均数分别为95.67, 77.67,77.67,57.33。 从抽样调查的角度来看,我们希望抽到第二或第三组样 本,根据它们来估计总体平均数相当准确。而第一和第四组 样本的估计相当糟糕。但它们入样与第二第三组具有同样的 可能性,这是否与 y 的无偏性相矛盾呢?
Yi1 ,Yi2 , , Yin 这组样本与其入样的先 后顺序无关, 得到这组的样本的个数n! 有
样本( i1 ,Yi2 , ,Yin)入样的概率为 Y N 1 n! ( N n)! / N ! 1 n . n C N
也就是说,两种操作方法是等价的。都是简单随机抽样 但由于N、n一般都很大,第二种操作方案较方便。现在介绍 一下具体实施简单随机抽样的做法: 首先将N个总体元素编号为:1,2,,N,每一单元对应 一个号码,若抽到某号,则相应单元入样。
③利用计算机产生随机数:不少现成的统计软件都可提供此 类服务。但必须指出,这样产生的随机数一般不能保证其随 机性,称为“伪随机数”。因此,提倡前述方法产生随机数。
§2
总体平均数与总和的估计
设总体元素为 Y1 , Y2 , , YN ,( y1 , y2 ,, yn ) 为来 自该总体的简单随机样本,有时也记样本为(Yi1 , Yi2 ,, Yin ) ( i1 , i2 , , in ) (1, 2, , N )中的某个组合。在后者的表示中 为 随机性体现在下标 i j ( j 1, 2,, n) 上。样本( y1 , y2 ,, yn ) Y 是总体 1 , Y2 , , YN 的一个有代表性的剖面。
因此称 1-f 为有限总体校正系数,其中f=n/N,称为抽样比 抽样比就是样本所占总体的比例。 f 越大,越接近 1,则样 本越接近总体, y 与 Y 的随机误差就越小;当 f=1 时,抽样 变成全面普查,此时误差消失。
一般情况下 f 比较小,由于 N 是固定的,也就意味着 n 相当小,此时(3.6)式告诉我们 y 的方差将随着 n 的减少而增 大,此时 1-f 在 1 附近,对Var( y ) 的影响不大。事实上, 抽取样本越少,抽样误差越大。 可见实际抽样调查中用 y 估计Y 所产生的随机误差,也 即 y 的方差,主要受到样本容量 n 的影响,因子1-f 的影响 几乎可以忽略。 y 的方差的另一个重要因素是 2或 S 2 。设 当然,影响 想,当 S 2 相当大时,原盒子中的数据相当地分散,从一个很 分散的盒子中随机取一样本来代替总体,你不可能指望误差 很小。 对于 y 的方差,n 的影响是可以由人们主观控制的,只 要多花费一些,多抽取一些就能适当降低误差,当然这只能 控制在一定范围内。
S 2 的影响是客观存在的,盒子中数据越分散,总体就变 S 2 本身就是一个待估参数,必须对S 2 得越难捉摸。实际上, S 2 就无法评价 y 所产生的误差可能 的大小给出估计,不估计
有多大。 设 y1 , y2 ,, yn 为来自总体的样本,既然它是总体的 一个缩影,那么这些值的离散程度应该反映了盒子的离散程 度,因此采用统计量(样本方差):
1 n s2 ( yi y ) 2 n 1 i 1
s 2 的性质,将 s 2改写为: 来估计 S 。为了研究统计量 1 n s2 [( yi Y ) ( y Y )]2 n 1 i 1
2
n 1 s2 [ ( yi Y )2 n( y Y )2 ] n 1 i 1
Yi1 Yi2 Yin 1 Var( y ) Y n N n 其中 表示对 (1,2,, N )中所有组合 ( i1 , i2 ,, in ) 求和
n (Y Y )(Y Y ) n (Yi j Y ) 2 1 ij ik 2 n 2 2 N j 1 n jk n
( 0 1 )
取置信水平为 1
注意到标准正态曲线关于0点的对称性,我们有
1 1 1 y Y 2 P ( ) u 1 1 S n N 2
其中u1 是标准正态曲线的 1 2 分位点,任何一本概率 2 统计的书上都提供有标准正态分布表以供查取分位点。 这样,Y 的 (1 )100% 置信区间为:
②随机数骰子:随机数骰子是由均质材料制成的正二十面体 面上标有0~9数字各两个。通常用3~6个随机骰子,视所需 要的随机数的位数而定。骰子用不同的颜色染成可事先规定 好哪种颜色的骰子产生个位数,哪种颜色的骰子产生十位数, 依次下去。将所需骰子在盒内摇匀等稳定后揭盖读取朝上面 的数字,即获取一组随机数。所摇的骰子数 m通常取决于总 m 1 体单元个数N,满足 10 N 10m。记m个骰子按约定颜 色而确定的顺序读得随机数 R0,若R0 N ,则此 R0即为一次 合格的随机数;否则予以放弃,重新摇取,直到取到n个合格 的随机数为止。
1 nN
2 n 1 N (Yi Y )2 (Yi Y )(Y j Y ) nN N 1 i j i 1
N
1 n 1 N n 1 N 2 {(1 ) (Yi Y ) [ (Yi Y )]2 } nN N 1 i 1 N 1 i 1
1 一种方法中的 N 即可。 利用条件概率即可得到验证。 n
第二种抽取中,不妨假设Yi1 ,Yi2 , ,Yin 先后入样,则
P(Yi1 ,Yi2 , ,Yin ) P(Yi1 ) P(Yi2 | Yi1 ) P(Yi3 | Yi1Yi2 )P(Yin | Yi1Yi2 Yin1 ) ( N n)! 1 1 1 N N 1 N n1 N!
第三章
简单随机抽样
从大小为N的总体抽取样本量为n的样本, 若全部可能的样本被抽中的概率都相等, 则称这样的抽样为简单随机抽样。
§1
简单随机抽样及实施方法
简单随机抽样就是从装有 N 张票子的盒子里随机无放回 地摸取 n 张票子,它可以有两种摸取方法: N (1)从盒子中一次摸取 n 张票。这样摸取共有 种可能 n 1 性,每种可能的概率为 N 。抽到的样本称为简单随机样本。
1 N n 1 n N 1 N