抽样技术期末内容整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《抽样调查方法与技术》复习要点
1、我国统计调查方法体系改革的目标模式是什么?为什么?
目标模式:建立以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、科学推算等为补充的搜集和整理基本统计资料的统计调查方法体系。
所以,抽样调查在我国统计调查方法体系中应该是使用最广泛的一种调查方法,在调查方法体系中处于主体地位。
为什么?
解放前,我国统计工作相当薄弱,解放后,我国统计工作主要是照搬前苏联的体制,根据计划经济的特点和分级管理的要求建立了定期统计报表制度,以全面统计为主。
改革开放后,社会主义市场经济逐渐取代了计划经济,统计调查的对象日趋庞杂,以全面统计报表为主的统计调查体系已完全不能适应国家宏观决策与调控,以及部门、企业、社会公众对统计信息的需要,另外全面统计调查方法不仅笨重,缺乏灵活性,而且财力、物力投入大,统计调查效益差,基层负担重,中间环节多,容易受到行政干挠,统计信息质量很难得到保证。
为了从根本上解决调查对象复杂,调查方法单一的问题,对历史上形成的传统的统计调查方法体系进行了改革,于是抽样调查作为一种科学的非全面调查,越来越受到重视。
2、抽样调查会被大数据的“全样本”分析所取代吗?
不会。
第一,抽样调查具有随机性,使得样本可以反映总体的情况。
而大数据样本没有这样的随机性,不能很好的代表总体。
第二,大数据样本不能被当作“总体”,大数据技术本身远远没有达到“普查”的水平,存在统计偏差。
3、大数据时代抽样调查面临哪些挑战与机遇?
(熟读:王莹万舒晨《大数据时代抽样调查面临的挑战与机遇》,《统计与信息论坛》,2016年06期)
(一)大数据对抽样调查提出挑战
第一,《大数据时代》强调“样本=总体”的观点存在争议,事实上不可能完全利用存在无效信息的全部大数据进行分析,因此抽样调查仍然大有可为。
第二,大数据是动态实时变化的,因而统计调查分析的目的可能也随之不断发生变动。
在前期获得部分样本的情况下,需要研究根据已知的样本逐步调整调查的项目,从而获取感兴趣的抽样对象,使得这些“热门”样本数据能够适时入样。
另外,在大数据时代不应拘泥于概率抽样,可以尝试引入非概率抽样。
第三,面对大数据动态变化的特点,传统抽样方法可能导致抽取样本的偏态。
(二)大数据时代下的抽样调查充满机遇。
第一,大数据拓宽了抽样调查数据采集的渠道,一些传统概念中无法获取数据的渠道在大数据时代均有可能进行有效的数据提取。
大数据为抽样调查数据采集提供了很大的便利,能够降低调查成本,缩短调查时间。
第二,大数据为抽样框的及时更新维护提供了便利条件。
大数据时代下抽样框的更新维护,实质就是将实时变化的大数据信息进行有效地采集和整合,转化为抽样框更新维护时可以有效利用的数据信息的方法。
第三,抽样调查可作为弥补大数据因果关系分析的有效手段。
基于一些主客观条件,大数据仅重视相关关系而忽略因果关系。
第四,抽样调查可作为大数据分析的对照基础与验证依据。
对于从混杂大数据中得到的结论,抽样调查可作为大数据分析结果的对照和验证工具。
4、抽样调查中包含的哲学思想。
(熟读:俞纯权《抽样调查理论与方法的哲学诠释》,《统计与信息论坛》2006年02期;
王天营《统计调查方法的哲学思考》,《中国统计》2007年06期)
1、抽样调查的理论和方法体现了辩证唯物主义的认识论
1、抽样调查体现了实践在认识中的决定作用
2、抽样调查是从感性认识到理性认识,再由理性认识到实践的认识活动
3、抽样理论体现了科学的逻辑思维方法
2、抽样调查的理论和方法体现了唯物辩证法的思想
1、总体的定义体现了辩证观点
2、样本的二重性理解体现了唯物辩证法的运动观
3、抽样方法、估计方法体现了唯物辩证法思想
1、抽样调查可以最大限度地保证“个体与总体”、“局部与整体”辩证关系在抽样调查中的应用。
由于选中的单位是个体,个体又是各种信息的基本载体,保证了所有个体的一般性、普遍性,也就使得收集到的所有信息中蕴含有事物的一般规律性,因此可以更好地体现个体与总体、局部与整体的辩证关系。
2、抽样调查可以体现体现事物质量互变的规律性。
抽样调查是以相对较少的个体单位信息为基础,采用归纳推理的数学方法给出总体一般规律的认识。
但是前提条件是构成样本的个体单位数必须足够地多,或者说必须满足数学极限原理才能达到由部分到整体的认识飞跃,其本质就是哲学中“事物量变到一定程度必然发生质变”原理的体现。
抽样调查中纵然不能调查无穷多个单位,但是足够多个单位就足以使人们能得到期待的结果。
3、抽样调查可以更好地体现“相对与绝对”的辩证关系、“具体问题要具体分析”的哲学思想。
通过抽样调查可以达到对特定客观事物总体的认识,但是这种认识是相对的、有误差的。
误差的大小反映着对事物客观规律性认识的接近程度:误差越小表明对事物客观规律认识越接近。
人们可以通过改变或重新设计,新的调查方法逐步改善对客观事物规律性认识的程度。
4、抽样调查完美地体现了哲学中“偶然性与必然性”的辩证关系。
因为抽样调查中随机性原则的使用,保证了在选取部分调查单位时每一个个体单位都有同等被选中的可能性。
尽管在选出具体调查单位前,哪一个个体能被选中与否是偶然的,但是每一个单位都有同等被选中的机会,而且必然有单位要被选中:同时只要随机地选出了样本,用样本信息就必然可以对总体作出具有一定可靠程度的推断。
5、广义抽样调查的分类。
广义的抽样调查(非全面调查)分为概率抽样与非概率抽样。
其中:概率抽样(狭义抽样调查)分为等概率抽样与不等概率抽样;
非概率抽样分为重点抽样、典型抽样、随意抽样等。
6、概率抽样与非概率抽样优缺点比较。
P3-4
概率抽样:
优点:①可计算出每个单位的入样概率;②可计算出每个估计值的抽样误差;③能够保证样本的代表性。
缺点:①比较复杂,专业技术要求高;②相对于非概率抽样,调查费用高、时间长。
非概率抽样:
优点:操作简单,不需要抽样框,经济,快速。
缺点:无法计算抽样误差,调查单位可能存在系统性误差。
7、抽样调查的作用与不足。
作用:
1.能够解决全面调查所无法解决的现象的调查问题。
2.适用于对理论上可以作全面调查,而实际上又难以组织全面调查的现象进行调查。
3.对于时效性要求较高、同时又可以不作全面调查的现象的调查有着特殊的作用。
4.抽样调查的结论可被用来检验和修正全面调查结果。
5.抽样调查可对工业生产过程的稳定性进行监测,从而实现质量控制。
6.利用抽样调查方法还可以对总体的某些假设进行检验,以判断这些假设的真伪,为管理决策提供依据。
不足:
1.理论与技术比较复杂;
2.需要足够好的样本,需要具有代表性和随即性,具有不稳定性,有所偏差,推断结果有差错;
3.抽样调查只提供对总体目标量的估计而较难提供划分过细的子总体,即小域的估计;而子总体难以推断,为满足各级管理需要,抽样单位数层层加码,抽样调查难免异化为全面调查。
优点:
1.由于只从总体中抽取一部分样本进行调查,工作量小,所以比全面调查节省人力、物力、财力,比较经济;
2.可以及时取得调查资料,提高数据的时效性;
3.数据质量有保证,由于抽样调查一般是自上而下组织调查,直接派员深入实际抽取样本并推断总体,可以减少人为因素干扰,只要取样、推断方法科学,均有利于提高数据的质量;
4.调查方法灵活,如实际工作中使用较多的问卷调查、入户调查、电话调查等,适应面广,特别适于对点多面广的总体作调查。
抽样调查的特点
1.按随机原则抽选样本,在总体中每一个单位被抽取的机会是均等的。
2.用样本资料推断总体数量特征。
适合样本数量较多的情况下采用。
(好处?抽样调查能在一定程度上起到全面调查的作用;全面调查是特殊的抽样调查)
3.速度快、周期短、精度高。
4.在抽样推断之前可以计算和控制抽样误差。
可以用一定的概率来保证将误差控制在规定的范围之内。
5.抽样技术灵活多样。
6.抽样调查的应用十分广泛。
7.同其他调查方式相比,抽样调查的技术性更强。
抽样调查的基本程序
1.设计抽样方案。
2.编制抽样框和设计调查表(问卷)。
3.试抽样调查(通过、修改通过、否定)。
4.正式抽样调查。
5.数据处理。
6.推断分析。
7.总结评估。
8、抽样调查与普查如何结合?抽样调查与全面调查如何选择?(P5-6)
抽样调查与普查如何结合?
1.时间上结合。
如人口调查。
2.空间上结合。
对某些单位实施普查,对另外一些单位实施抽样调查。
如规模以上工业企业与规模以下工业企业调查、人口普查中的长表与短表。
3.项目上结合。
比如,在残疾人调查中,对残疾人的数量、收入、致残原因进行普查,对其婚育状况、家庭人口、就业、年龄分布等进行抽样调查。
4.用抽样调查的资料矫正普查的登记误差。
抽样调查与全面调查如何选择?
1.费用;
2.时效;
3.总体大小;
4.小区域估计:普查调查所有单元,所以它可以提供任何层次的估计,且没有抽样误差。
5.属性的多寡;
6.调查误差;
7.特殊要求:如果只有那些受过专门训练的人员或者使用昂贵的计量仪器才能收集到所需的数据,大规模的普查是不可能的。
此时抽样调查是唯一可能的选择。
8.其他因素:进行普查还有一些其他原因,其中之一是为以后的抽样调查提供抽样框。
9、在抽样调查发展的历史中,哪两篇文章(报告)的发布从理论和实践上充分肯定了抽样方法的科学性?
鲍莱和詹森(丹麦、1925)在第16届ISI上分别作了《抽样精确度的测定》、《代表性方法的实践》的报告,从理论和实践上充分肯定了抽样方法的科学性。
10、调查单位与抽样单位二者的关系。
注意二者有时一致,有时不一致。
(一)调查单位是调查项目的承担者,是我们通过调查想获取观察值的单位。
在绝大多数情况下,调查单位是总体中最基本的单位。
(二)抽样单位是调查总体中每次可能被抽中的单位。
如省抽县,抽样总体中的每个县是抽样单位;县抽乡,调查总体中的每个乡是抽样单位。
(三)二者关系
1、抽样单位是调查总体与调查单位之间的联结单位。
2、①一般情况:调查单位是最后一级的抽样单位。
住户调查,居民家庭既是调查单位,也是最后一级抽样单位。
②少数情况A :1个抽样单位包含多个调查单位。
如居民健康状况调查,调查单位是居民个人,抽样单位可以是每一户居民家庭、一栋楼房、一个居民社区。
(通过抽查家庭调查居民)
②少数情况B:1个调查单位可能对接于多个抽样单位。
如家庭多名成员在同一企业上班,抽样单位是职工个人,调查单位是职工家庭(通过抽查职工调查家庭)。
(四)抽样单位分级
多阶段抽样中,抽样单位可以分级。
如粮食产量调查中省抽县、县抽乡、乡抽村、村抽农户或地块。
(五)调查单位与抽样单位的规模及形式
规模:可以相同,可以不同;(整群抽样)
形式:可以是自然单位,可以是人为单位。
11、好的抽样框的标准。
在抽样以前,必须把调查总体(抽样总体)转化为抽样框。
抽样框,就是根据调查总体中的一个个单位所编制的名录,是调查总体的具体表现。
抽样框一般最初来源于普查。
一个好的抽样框应该具备四个标准:一是与目标总体保持一致;二是能够提供与调查目的有关的尽量多的准确的、完整的辅助信息,以便在抽样中容易找到调查单位;③使用方便,④编制与更新费用低廉。
12、样本(样本总体)有人称为“代表团”。
样本为什么能够代表总体?
①是从总体中随机抽出来的,不是挑选出来的;
②严格的概率抽样,抽选的样本在总体中的分布比较均匀(二者结构相似);
③它是一个“代表团”(样本单位数量足够多),不是个别单位。
13、优良估计量的标准。
①无偏性:估计量的数学期望应等于总体指标。
q q E =)(^
②一致性(相合性):当样本容量趋近于总体容量时,估计值会趋近于总体指标。
1e ||^lim =⎭⎬⎫⎩⎨⎧<-→q q P N
n ③有效性(Effectiveness ):优良估计量的方差应较小,这样估计量的取值能集中在被估计的总体参数的附近,
对总体参数的估计和推断更可靠。
设1^q 、2^q 为θ的两个无偏估计量,若)2()1(^^
θθD D <,则1^q 比2^q 有效。
需要注意:在抽样中,应尽量选择同时满足无偏、一致和有效要求的估计量。
然而,有时无偏性和有效性之间可能有矛盾,即某个估计量虽然无偏但有效性较差,而另一个估计量虽然有偏但更有效。
这时,我们一般会为了有效性而放弃无偏性,即选择那个有偏但更有效的估计量。
④充分性(Sufficiency ) :对于总体指标θ,若其估计量
q ^提取了样本中包含的有关总体指标θ的全部信息,则估计量q ^
就称为是总体指标θ的充分估计量。
⑤稳健性(Robustness ):如果用来估计总体指标θ的样本估计量对样本数据的污染不敏感,即估计量的数值不受被污染数据的干扰或受其干扰不大,则该估计量就是总体指标θ的一个稳健估计量。
注:样本平均数的特性:由大数定律知,样本平均数是总体均值的一致估计。
同时包含了关于总体均值的全部信息(充分);还可以证明,样本均值在总体均值所有的无偏估计量中具有最小方差,样本均值是总体均值的一个无偏、有效、一致、充分性要求的估计量,但不是一个稳健性的估计量。
中位数具有稳健性的特点,但是会损失一定的有效性和充分性。
可以考虑一个新估计量,即将样本均值和中位数折中,比如切尾均值。
切尾均值,即将样本数据按大小排序后,切掉两端部分数据再计算均值。
实践中常用的切尾均值是中均值,亦即将样本数据按大小排序后两端各切掉25%的数据再计算均值。
14、抽样分布定理。
①正态分布的再生定理 若样本来自期望为Y 、方差为2
S 的正态分布总体,则不论样本容量大小,样本均值y 都服从期望为Y 、方差为n S V 2)y (=(重复抽样)或 n
S f V 2
)1()y (-=(不重复抽样)的正态分布。
其中,N n f =是抽样比。
②中心极限定理
若样本来自任一期望为Y 、方差为2
S 的总体,则当样本容量足够大时(一般要求:30≥n ),样本均值也服从于期望为Y 、方差为n S V 2)y (=(重复抽样)或 n
S f V 2
)1()y (-=(不重复抽样)的正态分布。
③t 分布
若样本来自方差未知的正态总体且样本容量较小(30<n ),或样本来自任一方差为2
S 的总体且样本容量较小(30<n ),则样本均值y 服从于自由度为n-1的t 分布。
t 分布与正态分布十分接近。
(自由度愈大,t 分布曲线愈接近正态分布曲线。
通过三大定理得出一个结论,不管哪种情形,样本均值的方差用以下公式计算没有多大问题:
n S V 2)y (=(重复抽样) n
S f V 2
)1()y (-=(不重复抽样) 15、均方误差、方差与偏倚(定义与关系)。
1.均方误差:2^^)()(q q E q MSE -=
2.估计量的方差:2
^^^)()(⎥⎦
⎤⎢⎣⎡-=q E q E q V 3.偏倚(偏差):q q E q B -=)()(^^
关系:均方误差=方差+偏倚的平方
)()()()(-)()(-2)()(-)()(-)()(^2^2
^2^^^^^2^2^^2^^^2
^^q B q V q q E q E q E q q E q E q E q q E q E q E q q E q E q E q q E q MSE +=⎥⎦⎤⎢⎣⎡-+⎥⎦⎤⎢⎣⎡=⎥⎦
⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡+⎥⎦⎤⎢⎣⎡-+⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡-+=-=)()()(
16、抽样误差的表现形式:实际抽样误差:实际抽样误差(或称抽样实际误差)、抽样标准误、抽样极限误差。
1、抽样实际误差:实际抽样误差=抽样估计值-相应总体参数。
即q q -^(与偏倚不同)抽样实际误差能计算吗?
2、抽样标准误:根据某一估计量公式计算的所有可能样本的估计值的标准差,是狭义的抽样误差(抽样标准误在统计学中又叫抽样平均误差),是衡量抽样误差大小的核心指标。
根据定义,抽样标准误)()(^^q V q SE =。
当估计量有偏但偏差不大时,则有:)()(^
^θθMSE SE ≈ 抽样标准误较小,意味着根据所有样本计算的对总体某一参数的全部估计值之间的差异小,如果估计量无偏或接近无偏,这些估计值比较集中在相应的真实的总体参数周围,即抽样实际误差较小;反之,抽样标准误较大,抽样实际误差也较大。
因此,完全可以用抽样标准误来说明抽样实际误差的大小。
抽样误差可以在抽样前就可计算,并可控制。
3、抽样极限误差,也称为允许误差。
是指用样本估计总体时在某种概率意义下所允许的最大误差范围,一般用△表示。
(教材: P25误差限d )一般而言,
绝对误差△=|θ的估计值-θ的真实值|
相对误差r=值
值值的真实|的真实-的估计|θθθ 抽样极限误差是特定概率下允许的最大绝对误差。
抽样极限误差不是实际误差。
因为估计值的大小与概率大小有关,但是其含义已经很清晰了。
抽样极限误差一般由调查的组织者给出;若调查者自己就是组织者,可以提出一个经验数字,也可以由试调查(预调查)计算的抽样标准误与推断概率计算。
抽样极限误差的影响因素:一个是抽样标准误)(^
θSE ,另一个是概率保证程度)(1t F P a ==-
点估计给出了总体参数估计的一个定值,但这个定值的准确性和可靠性无法衡量。
点估计的结果老百姓容易理
解。
点估计的主要作用是为区间估计提供推断的基础。
17、样本设计效果评价。
Deff 的应用。
样本设计效果评价:估计量方差与费用。
设计效率优点一是反映设计效果高低的相对指标,又叫设计效果系数、设计效应,是指两个抽样方案的抽样方差之比。
一般用Deff 来表示。
美国统计学家kish 提出了一个具体的计算方法:
因为简单随机抽样是最基本的样本设计,若一种设计的估计量方差)(^
d θV ,比简单随机抽样的估计量方差)(^srs θV 还小,我们称其方案的设计效率比简单随机抽样高;反之则低。
设计效率:(简单随机抽样时)复杂抽样时)
()
)((^^q V q V Deff srs d =
设计效率优点二是还可用来计算复杂抽样(非简单随机抽样)的样本量。
值的上限
可采用历史资料或理论量
是简单随机抽样的样本是复杂抽样的样本量
deff n n deff
n n ''⨯=
几种抽样方式设计效率Deff 比较,通常情况下有:
简单随机抽样: Deff =1(一定的)
分层抽样: Deff< 1 (一般有:分层抽样的抽样误差最小。
)
整群抽样: Deff >1
机械抽样: Deff ≤1
多阶段抽样: Deff >1
18、非概率抽样的概念和适用场合。
非概率抽样:抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法。
(主观认识或方便)
非概率抽样适用场合
概率抽样的结果明显优于非概率抽样,然而实际中的调查没有一个能严格匹配于经典教科书的概率抽样方法。
同时,有些抽样只能采用非概率抽样。
共同特点:不是随机原则入样,抽样时总体单位的入样概率未知,入样与否与研究人员的经验和主观意志有很大关系。
因此,非概率抽样在应用时更需研究人员具备深厚的背景知识和相关经验。
非概率抽样受到重视的原因:
1、严格的概率抽样几乎无法进行。
例如总体边界不清而无法制作抽样框。
2、如果调查目的只是对问题作初步探索,或为了获得今后研究线索,或为了提出假设而不是推断总体,采用概率抽样就不一定必须。
3、调查对象不确定或根本无法确定。
如对突发事件进行现场抽样调查。
4、总体单位离散程度不大,而调查有关人员具有丰富的抽样调查经验。
(结果不一定不准确)
5、非概率抽样往往更简单(随意,或方便,凭经验)。
19、几种具体的非概率抽样方法。
就其本质只有四种:便利抽样、判断抽样、配额抽样和(滚)雪球抽样。
(一)便利抽样又称就近抽样、偶遇抽样、自然抽样、随意抽样、方便抽样等。
它是根据调查者方便与否来抽取样本的一种非概率抽样方法。
如抓最靠近笼门的小白鼠做实验。
优点:简便易行成本低。
缺点:难以真正涵盖总体,样本偏差有时比较大。
(二)判断抽样又称目的抽样、代表性抽样,接近于“解剖麻雀式典型调查”。
它是根据调查者自己的知识经验判断选择代表性或典型性单位进行调查。
如选中等收入住户了解对某产品的购买意向。
优点:充分发挥调查人员的主观能动性及对信息了解来选择样本单位。
缺点:主观性强,没有客观标准。
注意:目的抽样从主观上看很在乎寻找有代表性的单位(不很方便),因此区别于“随意抽样”;教材P2把“目的抽样”与“判断抽样”割裂开来不妥。
(先判断—判断抽样,再有意识去抓—目的抽样)
(三)定额抽样又称配额抽样,接近于“划类选典式典型调查”。
先对总体按一定标志分类,并按比例分配每类应调查单位的定额,然后由抽样者在每类进行判断抽样。
(先在每类中定额即定数量,再从每类中主观抽样)。
美国盖洛普公司(Gallup)首先发明使用,在于提高样本的代表性。
在市场调查、民意测验中经常适用。
优点:先分类再抽样,对总体代表性相对较高。
缺点:从每类中获取样本单位时仍然是非概率抽样,主观性强。
(和分层抽样有何区别?分层抽样是随机抽样,在每一层中随机抽样;而定额抽样时非随机抽样,在每一层中主观抽样。
)
(四)滚雪球抽样又称链式抽样。
它是以“滚雪球”方式抽取样本,即通过一些“种子”样本点以获取更多样本点的信息,样本逐渐庞大。
其特点是便于有针对性地抽选样本而不致于“大海捞针”。
(五)流动总体抽样又称捕获-标记-再捕获。
它是抽样者先从总体中获取部分单位,加以标记后放回总体,过一段时间后再获取部分单位,然后根据再获取单位中有标记单位的比例推断总体的数量。
有人认为,流动总体抽样是介于概率抽样与非概率抽样的抽样技术;而有人认为它只是一种调查技术而非抽样技术。
(六)志愿者抽样P2-3。
被调查者是志愿者(感兴趣而自愿的,或受道德与舆论绑架而被迫的)。
如医疗试验,读者意见调查。
20、为什么说简单随机抽样是等概率抽样?(从样本来看和抽样单元来看)
1、从样本来看是等概率抽样。
⎪⎪⎪⎪⎪⎩
⎪⎪⎪⎪⎪⎨⎧=-===-+n N n n N n
C N n N C N 1!)!
(111样不考虑顺序的不重复抽不考虑顺序的重复抽样考虑顺序的不重复抽样考虑顺序的重复抽样概率:每个可能样本被抽中的 2、从抽样单元来看是等概率抽样。
每个单元(单位、个体)的入样概率:n/N
(1)按照随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。
(2)每个抽样单元被抽中的概率都是已知或者事先确定的,或者事先可以计算出来的。
(3)每个抽样单元抽中的概率都是相等的,即简单随机抽样属于一种等概率随机抽样。
21、重复抽样与不重复抽样比较。
1、每次抽样时面对的总体结构是否相同
2、样本量相同时信息量的差异
3、样本量与总体大小有无直接关系
在实践中,一般多采用不考虑顺序的不重复抽样,没有特别指明时,都是指这种。
22、如何利用随机数字表抽样。
随机数表是一张由0,1,2,…,9这十个数字组成的,一般常用的是五位数的随机数字表,10个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。
用随机数表抽选简单随机样本时,一般可根据总体大小N 的位数决定在随机数表中随机抽取几列,比如N =768,要从中抽取n=10的简单随机样本,则在随机数表中随机抽取相邻的3列,顺序往下(或往上),选出前10个001到768之间的互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽够n 个单位为止。
用此种方法,当N 的最高位数较小,比如小于5,且n 不小时,由于读到的随机数被舍弃不用的比例较大,抽选效率较差。
例如,N=247,若按常规方法,则大于247的随机数(248—999)以及000都没用到,此时可采用下面的方法。
在随机数表中随机抽取3列,顺序往下,如果得到的随机数大于247(本应舍弃),则用这个数除以247,。