随 机 抽 样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)确定在表中选择数字的顺序。选择数字时遵循的顺序可以随 意确定,如可以顺着每一列自上而Leabharlann Baidu或自下而上;也可以顺着每一 行从左到右或从右到左;还可以顺着对角线方向。例如,本例选择 顺着每一列自上而下的选取方式,一列选完后,从右边的一列继续 自上而下选取;一页选完后,从下一页的第一个列继续自上而下选 取,直到选够随机数为止。
2. 随机数表法
虽然抽签法非常简单,但当N很大时,编制签号的工作量也很大, 而且这些签也很难混合均匀,这时最常用的方法是利用随机数表。
随机数表是由0~9的数字组成的表,表中的数字是随机抽取的,排 列的顺序也是随机的。下图是随机数表的一部分(见图9-3)。
图9-3 随机数表(部分)
【例9-1】
假设要从一个900人的总体中用简单随机抽样的方法抽 取一个80人的样本。
二、 分层抽样
分层抽样(stratified sampling)又称类型抽样,它是先将总 体中的所有单位按某种特征或标志(如性别、年龄、职业或地域等) 划分成若干类型或层次,然后再在各个类型或层次中采用简单随机 抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起 来构成总体的样本。例如,在某地区高科技企业中抽取样本时,可 以先把总体中的各高科技企业按年销售额分为高、中、低三大类; 然后采用简单随机抽样或系统抽样的方法,分别从这三大类的企业 中抽取子样本;最后将这三个子样本合起来构成全体高科技企业的 样本。
从理论上来说,简单随机抽样符合抽样调查的随机原则, 有关抽样调查的基本原则和方法,都是在简单随机抽样的基 础上建立的,它是抽样调查的基本形式。但在实际应用中却 有一定的局限性。例如,当全及总体的编号量N极大时,就 要事先对每个单位一一加以编号,这是几乎不可能完成的。 特别是对于正在连续大量生产的工业产品进行质量抽查时, 就无法对全部产品进行编号抽样。基于以上原因,一般在全 及总体单位数并不太大,而且总体单位之间差异较小的情况 下,简单随机抽样方式才变得简便易行。
2. 分层的比例
分层抽样中有按比例和不按比例分层抽样两种方法。按比 例分层抽样是指按各种类型或层次中的单位数目同总体单位总数 间的比例来抽取子样本的方法。例如,某厂有工人500人,按性 别分层后,有男工400人、女工100人。两类工人人数与总体人 数的比例分别为0.8与0.2。因此,若要抽取一个40人的样本,就 要按照各性别的人数占总人数的比例分别从400名男工中随机抽 取32人,从100名女工中随机抽取8人。这样,样本中男、女工 人之比才与总体中男女工人之比完全相同。
(4)确定开始选择的数组起点。可以闭上眼睛用笔随意在随机数 表上戳一下,戳中的那个数组就是开始的数组。例如,本例随意戳 中的数组是图9-3中随机数表第2列第3行的5650267107,从左到 右前3位数为565,这样编号为565的人就被选入样本了。
(5)处理大于总体规模或重复的随机数。按自上而下的顺序,会 选到969,但由于总体一共是900人,故编号没有969,一个简单的 处理办法是跳过(舍去)这个数,接着选取下一个随机数385;再 往下选,号码分别为495,572,169……选完第一页后,接着从第 二页继续选,一直选够80个为止。如果在选择过程中碰巧选中了两 个相同的随机数,则应跳过(舍去)第二次选中的数。
在实际运用分层抽样的方法时,需要考虑以下2个方面的问题:
1. 分层的标准
同一个总体可以按照不同的标准进行分层。在 实际抽样中,通常采用的标准有以下3条:
(1)以所要分析和研究的主要变量或相关的变量 作为分层的标准。比如,要研究居民的消费状况和 消费趋向,可以以居民家庭人均收入作为分层标准; 又如,要了解不同职业的人员对社会经济改革的看 法,就可以以人们的职业作为分层的标准。
(2)以保证各层内部同质性强、各层之间异质性强、突出 总体内在结构的变量作为分层变量。例如,在工厂对职工进行 调查,可以以工作性质作为分层标准,将全厂职工分为干部、 工人、技术人员、勤杂人员等几类来进行抽样。
(3)以那些已有明显层次区分的变量作为分层变量。例如, 性别、年龄、文化程度、职业等经常被用作分层的标准。又如 学生按年级、专业、学校类型分层,城市按人口规模分层等。
解:(1)确定选出的随机数的位数。在本例中,总体人 数为900,则需要有3位数的随机数才能保证所有人都有被 选中的机会,所以在随机数表中也应取3位数。然后为这 900人编号,即从001~900。
(2)决定从每个数组中选择哪几位数字。要从随机数表的数组中 产生3位数,可以有以下几种情况:选择从左到右的前3位数字;选 择中间的3位数字;选择从左到右的后3位数字。这里的关键是要预 先约定好规则,然后一直按此规则行事。本例从方便考虑,选择数 组从左到右的前3位数字。
在实施简单随机抽样时,通常采用的方法是抽签法和随机数表法。
1. 抽签法
抽签法是为所有的总体单位编制签号,并把签号写 在纸片(或球)上,掺和均匀后从中抽选,如暗箱摸球 开奖等。当总体数目N不大时,可以采用抽签法。具体 操作方法是先用均质材料做成N个签,给每个签编一个 号码,将这N个签充分混合,然后一次抽出n个签;或者 每次抽取一个但不放回,再抽另一个直至抽满n个签为止。 这抽出的n个签上的号码就是入样的单位号码。
随机抽样
作为抽样调查的一种主要抽样方 法,随机抽样常用的抽样组织方式有 简单随机抽样、分层抽样、系统抽样、 整群抽样和多阶段抽样。
一、 简单随机抽样
简单随机抽样(simple random sampling)也称为纯随机抽样, 是对总体不做任何分类、分层、分群或排队处理,而是完全按照随机的 原则,从总体中抽出若干个体组成一个随机样本的抽样方式。简单随机 抽样需要保证总体的每个单位都有同等的机会入选样本,而且每个单位 的抽取都是相互独立的。简单随机抽样是最基本的抽样方式,其他各种 抽样方式都是以简单随机抽样为基础产生的。简单随机抽样分为重复抽 样和不重复抽样两种方式。
由于许多统计软件都有产生随机数的程序,因此利 用计算机产生随机数是一种方便、快捷的方法。但必须 指出的是,由统计软件产生的随机数是伪随机数,在通 常情况下有循环周期,故一般无法保证其随机性。尽管 有些统计软件产生的伪随机数有较长的循环周期,但为 了保证抽样的随机性,在有条件的情况下,最好还是使 用随机数表或随机数骰子来产生随机数。
2. 随机数表法
虽然抽签法非常简单,但当N很大时,编制签号的工作量也很大, 而且这些签也很难混合均匀,这时最常用的方法是利用随机数表。
随机数表是由0~9的数字组成的表,表中的数字是随机抽取的,排 列的顺序也是随机的。下图是随机数表的一部分(见图9-3)。
图9-3 随机数表(部分)
【例9-1】
假设要从一个900人的总体中用简单随机抽样的方法抽 取一个80人的样本。
二、 分层抽样
分层抽样(stratified sampling)又称类型抽样,它是先将总 体中的所有单位按某种特征或标志(如性别、年龄、职业或地域等) 划分成若干类型或层次,然后再在各个类型或层次中采用简单随机 抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起 来构成总体的样本。例如,在某地区高科技企业中抽取样本时,可 以先把总体中的各高科技企业按年销售额分为高、中、低三大类; 然后采用简单随机抽样或系统抽样的方法,分别从这三大类的企业 中抽取子样本;最后将这三个子样本合起来构成全体高科技企业的 样本。
从理论上来说,简单随机抽样符合抽样调查的随机原则, 有关抽样调查的基本原则和方法,都是在简单随机抽样的基 础上建立的,它是抽样调查的基本形式。但在实际应用中却 有一定的局限性。例如,当全及总体的编号量N极大时,就 要事先对每个单位一一加以编号,这是几乎不可能完成的。 特别是对于正在连续大量生产的工业产品进行质量抽查时, 就无法对全部产品进行编号抽样。基于以上原因,一般在全 及总体单位数并不太大,而且总体单位之间差异较小的情况 下,简单随机抽样方式才变得简便易行。
2. 分层的比例
分层抽样中有按比例和不按比例分层抽样两种方法。按比 例分层抽样是指按各种类型或层次中的单位数目同总体单位总数 间的比例来抽取子样本的方法。例如,某厂有工人500人,按性 别分层后,有男工400人、女工100人。两类工人人数与总体人 数的比例分别为0.8与0.2。因此,若要抽取一个40人的样本,就 要按照各性别的人数占总人数的比例分别从400名男工中随机抽 取32人,从100名女工中随机抽取8人。这样,样本中男、女工 人之比才与总体中男女工人之比完全相同。
(4)确定开始选择的数组起点。可以闭上眼睛用笔随意在随机数 表上戳一下,戳中的那个数组就是开始的数组。例如,本例随意戳 中的数组是图9-3中随机数表第2列第3行的5650267107,从左到 右前3位数为565,这样编号为565的人就被选入样本了。
(5)处理大于总体规模或重复的随机数。按自上而下的顺序,会 选到969,但由于总体一共是900人,故编号没有969,一个简单的 处理办法是跳过(舍去)这个数,接着选取下一个随机数385;再 往下选,号码分别为495,572,169……选完第一页后,接着从第 二页继续选,一直选够80个为止。如果在选择过程中碰巧选中了两 个相同的随机数,则应跳过(舍去)第二次选中的数。
在实际运用分层抽样的方法时,需要考虑以下2个方面的问题:
1. 分层的标准
同一个总体可以按照不同的标准进行分层。在 实际抽样中,通常采用的标准有以下3条:
(1)以所要分析和研究的主要变量或相关的变量 作为分层的标准。比如,要研究居民的消费状况和 消费趋向,可以以居民家庭人均收入作为分层标准; 又如,要了解不同职业的人员对社会经济改革的看 法,就可以以人们的职业作为分层的标准。
(2)以保证各层内部同质性强、各层之间异质性强、突出 总体内在结构的变量作为分层变量。例如,在工厂对职工进行 调查,可以以工作性质作为分层标准,将全厂职工分为干部、 工人、技术人员、勤杂人员等几类来进行抽样。
(3)以那些已有明显层次区分的变量作为分层变量。例如, 性别、年龄、文化程度、职业等经常被用作分层的标准。又如 学生按年级、专业、学校类型分层,城市按人口规模分层等。
解:(1)确定选出的随机数的位数。在本例中,总体人 数为900,则需要有3位数的随机数才能保证所有人都有被 选中的机会,所以在随机数表中也应取3位数。然后为这 900人编号,即从001~900。
(2)决定从每个数组中选择哪几位数字。要从随机数表的数组中 产生3位数,可以有以下几种情况:选择从左到右的前3位数字;选 择中间的3位数字;选择从左到右的后3位数字。这里的关键是要预 先约定好规则,然后一直按此规则行事。本例从方便考虑,选择数 组从左到右的前3位数字。
在实施简单随机抽样时,通常采用的方法是抽签法和随机数表法。
1. 抽签法
抽签法是为所有的总体单位编制签号,并把签号写 在纸片(或球)上,掺和均匀后从中抽选,如暗箱摸球 开奖等。当总体数目N不大时,可以采用抽签法。具体 操作方法是先用均质材料做成N个签,给每个签编一个 号码,将这N个签充分混合,然后一次抽出n个签;或者 每次抽取一个但不放回,再抽另一个直至抽满n个签为止。 这抽出的n个签上的号码就是入样的单位号码。
随机抽样
作为抽样调查的一种主要抽样方 法,随机抽样常用的抽样组织方式有 简单随机抽样、分层抽样、系统抽样、 整群抽样和多阶段抽样。
一、 简单随机抽样
简单随机抽样(simple random sampling)也称为纯随机抽样, 是对总体不做任何分类、分层、分群或排队处理,而是完全按照随机的 原则,从总体中抽出若干个体组成一个随机样本的抽样方式。简单随机 抽样需要保证总体的每个单位都有同等的机会入选样本,而且每个单位 的抽取都是相互独立的。简单随机抽样是最基本的抽样方式,其他各种 抽样方式都是以简单随机抽样为基础产生的。简单随机抽样分为重复抽 样和不重复抽样两种方式。
由于许多统计软件都有产生随机数的程序,因此利 用计算机产生随机数是一种方便、快捷的方法。但必须 指出的是,由统计软件产生的随机数是伪随机数,在通 常情况下有循环周期,故一般无法保证其随机性。尽管 有些统计软件产生的伪随机数有较长的循环周期,但为 了保证抽样的随机性,在有条件的情况下,最好还是使 用随机数表或随机数骰子来产生随机数。