分层抽样

分层抽样
分层抽样

分层抽样

教学目标:

1.理解分层抽样的概念,掌握其实施步骤,培养学生发现问题和解决问题的

能力。

2.掌握分层抽样与简单随机抽样和系统抽样的区别与联系,提高学生总结与

归纳能力,体会客观世界的普遍联系性。

教学重点:

分层抽样的概念及步骤。

教学难点:

确定各层的样本的个体数目,以及根据实际情况选择正确的抽样方法。

教学过程:

一.知识回顾:

回忆我们学过的两种随机抽样方法。

二.提出问题:

某地区有高中生2400人,初中生10900人,小学生11000人,教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?

讨论:

(1)为什么这样取各个学段的个体数?

(2)归纳分层抽样的定义;

(3)归纳分层抽样的步骤;

(4)分层抽样时如何分层?它适用于什么的总体?

三.知识要点:

1.分层抽样的定义:

一般地,在抽样时,将总体分成,然后按照一定的,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。

2.分层抽样的步骤:

(1)分层即将总体按一定标准;

(2)确定抽样比(由总体中的个体数N与样本容量n确定抽样

比: );

(3)按比例确定各层应该抽取的个体数;

(4)各层分别抽样即各层分别按方法进行抽样

(5)将每层抽出的个体,组成样本;

注意:分层抽样对于不能取整的数,。

3. 分层抽样适用范围:

四.典例分析:

例一.某学校500名学生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,为了研究血型与色弱的关系,需从中抽出一个容量为20的样本,怎样抽出?

变式训练:

1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()

A.15,5,25

B.15,15,15

C.10,5,30 D 15,10,20

2、一个地区共有5个乡镇,人口15万人,其中人口比例为3:2:5:2:3,

现从15万人中抽取一个1500人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法抽样?并写出具体过程。

五.探究

三种抽样方法的比较:

最基本的抽样方法

六.课堂小结

七.当堂自测:

1、下列问题中,采用怎样的抽样方法比较合理:

①从10台冰箱中抽取3台进行质量检查;

②某电影院有32排座位,每排有40个座位,座位号为1~ 40。有一次报告会坐满了听众,会议结束后为听取意见,留下座位号为18的32名听众进行座谈;

③某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名。为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本

2、(2004年全国高考湖南卷)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和销后服务等情况,记这项调查为②.则完成①、②这两项调查采用的抽样方法依次是 ( )

A.分层抽样法,系统抽样法

B.系统抽样法,分层抽样法

C.分层抽样法,简单随机抽样法

D.简单随机抽样法,分层抽样法

3、某单位有职工160人,其中业务员有104人,管理人员32人,后勤24人,现用分层抽样从中抽取一容量为20的样本,则抽取管理人员()人

A、3

B、4

C、7

D、12

4、某校有老师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知女学生中抽取的人数为80,则n=_______

5、(2011年天津卷9题) 一支田径队有男运动队48人,女运动队36人,若用分层抽样的方法从该队的全体运动队中抽出一个容量为21的样本,则抽出男运动队的人数为_______。

6、某大学数学系共有本科生5000人,其中一、二、三、四年级的学生比为4:3:2:1,用分层抽样的方法抽取一个容量为200人的样本,则应抽取三年级的学生为()人。

A、80

B、20

C、60

D、40

分层抽样

一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤:

(1),将总体按一定标准分成互不交叉的层;

(2)确定抽样比(由总体中的个体数N 与样本容量n 确定抽样比: )

(3)按比例确定各层应该抽取的个体数。

(4)各层分别按简单随机抽样或系统抽样的方法抽取。 (5)将每层抽出的个体,组成样本。 注意:对于不能取整的数,求其近似值。 【说明】分层抽样应遵循以下要求:

(1)分层:将相似的个体归为一类,即分为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。

(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比与样本容量与总体容量的比相等。

(3)当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 〖分层抽样的特点〗: (1)适用于总体由差异明显的几部分组成的情况;

(2)能充分保持样本结构与总体结构的一致性,提高样本的代表性;

(3)是等可能抽样,每个个体被抽到的可能性都是n/N.

变式训练答案:1.

D

2.因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法 具体过程如下

(1)将15万人分为5层,其中一个乡镇为一层.

N n

(2)按照样本容量的比例求得各乡镇应抽取的人数分别为300人、200人、500人、200人、300 人.

(3)按照各层抽取的人数用系统抽样抽取各乡镇应抽取的样本.

(4)将抽得的1500人组到一起,即得到一个样本

练习答案:

1.(2)简单随机抽样(2)系统抽样(3)分层抽样

2. C.

3.B

4.192

5. 12

6.D

市场调查中样本容量的确定

16 CHINA STATISTICS 市场调查中样本容量的确定 文/陈克明 宁震霖 在市场调研工作中,采用随机抽样进行资料采集时,需要预先确定样本量的大小。我们知道,在系统误差确定的条件下,抽样调查的准确性取决于抽样误差,而抽样误差的大小又与样本容量有直接的关系,即样本容量越大,抽样误差就越小。当然,这并不能说在抽样调查中样本容量越大就越好,因为样本容量越大,调查的费用就越高。因此,决定样本容量大小的主要因素是特定的调研项目对抽样误差的要求和项目预算经费这两个方面。在实际工作中,样本容量的确定实际上就是在抽样误差与经费预算之间求得最佳的平衡,即在可以接受的抽样误差的条件下使用最少的经费,当然,有时候则可能是在一定的经费额度条件下争取最小的抽样调查误差,而这个误差当然必须是可以接受的。所以,在市场调研中,随机抽样调查样本容量的确定,通常都是先根据调查对抽样误差的要求来考虑。 根据抽样误差要求确定的样本容量 根据随机抽样的基本原理,样本容量可以通过抽样误差、极限误差及置信度等因素的分析来加以确定。设在简单随机抽样(重复抽样)的条件下,置信度(t )与抽样误差(μ)及极限误差(Δ)的关系为t =Δ/μ,均值指标的抽样误差(μ)是由总体标准差(δ)和样本容量(n )决定的,即 显然,整理可得: 这就是说,只要我们能够确定总体标准差(δ)、置信度(t)和极限误差(Δ),样本容量即可确定。 第一,总体标准差的确定。总体标准差虽然是客观存在的,但我们是无法直接得到准确的数据的,所以在抽样调查中只能使用近似值,通常有几种简便的处理办法。 1.试验性抽样调查。在调研总体规模较大的情况下,可采用抽样调查方法估计δ。 即根据抽样调查所取得的样本标准差S的结果求得δ。根据概率论和数理统计的有关知识可知: 而 (其中X i 是样本值,X - 是样本 均值,n 是样本容量,δ是δ的最大似然估计),所以有 。 在样本容量n 满足大样本(一般不少于30个)的情况下, ,即 。也就是说,可以专门做一次n>30的抽样调查,用该样本资料可以计算得到样本标准差S,用样本标准差代替总体标准差。 2.利用历史资料或二手资料。一般地,大多数企业过去都曾经做过相关的市场调查,或相关部门(企业内部或企业外部)存有相关的二手统计资料,可以利用这些资料来估计总体标准差δ。 3.估算。根据概率论和数理统计的有关知识可知,在标准正态分布条件下,距离中心 的范围内分布了相当于总体的99.73%的变量,我们可将99.73%近似于总体的全部变量,即近似于100%。据此,只要能找出总体中最大值X max 和最小值X mi x ,然后根据近似公式 ,求得总体标准差δ。 4.运用管理人员的经验判断。在抽样调查实践中,如果要求不是非常严格,可以根据管理人员的有理有据的经验判断来估计总体标准差δ。 第二,极限误差或最大允许误差的确定。它是抽样调查实施者愿意接受或可容忍的最大误差,极限误差是一个临界值, 即误差超过这个临界值在很大的可能性上会改变事物的性质,如我们确定月收入在1000-1500元的为中等收入,其平均收入 水平为1250元,如果极限误差超出±250,则可能发生本来实际上属于中等收入水平的被划归入高收入阶层或低收入阶层,从而导致得出完全不同的分析结论,导致错误。 极限误差的确定需要具体问题具体分析。在抽样调查实践中,极限误差的确定可以根据经验和定性分析,先确定一个初始值,然后对这个初始值进行分析认定,如果太大就逐步加以缩小,如果太小就逐步扩大,放大该初始值,直到该值达到可能导致分析失误的临界状态,这个临界值就可以作为极限误差。

分层抽样实验报告

抽样调查课程 实验报告 小组同学姓名及学号 组员1:关欣2011101209 组员2:陈玉2011101221 __ 组员3:张林娜2011101231___ 实验报告

实验思考题: 1、 某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经 完成了抽样,并获得样本情况(见数据表1),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。 按性别分层: 男:样本量为127,平均生活费支出为569.685,方差为52368.4,标准差为228.841 女:样本量为145,平均生活费支出为617.241,方差为64284.004,标准差为253.543 按家庭所在地分层: 大型城市: 样本量为86,平均生活费支出为614.5349,方差为90050.957,标准差为300.0849 乡镇地区:样本量为68,平均生活费支出为529.411,方差为48002.633,标准差为219.095 中小城市:样本量为118,平均生活费支出为618.644,方差为41016.949,标准差为202.526 2、 教材71页第5题(1)问 层 Nh 样本 1 256 10 10 2 0 20 10 0 10 30 20 2 420 20 35 10 50 0 40 50 10 20 20 3 168 0 20 0 30 30 50 40 0 30 0 W1=0.303 W2=0.498 W3=0.199 f1=0.039 f2=0.024 f3=0.060 _y 1=11.2 -y 2=25.5 - y 3=20 s1=9.716 s2=17.392 s3=18.856 平均支出为 ==∑=3 1 h h h pst y w y 20.0677 估计的方差为=- =∑=3 1 221)(h h h h h pst s n f w y v 18.038 估计的标准差为=)(y pst v 3.61

抽样调查习题

抽样调查练习 适合对口升学 一.单选题 1. 随机抽样的基本要求是严格遵守( )。 A.准确性原则 B.随机原则 C.代表性原则 D.可靠性原则 2. 抽样调查的主要目的是( )。 A.广泛运用数学的方法 B.计算和控制抽样误差 C.修正普查的资料 D.用样本统计量推算总体参数 3. 抽样总体单位亦可称为( )。 A.样本 B.单位样本数 C.样本单位 D.总体单位 4. 抽样误差产生于( )。 A.登记性误差 B.系统性误差 C.登记性误差与系统性误差 D.随机性的代表性误差 5. 在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的情况是( )。 A.样本单位数占总体单位数的比重很小时 B.样本本单位数占总体单位数的比重很大时 C. 样本单位数目很少时 D. 样本单位数目很多时 6. 在同样条件下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差大小关系是( )。 A.两者相等 B.前者小于后者 C.两者有时相等,有时不等 D.后者小于前者 7. 在抽样推断中,样本的容量( )。 A.越小越好 B.越大越好 C.取决于统一的抽样比例 D.取决于对抽样推断可靠性的要求 8. 用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )。 倍倍倍倍 9. 在重复简单随机抽样下,抽样平均误差要减少1/3,则样本单位数就要扩大到( )。

倍倍倍倍 10. 某企业今年5月试制新产品,试生产60件,其中合格品与不合格品各占一半,则该新 产品合格率的成数方差为( )。 %%%% 11. 点估计( )。 A.不考虑抽样误差即可靠程度 B.考虑抽样误差及可靠程度 C.适用于推断的准确度要求高的情况 D.无需考虑无偏性、有效性、一致性 12. 反映样本统计量与总体参数之间抽样误差可能范围的指标是( )。 A.概率 B.允许误差的大小 C.概率保证程度 D.抽样平均误差的大小 13. 在区间估计中,有三个基本要素,它们是( )。 A.概率度、抽样平均误差、抽样数目 B.概率度、统计量值、误差范围 C.统计量值、抽样平均误差、概率度 D.误差范围、抽样平均误差、总体单位数 二.多选题 1. 抽样技术是一种( )。 A.搜集统计资料的方法 B.对现象总体进行科学的估计和推断方法 C.随机性的非全面调查方法 D.全面、准确的调查方法 2. 抽样调查的特点有( )。 A.只调查样本单位 B.抽样误差可以计算和控制 C.遵循随机原则 D.用样本统计量估计总体参数 3. 适用于抽样推断的有( )。 A.连续大量生产的某种小件产品的质量检验 B.某城市居民生活费支出情况 C.具有破坏性与消耗性的产品质量检查

如何确定抽样统计的最小样本量

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格) 在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 ?a方支持率为%; ?b方支持率为%; ?c方支持率为%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况); 最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采 样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为 1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=,置信度为90%时,=,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样为y 相对抽样误差h = E / y C= σ / y 以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 置信度相对抽样误差(假设:C=

分层抽样 例题文档

第三章分层随机抽样书P129 3.1.某高校欲了解教职员工对某项津贴与职务职称挂钩的分配制度改革的态度,准备在全校教职员工中进行抽样调查,为了提高抽样技术,准备进行分层抽样,请判断下面的几种分层方法是否合适? (1)按性别分层 (2)按教师、行政管理人员、职工分层; (3)按职称)(正高、副高、中级、初级、其他)分层 (4)按部门(如系、所、处)分层 3.2. 某学院4个专业的新生元旦晚会,组织者为了活跃气氛,欲在800名学生中抽出8名作为“幸运星”,为了以示公平,要求每位学生被抽中的概率相同。组织者知道利用简单随机抽样的方法可以满足要求,你能不能帮助组织者再设计几种方案? 3.3.某居委会辖有三个居民新村,居委会欲对居民购买彩票情况进行调查,调查者考虑以新村分层,在每个新村中随机抽取了10个居民户最近一个月购买彩票所花费的金额(元),下表是每个新村及调查情况: (1)试估计该小区居民户购买彩票的平均支出,并给出估计标准差。 (2)当置信度为95%,要求极限误差不超过10%时,按比例和奈曼分配时样本量及各层的样本量分别为多少? 3.4.随着经济发展,某市居民年生活习惯在改变,为研究该现象,某机构以市中心163万居民户作为研究对象,将居民户按6个行政分层,在每个行政区随机抽出30户居民进行调查,(各层抽样比可忽略),调查结果如下:

(1)试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。 (2)置信度为95%,要求极限绝对误差不超过1%时,按比例和奈曼分配时样本 量及各层的样本量分别为多少? 3.5.某开发区利用电话调查对区内冷冻食品情况进行调查(各层抽样比忽略)调查后各层样本户购买冷冻食品支出的中间结果如下表: 试估计该开发区居民购买冷冻食品的平均支出,以及估计的95%的置信区间。 3.6.某单位欲估计职工的离职意愿,聘请了专业公司来进行调研,公司人员按高级职称、中级职称和初级职称分为3层,已知层权分别为0.2,0.3,0.5,预先猜测各层的总体比例为:0.1,0.2,,0.4,如果采用按比例的分层抽样,要求估计的方差与样本量为100的简单随机抽样相当,则样本量为多少?(不考虑有限总体校正系数) 3.7.如果一个大的简单随机样本按类别分为6组,然后按照层的实际大小重新进行加权,这一过程称为事后分层,才用这种方法是由于(判断以下说法的

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

抽样调查-分层抽样实验报告

实验报告 实验思考题: 1、某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经 完成了抽样,并获得样本情况(见样本文件),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。 (1)先对数据按照家庭所在地进行排序:【数据】→【排序】,选择“家庭所在地”(2)再对数据进行分类汇总:【数据】→【分类汇总】,“分类字段”选择“家庭所在地”,“汇总方式”选择“平均值”,“选定汇总项”选择“平均月生活费”,在对话框下方选择“汇总结果显示在数据下方”;再做两次分类汇总,“汇总方式”分别选择“计数”和“标准偏差”。最后得到表1-1所示结果: 表1-1 家庭所在地平均月生活费 大型城市平均值614.5348837 大型城市计数86 大型城市标准偏差300.0849173 乡镇地区平均值529.4117647 乡镇地区计数68 乡镇地区标准偏差219.0950339 中小城市平均值618.6440678 中小城市计数118 中小城市标准偏差202.5264159 总计平均值595.0367647 总计数272 总计标准偏差243.4439223

(3)在SPSS软件中得出的计算结果: 选择————,然后在出现的对话框中 分别在“Dependent list”框中选入“家庭所在地”,在“Independent List”框中选入“平均月生活费”,得到如表1-2所示结果: 表1-2 Report 平均月生活费 家庭所在地Mean N Std. Deviation 大型城市614.5386300.085 乡镇地区529.4168219.095 中小城市618.64118202.526 Total595.04272243.444 选择——,在出现的对话框中选择“function”选择估计量,得到如图1-2所示结果: 图1-1 图1-2

分层抽样(计算详解)

实验题目: 1、某居委会辖有三个居民新村,居委会欲对居民购买彩票的情况进行调查。 调查者考虑以新村分层,在每个新村中随机抽取了10个居民户并进行 了调查每户最近一个月购买彩票花费的金额(元),下表为每个新村及 调查的情况: 请估计该小区居民户购买彩票的平均支出,并给出估计的标准差。给出95%的置信区间,并与简单随机抽样进行精度比较。 2、随着经济发展,某市居民正在悄悄改变过年的习惯,虽然大多数居民除 夕夜在家吃年夜饭、看电视节目,但是有些家庭到饭店吃年夜饭,或逛 夜市,或用过年的假期到外地旅游。为研究这种现象,某研究机构以市 中心165万居民户作为研究对象,将居民户按6个行政区分层,每个行 政区随机抽取了30户居民户进行了调查(各层抽样比可以忽略),每个 行政区的情况以及在家吃年夜饭、看电视节目的居民户比例如下表: 试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。

9.03027301 1 ===a p 933.030 283022===a p 9.030 27 303 3 ===a p 867.03026304 4 ===a p 933.030283055 === a p 967.03029306 6 ===a p 867.0*09.09.0*14.0933.0*21.09.0*18.0+++==∑p w p h H h st 923.0967.0*22.0933.0*16.0≈++ 06.0*933.0*301 *1.0*9.0*301*)1(1)(?21.018.02 2 2+=-- =∑p p n f w p h h h h h h st V 067.0*933.0*301*133.0*867.0*301*1.0*9.0*301* 16.009.014.02 22 +++ 838.322.04 2 033.0*967.0*30 1* -=+ P:[ )(?96.1p p st st V ±]=[0.923±1.96*838 .34 -]=[0.866,0.979]

抽样调查的样本容量的确定方法

抽样调查的样本容量的确定方法 摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。 关键词:样本容量;抽样调查;抽样误差;极限误差 抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。 1.确定样本容量的必要性 1.1样本容量大小影响抽样估计的精确度 抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。 1.2样本容量大小影响抽样调查的成本和效益 样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。 因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。 2.影响必要样本容量的主要因素 影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。从理论上说,影响样本容量的因素有以下几个方面: 2.1单位标志变异程度 或成数方差P(1-P)的大小来表示。在其他单位标志变异程度一般用方差2

第7章 抽样调查及答案

第七章 抽样调查 一、本章重点 1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。 2.抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。 3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。正态分布的密度函数有两个重要的参数(σ;x )。它有对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。推出了样本分布的标准差为: 1--=N n N n x σμ。 4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。 抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。 在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即 N n n x -=1σμ。在通常情况下总体的方差是未知的,一 般要用样本的方差来代替。 把抽样调查中允许的误差范围称作抽样的极限误差x ?或p ?。μt =?,用抽 样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的臵信度。抽样的极限误差越大,抽样估计的臵信度也越大。抽样估计又可区分为点估计和区间估计。按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。 二、难点释疑 1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M 表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多少个单位作样本,是样本容量(n )的另一种表现形式。 2.大数定律、正态分布理论、中心极限定理都是假定从N 中抽取一个样本容量为n 的子样,把所有的样本都抽到(有M 种抽法)之后进行验证的,在实际工作中不可能办到。只能用样本的相应指标去推测总体的相应指标。这些理论只是为了验证抽样推断的科学性。

抽样调查心得

抽样技术学习心得 姓名:赵胜男 学号:6 学院:理学院 班级:信息102班 教师:刘红梅

大三下学期我们学习了抽样调查这门课程,抽样调查是统计学专业的专业基础课,虽然我们不是统计学专业的学生,我认为了解与掌握有关抽样调查的知识和技能也是非常重要的。学了这门课程,我受益匪浅,我了解了抽样调查相关的概念与发展历史,同时抽样调查存在实际意义,在政府部门、各社会团体、企业单位等地方得到了非常广泛的应用,是了解情况和收集信息的最主要的方式。下面我浅谈下对于抽样调查这门课程的感悟,以及学习到的知识: 一.抽样调查概念 抽样调查是根据随机的原则从总体中抽取部分实际数据进行调查,并运用概率估计方法,根据样本数据推算总体相应的数量指标的一种统计分析方法。 二.抽样调查特点 抽样调查从研究对象的总体中抽取一部分个体作为样本进行调查,据此推断有关总体的数字特征。有较好的经济性,实效性,同时适应面广,准确性高。抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。 与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称登记误差或调查误差),一种是代表性误差(也称抽样误差)。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。 抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。 (3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有科学根据的调查方法。

样本量的确定方法.

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

抽样调查方案设计

武汉商学院天堂雨伞市场需求抽样 调查方案设计 一.抽样调查的目的 抽样调查的目的在于根据样本调查的结果来推断总体的数量特征。从而明确整个市场的需求,确定企业的发展新方向和新目标。在此次的调查中我们旨在解决市场的最新需求。准确系统的把天堂雨伞这个发展成熟的市场进行深入的调查,分析出自身与竞争对手的实力的差距或者优势明确市场需求特征以求更好的满足其需求。找出自己的市场竞争点的所在,做出新的市场分析。力求做到把握市场的最新动向,了解自己与竞争对手的实力对比做到有的放矢。在调查的过程中做到数据有效性,得到的数据要具有明显得针对性。没有对市场的正确认识和分析,就不可能在日益激烈的市场竞争中战胜对手,壮大自己,发展自己。正确及时而客观的市场调查,可帮助天堂雨伞正确评估自身市场态势、市场地位、市场竞争力,帮助天堂雨伞迅速及时地作出经营决策,化解经营中各种矛盾冲突,保持天堂雨伞良好态势和健康的发展。市场调查成为天堂雨伞发展中不可或缺的重要工具。争取根据样本推断总体中时从中发现一些对于调整市场营销策 略及课程结构调整有价值的数据,从而知道自己的优势和劣势,发 现不足,扬长避短,找准未来的发展方向。 二.抽样市场调查的优点和缺点 抽样市场调查又称概率抽样调查或随机抽样调查,是指调查者为

了特定的调研目的,按照随机原则从调查总体中抽取一部分单位作为样本而进行的一种非全面调查。 其主要特点为:首先样本是按随机原则抽取的,其次是用样本数据推断总体的数量特征。再次为抽样误差不可避免,但可以计算和控制。 抽样市场调查的优点:首先是调查方式的科学性,它有充分的数据依据,能够将调查样本的代表性误差控制在允许的范围内,调查费用的经济性调查规模比全面调查小,资料收集,汇总处理工作量小可以节省人力,物力,财力,从而降低市场调查费用,信息获取的时效 性和调研结果的准确性,其样本按随机原则抽取的,从而排除了主观因素的干扰,能够保证样本推断总体的客观性。 三.确定总体范围和总体单位 总体是所要调查研究的现象的全体,它是由具有同质性和差异性的许多个别事物的集合体。样本是按随机原则从总体中抽出来的一部分单位的综合体,样本中包含的单位个数成为样本量 总体范围的确定应该从时间和空间两方面考虑,即被调查者的入学时间和所在的区域分布。本次调研的总体范围是武汉商学院的在校学生,通过时间及空间的界定,对于时间我们界定在在校的大学生主要是大二和大三学生。本次调研总体还应划分系部,我们主要的调查对象是武汉商学院的全体在校学生。总共预计500名被调查者,即有500名总体单位。然后从中抽取50个样本进行调查。 四.确定抽样推断的主要项目

最新样本量的确定知识讲解

样本量的确定 1. 二值分布(估计比例时的样本容量) 这种情况下,表明可能的采样结果只有两种情况,即是与非的问题。比如调查某一批产品的合格率。样本量的确定主要受以下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N ;通过置信水平即可查表确定z 。 通常情况下置信水平选择95%。抽样偏差为±5%,不过也不完全一定,抽样偏差的确定还是要考虑实际情况,比如最小的调查估计值p=5%,此时抽样偏差就应该小于5%。 这时,就可以确定样本量: 22 2(1)(1)z p p n z p p e N -=-+ P 值的确定:用以前类似样本得到的结果来近似,如果完全不知道就设p=0.5,因为此时方差最大,可求得一个比较保守的样本容量。 样本容量和在p=0.5时运用简单随机抽样估计p 值得到的抽样偏差e

如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 (1)z p p n e -= 事实上当总体容量很小时,不会采用抽样调查,而是普查了。 2. 正态分布(估计均值时的样本容量) 在这种情况下,表明采样的结果是具有多样性的,并不局限在0、1上。比如对某一城市老年人的患病年龄进行统计。这个时候,样本量同样受如下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N 。 样本量为: 22 222 z S n z S e N = + S 表明的是总体标准差,这个可以用以前类似样本得到的S 或是实验调查样本的S 来近似。 同样,如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 2 z S n e = 理论基础: 根据数理统计知识,样本均值对总体均值可构造如下统计量: x X u σ-,他满足标准正态分 布,查表即可得到某一显著性水平下这个统计量的值,这里面的x σ表示总体均值估计量的标准误差。 在无放回简单随机抽样情况下,总体均值估计量的标准误差表达式: x σ=

分层抽样技术方案

贵阳市花溪区孟关林场 森林资源二类调查分层抽样技术方案 为保证孟关林场第三次森林资源二类调查的质量,按照《贵阳市花溪区第三次森林资源二类调查技术方案》的要求,依据《贵州省森林资源规划设计调查技术工作细则》(以下简称《细则》),以及贵阳市森林资源“二类调查”技术方案,结合我场实际特制定本方案。 一、调查总体划分和细班调查精度要求 (一)依据《贵阳市花溪区第三次森林资源二类调查技术方案》要求,国有孟关林场辖区范围内的森林资源作副总体,对区划有蓄积的有林地、 疏林地细班,采用分层抽样调查方法控制副总体蓄积精度,在95%可 靠性条件下,精度达90%以上。 (二)细班调查采用卫星遥感影像图进行现地勾绘,采用角规辅助样地结合目测调查进行蓄积调查,细班调查精度达B级,即平均胸径误差不大 于10%,平均高度误差不大于10%,细班面积误差不大于5%,每公顷 蓄积误差不大于20%,其它调查因子的调查精度详见《细则》(P71页)。(三)细班调查范围:林场经营管理的所有森林、林木和林地;“一环”、“二环”林带;绿色通道树种、面积、株数;库、河流域森林面积、蓄积 等。 二、调查内容 1、查清林场林业用地面积及使用权属; 2、查清林场森林、林木蓄积和权属; 3、森林分类经营区划和林种区划; 4、对森林生物量进行调查; 5、森林、林木生长量和消耗量及消耗结构; 6、森林更新状况; 7、森林生态环境,森林景观资源; 8、石漠化类型、成因及坡度大于或等于25度坡耕地面积和分布; 三、总体蓄积抽样调查技术方案 根据《贵阳市花溪区第三次森林资源二类调查技术方案》要求,孟关林场进

分层行分层抽样控制蓄积精度,分层抽样精度≥90%。 (一)、分层抽样精度标准 分层抽样精度≥90%。分层对象:有蓄积的有疏林地细班。 (二)、分层因子 本次调查以细班调查的平均每公顷蓄积量大小来分层。分层的依据是:细班调查的平均每公顷蓄积最大、最小区间;细班调查蓄积稳定情况;细班调查蓄积变动情况;总体林相情况等因素综合考虑,划分3层。 孟关林场细班调查的平均每公顷蓄积最小值为9.2m 3/hm 2、最大值为301.6 m 3/hm 2;根据总体林相情况等因素综合考虑,将孟关林场分层抽样层数划分为3层,其中每公顷蓄积小于等于100 m 3为第一层,每公顷蓄积在100.1 m 3—200.0 m 3为第二层,每公顷蓄积大于200 m 3为第三层。 (三)、分层抽样样地数及各层样地数的确定 1.分层抽样样地数的确定 B X W E S W t n h h h h ?= ∑∑2 2 2 2) .(. 式中:n —分层抽样样本单元数 t —可靠性指标,取1.96 W h —第h 层权重 S h —第h 层预估标准差 c —变动系数(近似计算): B x c ??-= 6 )((单位面积蓄积)最小 最大单位面积蓄积 E —允许误差 h X —第h 层平均公顷蓄积 B —安全系数,取1.2。 根据以上公式和孟关林场小班数据表,通过计算得: 第Ⅰ层: 21110.4777,61.88,30.81 h h w X hm S === 第Ⅱ层:

抽样调查基础

第九章抽样调查基础 一、本章重点 1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快捷的调查方式。 2.抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能数目与样本容量有关也与抽样的方法有关。抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。正态分布的密度函数有两个重要的参数(σ;x )。它有对称性、非负性等特点。中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。推出了样本分布的标准差为:1--=N n N n x σμ。 4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。 抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。 在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σ μ=,不

重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N n n x -=1σμ。在通常情况下总体的方差是未知的,一般要用样本的方差来代替。 把抽样调查中允许的误差范围称作抽样的极限误差x ?或p ?。μt =?,用抽样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的置信度。抽样的极限误差越大,抽样估计的置信度也越大。抽样估计又可区分为点估计和区间估计。按估计的指标不同又可分为总体平均数的估计、总体成数的估计和总体方差的估计。 二、难点释疑 1.要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N 中抽取一个样本容量为n 的子样最多有多少种抽法,一般用M 表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多

下列抽样调查中,样本

竭诚为您提供优质文档/双击可除下列抽样调查中,样本 篇一:6-2第六章抽样(习题解答) 第六章抽样 一、辨析题 1、一般来说,任意抽样技术适用于正式的实际调查。 错误。适用于非正式的探测性调查,或调查前的准备工作。 2、一般说来,总体中各单位之间标志值的变异程度越大,需要抽样的样本数目越多;反之,需要抽样的样本数目越少。 正确 3、分层最佳抽样法指的是等比例分层抽样。 错误。这是非比例分层抽样。 4、一般而言,抽样的样本占总体的比例同抽样误差成反向关系,即抽样比例越大,抽样误差相对越小。 正确 5、抽样误差是随机抽样调查中必然发生的代表性误差,所以平均误差是不可避免的。而且,这种误差一般包括了技

术性误差,即调查工作中的误差。 错误。这种误差一般不包括技术性误差即调查工作中的误差。 6、总体单位之间标志变异程度越大,抽样误差越大;反之则越小。 正确 7、样本单位数目越多,抽样误差越大,反之则越小。 错误。样本单位数目越多,抽样误差越小,反之则大。 8、一般来说,简单随机抽样比分层、分群抽样误差大,不重复抽样比重复抽样误差大。 错误。重复抽样比不重复抽样误差大。 9、点值估计是考虑了抽样误差,直接以样本指标作为总体指标的估计值,作近似的估计。 错误,不考虑抽样误差。 二、名词解释 1、抽样调查 抽样调查也称为抽查,是指从调查总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。 2、抽样 抽样是指在抽样调查时采用一定的方法,抽选具有代表性的样本,以及各种抽样操作技巧和工作程序等的总称。

3、随机抽样 随机抽样又称为概率抽样或机率抽样,是对总体中每一个体都给予平等的抽取机会的抽样技术。在随机抽样的条件下,每个个体抽中或抽不中完全凭机遇,排除了人的主观因素的选择。 4、分层随机抽样 分层随机抽样又称为分类随机抽样,是把调查总体按其属性不同分为若干层次(或类型)然后在各层(或类型)中随机抽取样本的技术。 5、分群随机抽样 分群随机抽样(clustersampling),又称整群抽样,是把调查总体区分为若干个群体,然后用单纯随机抽样法,从中抽取某些群体进行全面调查的技术。 6、系统抽样 系统抽样(systematicrandomsampling),又称等距离随机抽样或机械随机抽样。它是在总体中先按一定标志顺序排列,并根据总体单位数和样本单位数计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位的技术。 7、非随机抽样 非随机抽样(non-probabilitysampling),亦称为非概率抽样或非可能率抽样等,是对总体中每一个个体不具有被

相关文档
最新文档