4第四章 抽样
统计学抽样与抽样分布ppt课件
精选
21
概率抽样(小结)
精选
22
非概率抽样
n也叫非随机抽样,是指从研究目的出发,根据调查者的 经验或判断,从总体中有意识地抽取若干单位构成样本。 n重点调查、典型调查、配额抽样(是按照一定标准或一 定条件分配样本单位数量,然后由调查者在规定的数额内 主观地抽取样本)、方便抽样(指调查者按其方便任意选 取样本。如商场柜台售货员拿着厂家的调查表对顾客的调 查)等就属于非随机抽样。 n优点:及时了解总体大致情况,总结经验教训,在进行 大规模抽样调查之前的试点。 n缺点:非随机抽样容易产生倾向性误差,并且误差不能 计算和控制 ,也就无法说明调查结果的可靠程度。
4. 特别是在标志值相差悬殊时,由于划分了类型,一
方面缩小了组内方差,另一方面也保证各组都能抽 取一定的样本单位,所以,分层抽样较之纯随机抽 样可以提高样本的代表性,能获得更为满意的效果
精选
16
分层抽样
(stratified sampling)续
Ü 优点:
Ü 除了可以对总体进行估计外,还可以对各层的子总 体进行估计
精选
23
概率抽样与非概率抽样
概率抽样
抽样类型
非概率抽样
简单随机抽样 分层随机抽样 整群抽样 系统抽样 多阶段抽样
方便抽样 判断抽样
其他非概率抽样
精选
24
重复抽样与非重复抽样
n重复抽样,又称回置抽样,是指从总体的N个
单位中,每次抽取一个单位后,再将其放回总 体中参加下一次抽选,连续抽n次,即得到一 个样本。
n重复:42=16个。它们是
n
AA AB AC AD; BA BB BC BD
n
教育与心理统计学 第四章 抽样理论与参数估计考研笔记-精品
第四章抽样理论与参数估计第一节抽样理论的基本知识分层抽样,又叫分层随机抽样,这种抽样方法是按照总体已有的某些特征,承认总体中已有的差异,按差异将总体分为几个不同的部分,每一部分称为一个层,在每一个层中实行简单随机抽样。
它充分利用了总体的已知信息,因而是一种非常适用的抽样方法,其样本代表性及推论的精确性一般优于简单随机抽样。
分层的原则是层与层之间的变异越大越好,各层内的变异要小。
试述分层抽样的原则和方法?分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。
分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。
在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。
⑷两阶段随机抽样两阶段随机抽样首先将总体分成M个部分,每一部分叫做一个"集团"(或"群"),第一步从M个集团中随机抽取m个"集团”作为第一阶段样本,第二步是分别从所选取的m个"集团”中抽取个体(g构成第二阶段样本。
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些,但是,两阶段抽样简便易行,节省经草贼,因而它是大规模调查研究中常被使用的抽样方法。
例如,如果我们要了解全国城市初中二年级学生的身高,第一步我们可以从全国几百个城市中随机抽取几十个城市作为第一阶段的样本。
第二步,在第一阶段随机抽取出来的城市中再随机抽取初中二年级的学生。
(二)非旃抽样非概率抽样不是完全按随机原则选取样本,有方便抽样、判断抽样。
方便抽样是由调查人员自由、方便地选择被调查者的非随机选样。
判断抽样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样法。
当采取非概率抽样的方法选取样本时,研究者要说明采用此种方取样的原因以及对研究结果可能造成的影响。
第二节抽样分布[统计量分布、基本随机变量函数的分布]总体:又称母全体、全域,指具有某种特征的一类事物的全体。
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章 抽样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
第四章整群抽样
1 (M 1)c
上面结果意味着:按同样的样本量(以次级单元计) 整群抽样的方差约为简单随机抽样的方差的 1 (M 1)c 倍。换句话说,为了获得同样的精度,整群抽样的样本 量必须是简单随机抽样的样本量的 1 (M 1)c 倍。
20
第21页/共49页
群内相关系数
NM
2
(Yij Y )(Yik Y )
• Def.1 一般地说,如果总体中所有较小的基本单元可 以以某种形式组成数量较少但规模较大的单元;或反 过来说,每个“大”单元都由若干“小”单元组成, 称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元 (secondary sampling unit).
Deff = (所考虑抽样设计估计量的方差)/(相同样 本量下简单随机抽样估计量的方差)
18
第19页/共49页
设计效应值愈大,表明它的效率愈低。若deff>1,表明
所考虑的抽样设计的效率不如简单随机抽样;若deff<1,
表明该抽样设计的效率比简单随机抽样高。
在整群抽样中,我们在前面已经指出:如何划分群以
27
第28页/共49页
(3) 若 令为简单随机抽样的样本量 则
nsrs
即可达到整群抽样96户样本量相同的估计精度
Mn nsrs deff
812 20(户) 4.7
28
第29页/共49页
群规模不相等的整群抽样
一、等概抽样,简单估计 二、等概抽样,加权估计 三、等概抽样,比率估计 四、例子
29
8 230,205,187,176,212,253,189,240 211.50 27.48
9 274,208,195,307,264,258,210,309 253.13 44.52
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第四篇抽样和分布1(药学)PPT课件
24
4、整群抽样 先将总体分成若干互不重叠部分(称为群),再 从各群中随机抽取某群或几群作为样本。 例:调查某年级学生上网情况
可把每班作为一群,从中随机抽取一班或几班作 为样本。
该法适用于大规模调查,易于组织,节省人 力物力,但误差较大,适于群体差异较小的调 查对象。
8
实例 研究某地区12岁儿童生长发育情 况,总体和个体应为什么? 显然,总体为该地区的全体儿童
个体为每一个儿童。
当然,衡量儿童生长发育情况要通过诸如身高、 体重等数量指标进行,所以对总体的研究实际上 是对该地区的全体儿童的这些指标值概率分布进 行研究。
9
根据研究指标的多少,总体分为 一维总体-研究一项描述指标,常用随机变量X表示; 多维总体-研究多项描述指标,常用随机向量表示,
14
一般地,对有限总体,应采用有放回抽样,对 无限总体(或数量较多),可采用无放回抽样 (近似看作有放回),否则违背独立性。
简单随机抽样具体实施的方法: 抽签法
随机数法
15
三、统计量(Statistic )
样本是对总体的代表和反映,抽样的目的是利用样本值对 总体进行统计推断。
而对总体进行统计推断,常根据需要的不同,利用样本构 造一些包含所需要的多种信息的量,就是关于样本 X1 ,X2 ,…,Xn的一些函数,这些函数统称为统计量。
3
例如,在几何学中要证明“等腰三角形底角相等”, 只须从“等腰”这个前提出发,运用几何公理,一步一 步推出这个结论.这是演绎推理。
而一个习惯于统计思想的人,可能这样推理: 做很多大小形状不一的等腰三角形,实地测量 其底角,看差距如何,根据所得资料看看可否作 出“底角相等”的结论. 这样做就是归纳式的方法.
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
四章样本及抽样分布
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
X ~ N (0, 1) / n
iid
2.若X1,,X n ~ N (, 2 ), 则 (1) X与S 2相互独立; (2) 2
(n 1)S 2
2
~
2 (n 1);
(3)T X ~ t(n 1).
第四 章 样本及抽样分布
引言 run 随机样本 抽样分布
4.1 随机样本 一、总体与样本
1. 总体:研究对象旳全体。 一般指研究对象旳某项数量指标。 构成总体旳元素称为个体。
从本质上讲,总体就是所研究旳随机变量或 随机变量旳分布。
2. 样本:来自总体旳部分个体X1, … ,Xn 假如满足: (1)同分布性: Xi, i=1,…,n与总体同分布. (2)独立性: X1,… ,Xn 相互独立; 则称为容量为n 旳简朴随
P{ 1
1
P{ 1 F
F (n2 , n1)}
} 1
F F1 (n1, n2 )
P{ 1
1 }
得证!
F F1 (n1, n2 )
4.3 正态总体旳抽样分布定理
iid
1.若X1 ,,Xn ~ N(, 2 ), 则U
X / n
~
N(0, 1)
证明:
X
1 n
n i 1
Xi
是n 个独立旳正态随 机变量旳线性组合,故 服从正态分布
i 1
称为自由度为n的 2 分布.
2.2—分布旳密度函数f(y)曲线
f
(y)
统计学第四章抽样与参数估计
疗效评价
通过参数估计和假设检验等方法,评价药物 的疗效和安全性。
案例三:工业生产过程质量控制
抽样检验计划制定
根据产品特性和质量要求,制定合适的抽样 检验计划。
不合格品控制
对不合格品进行统计分析和处理,找出原因 并采取措施加以改进。
过程能力分析
收集生产过程中的质量数据,进行过程能力 分析和参数估计。
抽样作用
通过样本信息推断总体特征,为决策提供依据。
抽样方法分类
随机抽样
按照随机原则从总体中抽取样本,每个个体 被抽中的概率相等。
系统抽样
按照某种规则从总体中抽取样本,如每隔一 定距离或时间抽取一个样本。
分层抽样
将总体分成若干层,然后从各层中随机抽取 样本。
整群抽样
将总体分成若干群,然后随机抽取若干群作 为样本。
05
案例分析:实际场景下抽样 与参数估计问题探讨
案例一:市场调查中消费者满意度测评
01
抽样方法选择
根据市场调查的目的和预算,选 择合适的抽样方法,如简单随机 抽样、分层抽样或整群抽样。
03
数据收集与处理
设计调查问卷,收集消费者满意 度数据,并进行数据清洗和整理
。
02
样本量确定
综合考虑调查的精度要求、总体 规模、抽样误差等因素,合理确
运用统计学方法进行假设检验和参数估计,验证研究假 设的可靠性。
THANKS
定样本量。
04
参数估计
运用统计学方法,对消费者满意 度进行参数估计,如计算满意度
均值、标准差等。
案例二:医学研究中药物疗效评价
试验设计
采用随机对照试验等方法,确保试验组和对 照组的可比性。
样本量计算
第四章 抽样方法
非概率抽样的用途是有限的, 因为抽选单元的倾向性不允许对调 查总体进行推断。然而非概率抽样 快速简便,对探索性研究很有用, 特别是在市场调查中应用非常广 泛。。
一、非概率抽样
非概率抽样是用主观的(非随机 的)方法从总体中抽选单元,是一种 快速、简易且节省的从总体中选取 样本单元的方法。
它假定总体是同质的,即总体单元 都相似。比如“街道拦截”访问法。
2.志愿者抽样
被调查者都是志愿者。 例如具有特定病情的人参加某些医疗
实验;打电话参与广播或电视节目的 人;抽选参加焦点座谈或深入访问的 人。
3.判断抽样
由专家有目的地抽选有代表性的样本。 它适用于探索性研究,
如:抽选参加焦点座谈或深入访谈的 人,但不宜用在试调查中。
果。 有时,非概率抽样是唯一可行的选择。
例如,在医学实验中,采用志愿者抽样 可能是取得数据的唯一途径。
非概率抽样常被用于抽选参加焦 点座谈和深入访问的个人。
另一个能较好发挥非概率抽样作 用的例子是预研究。
非概率抽样的优点是:
快速简便; 费用相对较低; 不需要抽样框; 对探索性研究和调查的设计开发很有用。
简单随机样本(图示)
简单随机抽样在实际抽样中应用很 少,常被用作评估其他抽样方法的 效率的标准。
抽样的误差是通过其抽样方差来测 量的,如果一种抽样方法的抽样方 差比另一种抽样方法的抽样方差小, 我们就称这种抽样方法更有效率 (统计效率)。
与其他抽样技术相比,简单随机抽样 有以下优点:
是最简单的抽样技术;
假定一个总体有六个农场,我们 要估计这个农场总体的总支
出。假定我们已知每个农场的规模 (以公顷计的农场大小),为便于说明, 进一步假定我们已知它们的支出。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第4章-抽样设计
9
第一节 抽样设计的基本概念
市场调研
二、抽样调查的相关概念
1、全及总体——人们想要认识的对象的全体,它是构成 它的所有个体的集合,也称为总体。(常用 N 表示)
2、抽样总体——由总体中抽取的部分个体构成,具有对
总体的代表性,也称为样本。(常用 n 表示) 3、抽样单元——组成样本的互不重叠的基本单位,也称
49
40
9
2
调查研究总体:美国全体选民
调查访问样本:2000名选民
13
第一节 抽样设计的基本概念
市场调研
抽样调查的特点
(1)调查方式的科学性
(2)调查费用的经济性
(3)获取资料的及时性
(4)调查结果的准确性和全面性
(5)应用范围的广泛性
任何样本都无法完全代表总体,永远存在抽样误差。
14
第二节 抽样调查方法
23
第二节 抽样调查方法
市场调研
N=90,n=10, 则:K=90/10 =9;设k=6
1 11 21 31 41 51 61 71
2 12 22 32 42 52 62 72
3 13 23 33 43 53 63 73
4 14 24 34 44 54 64 74
5 15 25 35 45 55 65 75
7
第一节 抽样设计的基本概念
市场调研
3、重点调查
在调查总体中,针对一部分处于十分重要地位 的单位进行的非全面市场调查,以尽快估计调查总 体的基本情况。 重点调查的特点
(1)便于尽快了解调查对象的基本情况;
(2)在人、财、物和时间上比较节省;
8
第一节 抽样设计的基本概念
市场调研
4、抽样调查
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2 抽样的一般程序
2.2.1 界定调查总体
2.2.2 制定抽样框
2.2.3 决定抽样方案(准备采用哪种抽样方法) 2.2.4 实际抽取样本 — 先抽好样本再调查 — 边抽样本边调查(规模较大,多段抽样) 2.2.5 评估样本质量
Social Survey Method
§4 抽样调查
抽样的概念和类型 概率抽样的原理与程序 概率抽样方法
某种间隔,然后按这一固定的间隔抽取个体的号码 组成样本的方法。P81
3.2.2 具体步骤:
(1) 将总体的所有个体按顺序编号
(2) 计算抽样间距K
K =பைடு நூலகம்
N(总体规模) n(样本规模)
Social Survey Method
3.2.2 具体步骤:
(3) 在头K个个体中随机确定起点(A)
e.g.如果K=10,就从01-10号中抽签决定一个号码作为
±10元).
可见,误差范围越大,抽样的精确性程度就越低,反之, 臵信区间越小即误差范围越小,抽样的精确性程度就越 高。
Social Survey Method
1.3 抽样的作用
基本作用:是人们从部分认识整体的关键环节。
社 会 调 查 研 究 方 法 (厨师尝菜,顾客看米)
必要性:研究人员难以做到任何研究都进行全面调
普遍调查 典型调查 重点与个案调查
注 意
抽样调查
《社会调查研究方法》
第四章 社会调查的主要类型
§1 普遍调查
§2 典型调查
§3 重点调查与个案调查 §4 抽样调查
Social Survey Method
§4 抽样调查
抽样的概念和类型 概率抽样的原理与程序 概率抽样方法
非概率抽样方法
样本规模和抽样误差
本单位。(其有时与构成总体的元素是相同的)
从全班50人中抽取10人构成小样本,个人(学生)是抽 样单位
1.2.5 抽样框(sampling frame):指一次直接抽样时总
体所有抽样单位的名单。
1.2.6 参数值( Parameter ) /总体值
— 是关于总体中某一变量的综合描述,或者说是总 体中所有元素的某种特征的综合数量表现。 在统计中最常见的参数值是总体某一变量的平均数. 如:某城市所有家庭的平均收入,某市待业青年的平均 年龄 需要注意的是,参数值只有对总体中的每一个元素都 进行调查或测量才能得到.
3.4.2 整群抽样的特点
(1) 优点: ① 简化抽样过程,降低费用
② 更容易取得抽样框
(2)缺点:样本分布面不广,代表性较差,尤其是当子
群间异质性较强时,影响代表性更明显。
Social Survey Method
3.5 多级抽样 (multistage sampling)
3.5.1 含义:按抽样元素的隶属关系或层次关 系,把抽样分为几个阶段进行。 e.g.大学——院系——班级——学生 城市——区——街道——居委会——居民
Social Survey Method
具体抽样方法
简单随机抽样 等距抽样 社 会 调 查 研 究 方 法
直接抽样 抽签或抓阄法 随机数表法
概率抽样
分层抽样
整群抽样
抽样 方法
非概率抽样
多段抽样
偶遇抽样
判断抽样
定额抽样 滚雪球抽样 Social Survey Method
普遍调查
定义: 为了解被研究对象的总体情况,对全体被研
3.1.1 概念
---- 从含有N个元素的总体中直接随机抽取n个元素组 成样本,类似于抽签。
3.1.2 方法
A 总体元素较少时,直接抽样或抽签方法。
B 总体元素较多时,随机数表法
Social Survey Method
3.2 等距抽样/系统/机械抽样
3.2.1 含义:把总体的单位进行编号排序后,再计算出
Social Survey Method
1 抽样的概念和类型
1.1 抽样概念
抽样调查就是从调查对象的总体中选择一部分
调查对象(代表)加以调查研究,然后用所得的调
查结果推论和说明总体特征。
这种由总体中选取一部分代表的过程和方法就
是抽样,所选取的这一部分代表就称为样本。
1.2 抽样相关专有名词
1.2.1 总体(population):调查研究的全部事物,
Method of Social Investigation and Research
社会调查研究方法
淮阴工学院人文与社会科学系 主讲:孟祥斐
第四章 社会调查的主要类型
§1 普遍调查
§2 典型调查
§3 重点调查与个案调查 §4 抽样调查
Social Survey Method
阅读思考: 几种调查类型的联系与区别
起点,假定为05
(4) 从A开始,每隔K个个体抽取一个个体,组成 样本: A,A+K,A+2K…..,A +(n-1)K 05,15,25,….,95
Social Survey Method
001
011
021
031
…
091
002 003
004
012 013
014
022 023
024
032 033
034
究对象无一例外地逐个进行调查的一种调查方式。
特点:
— 调查对象多,范围广 — 工作量大,代价高 — 时间(点)性强 — 资料准确、全面 — 需高度集中统一的组织安排 — 调查内容与项目较简单
Social Survey Method
典型调查
定义:从调查对象中选取若干具有代表性的对象作为 典型,并通过对其进行周密系统的调查来认识总体的
是构成它的所有元素的集合。(N)
人口普查——全国人口
1.2.2 样本(sample):从总体中按一定方式抽取出
来的一部分元素的集合,是总体的一个子集。(n)
1.2 抽样相关专有名词(续)
1.2.3 抽样(sampling):从总体中按一定方式选择或抽
取样本的过程。
1.2.4 抽样单位(sampling unit):抽样过程所使用的基
方法。
特点:
— 定性调查 — 选典型凭借主观判断
— 面对面直接调查
— 调查灵活,成本小
Social Survey Method
重点调查
定义:是指对某种社会现象比较集中的、对全局具有 决定性作用的一个或几个单位所进行的调查。
与典型调查区别在: 选择对象标准:典选择具有代表性的单位,后集中性 调查目的:典调是为认识同类社会事物的本质及发展
臵信度也称为臵信水平, 是指总体参数值落在样本统计 值某一区间内的概率,或者说是总体参数值落在样本统计 值某一区间中的把握性程度.它反映的是抽样的可靠性程 度.
臵信区间指的是样本统计值与总体参数值之间的误 差范围,臵信区间反映的是抽样的精确性程度.
比如:
从某一机关1万名干部中抽取200人为样本,调查其 平均工资,若样本的平均工资为100元,那么总体平均 社 会 调 查 研 究 方 法 工资落在95-105元这一区间的概率可能为96%(误差为 ±5元),落在90-110元这一区间的概率为99%(误差为
非概率抽样方法
样本规模和抽样误差
Social Survey Method
3 概率抽样方法
简单随机抽样
又称随机抽样
等距随机抽样 以概率论原理
概率 抽样
为基础,按随机
分层随机抽样
原则抽取,即
整群随机抽样 保证机会均等 多段随机抽样
Social Survey Method
3.1 简单随机抽样 (simple random sampling)
092 093
094
005
006 007 008 009 010
√
015
016 017 018 019 020
√
025
026 027 028 029 030
√
035
…..
√
095
096 097 098 099
√
Social Survey Method 100
练习题:
某大学有12000名学生,欲了解其生活态度,决
分类
总体
子群
Social Survey Method
样本
3.3.2 分层抽样的特点
优点:
① 适用于总体数量多,单位间差异较大的调查对象, 且抽样误差小。 ② 便于了解总体内不同层次的情况,便于对总体中 的不同层次进行研究或比较。
缺点:
必先对总体各单位的情况有较多理解,否则无法分 类,这往往在实际调查前难以做到。
Social Survey Method
3.4 整群抽样(cluster sampling)
3.4.1 含义:
将总体按某种标准划分为一些子群体,每个子群为一
个抽样单位,用随机方法从中抽若干子群,将抽出的子 群中的所有个体结合起来构成样本。 P82
划分 子群
随机 抽样
Social Survey Method
归率,后是对社会现象总体的数量情况做供给。
Social Survey Method
个案调查
定义: 为解决某个特定问题,对特定对象进行深入 细致的调查。
特点
— 对特定对象的调查具体、深入、细致
— 不是说明它所代表的同类事物,只是了解认识个案 本身。
— 调查时间、安排活动具一定弹性,方法多样
Social Survey Method
查,而抽样误差可以控制到很小,因而抽样调查成为
最常用的研究方法之一。
Social Survey Method