第四章、抽样
合集下载
社会调查方法
具体做法
先从总体中随机抽取若干大群(组) 再从这几个大群(组)内抽取几个小群(组) 一层层抽下去,直至抽到最基本的抽样元素。
五、多段抽样
如何确定每一级抽样的单位数目:
各个抽样阶段中的子总体同质性程度 各层子总体的人数 研究者所拥有的人力和经费
例子
调查某市青年工人的状况 以企业为单位抽样 以全市企业为抽样框,随机抽取一部分企业 在抽中企业,以车间为抽样单位,随机抽取若干车间 在抽中车间,随机抽取青年工人。
分层抽样适用于总体由差异明显的几部分组成的情况,每 一部分称为层,在每一层中实行简单随机抽样。这种方法较充 分地利用了总体己有信息,是一种实用、操作性强的方法。 分层抽样的一个重要问题是一个总体如何分层。分层抽样中 分多少层,要视具体情况而定。总的原则是:层内样本的差异要 小,而层与层之间的差异尽可能地大,否则将失去分层的意义。
一、抽样的概念与类型
抽样的类型
概率抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 抽样方法 多段抽样 偶遇抽样
判断抽样
非概率抽样 定额抽样 雪球抽样
二、概率抽样的原理与程序
概率抽样的原理
在社会各种总体都普遍存在异质性的现实面前,严 格的概率抽样程序与方法就必不可少。 概率样本所要放映的正是总体本身所具有的那种内 在的异质性。
四、整群抽样
整群抽样与分层抽样的使用条件
分层抽样:不同子群之间差别很大,每个子群内部 差异不大。 整群抽样:不同子群之间差异不大,每个子群内部 异质性程度比较大。
五、多段抽样
适用条件
适用于范围大、总体多的社会调查。
含义
又称多级或分段抽样,是按抽样元素的隶属关系或层次 关系,把抽样过程分为几个阶段进行。
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章 抽样
第四章 抽 样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
(04)第4章+抽样与抽样分布
4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
[高等教育]现代社会调查 第四章 抽样
27
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四节抽样调查
一、抽样的基本术语 总体(population)总体通常与构成它的元素(element)
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
共同定义:总体是构成它的所有元素的集合,而元 素则是构成总体的最基本单位。 样本(Sample)样本就是从总体中按一定方式抽取出 的一部分元素的集合。 抽样(Sampling) 指从组成某个总体的所有元素的集 合中,按一定的方式选择或抽取一部分元素的过程, 或者说抽样是从总体中按一定方式选择或抽取样本 的过程。
第二节 概率抽样的原理与程序
统计值(Statistic)也称为样本值,它是关于样本中某
一变量的综合描述。统计值是从样本中计算出来的, 它是相应的参数值的估计量。 置信度(Confidence level)与置信区间 (Confidence Interval)。置信度也称为置信水平,它是指总体参 数值,落在样本统计值某一区间内的概率,或者说 是总体参数值落在样本统计值某一区间中的把握性 程度。它反映的是抽样的可靠性程度。例子:P64。 置信区间指的是样本统计值与总体参数值之间的误 差范围,置信区间反映的是抽样的精确性程度。
第二节 概率抽样的原理与程序
确定抽样框:确立总体后,收集总体中全部
抽样单位的名单。有两种确立方法:一是全 选法,一个不能漏。如大学生社会实习调查。 选定总体为全日制大学在校本科生与研究生, 就要从各院系花名册中统一编号。 另一种是分层次的样本框:如调查一个城市 小学生的学习状况。全市500小学,选10所, 再从10所中每个学校选3个班;最后每个班选 10名学生。
第一节 抽样的意义与作用
(3)所抽选的调查样本数量,是根据调查误差的要求,
经过科学的计算确定的,在调查样本的数量上有可 靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样 本数量和总体中各单位之间的差异程度进行计算, 并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方 法中用来推算和代表总体的最完善、最有科学根据 的调查方法。
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
抽样的类型
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
第4章_抽样检验
计数抽样检验的基本原理
一、批质量的判断 在批质量检验时,首先要确定一个合格的批质量水平pt, 如果p≤pt,则认为这批产品可接受;如果p>pt,则认为 这批产品不可接收。 实际上通过抽样检验不可能精确得到批不合格率p,除非 进行全数检验。所以在保证样本量n对批量N有代表性的前 提下,可以用样本中包含的不合格品数d 来推断整批质量, 并与标准要求进行比较来判断批的接收与否。
2)线性抽检方案的OC曲线 抽样方案(1,0)的OC曲线为一条直线,线性OC曲线的 鉴别能力很差,当批的不合格品率p达到50%时,接收概率 仍有50%。
(3)实际的OC曲线 一个好的OC曲线应当是:当这批产品质量较好,如p≤p0时, 能以高概率判为接收;当批质量差到某个规定的界限p≥p1 时,能以高概率判为不接收;当产品质量变坏时,如p0<p <p1时,接收概率应迅速减小。
(5)批不合格品率p:批中不合格的单位产品所占的比 例。
D p 100 % N
D——批产品中不合格品的个数; N——批产品的总数 (6)批平均不合格品率
D1 D2 Dk p 100 % N1 N 2 N k
实行抽样检验时,D是未知的,一般是用抽样检验结果的历 史资料进行估计。
缺陷数计数抽检方式
例如从N=1000的群体中,随机抽取n=80的样本, 计算样本的缺陷数,样本中如发现 30个或30个以下缺陷数时,则判断群体为合格 31个以上缺陷数时,则判断群体为不合格 这种抽检方式可表示为 (N=1000,n=80,c=30)
(2)按实施方式分类
1)标准型 该方案是在抽样方案中对供、购双方都规定质量保护和质 量保证值,具有可满足供、购双方要求特点的抽样检验。 适合于对产品质量不了解的场合,如:从新的单位购入的 货品、或偶尔在市场上购买货品的验收。 2)调整型 该类方案由一组方案(正常方案、加严方案和放宽方案) 和一套转移规则组成,根据过去的检验资料及时调整方案 的宽严,以控制质量波动,并刺激生产方主动、积极地不断 改进质量。
06 第四章 抽样
下选取,也可以依纵列的方向往上选取,由左到右或者由右到左, 也可以依对角线的方式选取。什么方式并不重要,关键是从头到 尾贯彻使用这种方法。这里我们为了方便选择从纵列方向,当一 列到了末端时,可以从下一列最顶端选起,当一页选完以后,可 以从下一页的第一纵列继续选取。
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
统计学第四章抽样与参数估计
疗效评价
通过参数估计和假设检验等方法,评价药物 的疗效和安全性。
案例三:工业生产过程质量控制
抽样检验计划制定
根据产品特性和质量要求,制定合适的抽样 检验计划。
不合格品控制
对不合格品进行统计分析和处理,找出原因 并采取措施加以改进。
过程能力分析
收集生产过程中的质量数据,进行过程能力 分析和参数估计。
抽样作用
通过样本信息推断总体特征,为决策提供依据。
抽样方法分类
随机抽样
按照随机原则从总体中抽取样本,每个个体 被抽中的概率相等。
系统抽样
按照某种规则从总体中抽取样本,如每隔一 定距离或时间抽取一个样本。
分层抽样
将总体分成若干层,然后从各层中随机抽取 样本。
整群抽样
将总体分成若干群,然后随机抽取若干群作 为样本。
05
案例分析:实际场景下抽样 与参数估计问题探讨
案例一:市场调查中消费者满意度测评
01
抽样方法选择
根据市场调查的目的和预算,选 择合适的抽样方法,如简单随机 抽样、分层抽样或整群抽样。
03
数据收集与处理
设计调查问卷,收集消费者满意 度数据,并进行数据清洗和整理
。
02
样本量确定
综合考虑调查的精度要求、总体 规模、抽样误差等因素,合理确
运用统计学方法进行假设检验和参数估计,验证研究假 设的可靠性。
THANKS
定样本量。
04
参数估计
运用统计学方法,对消费者满意 度进行参数估计,如计算满意度
均值、标准差等。
案例二:医学研究中药物疗效评价
试验设计
采用随机对照试验等方法,确保试验组和对 照组的可比性。
样本量计算
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第4章-抽样设计
9
第一节 抽样设计的基本概念
市场调研
二、抽样调查的相关概念
1、全及总体——人们想要认识的对象的全体,它是构成 它的所有个体的集合,也称为总体。(常用 N 表示)
2、抽样总体——由总体中抽取的部分个体构成,具有对
总体的代表性,也称为样本。(常用 n 表示) 3、抽样单元——组成样本的互不重叠的基本单位,也称
49
40
9
2
调查研究总体:美国全体选民
调查访问样本:2000名选民
13
第一节 抽样设计的基本概念
市场调研
抽样调查的特点
(1)调查方式的科学性
(2)调查费用的经济性
(3)获取资料的及时性
(4)调查结果的准确性和全面性
(5)应用范围的广泛性
任何样本都无法完全代表总体,永远存在抽样误差。
14
第二节 抽样调查方法
23
第二节 抽样调查方法
市场调研
N=90,n=10, 则:K=90/10 =9;设k=6
1 11 21 31 41 51 61 71
2 12 22 32 42 52 62 72
3 13 23 33 43 53 63 73
4 14 24 34 44 54 64 74
5 15 25 35 45 55 65 75
7
第一节 抽样设计的基本概念
市场调研
3、重点调查
在调查总体中,针对一部分处于十分重要地位 的单位进行的非全面市场调查,以尽快估计调查总 体的基本情况。 重点调查的特点
(1)便于尽快了解调查对象的基本情况;
(2)在人、财、物和时间上比较节省;
8
第一节 抽样设计的基本概念
市场调研
4、抽样调查
第四章 抽样技术
第四章 抽样技术
STAT
§4.1 抽样调查的一般理论 §4.2 随机抽样技术 §4.3 非随机抽样技术
§4.1 抽样调查的一般理论
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
STAT
一、基本概念
STAT
1.全及总体 1.全及总体 简称总体或母体, 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 象的全体, 位组成。用字母N表示。 位组成。用字母N表示。 2.样本总体 2.样本总体 简称样本, 简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。 成的小总体。用字母n表示。
STAT
完全代表总体而导致的误差。 完全代表总体而导致的误差。
原 因
记 差 登 误 误差 统 误 系 性 差 表 误 代 性 差 机 差 随 误
三种误差的区别: 三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登 登记误差:由于人的主观失误在观察、 主观失误在观察
抽样调查的一般步骤
STAT
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
二、基本准则
STAT
1.随机原则 1.随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能. 有被抽取的可能 2.抽样误差最小 2.抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案. 最小的方案 在误差达到一定要求的条 3.费用最少 3.费用最少 件下,选择费用最少的方案 件下, —在其他条件相同的情况下,选费用最少的 在其他条件相同的情况下, 在其他条件相同的情况下 方案. 方案
STAT
§4.1 抽样调查的一般理论 §4.2 随机抽样技术 §4.3 非随机抽样技术
§4.1 抽样调查的一般理论
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
STAT
一、基本概念
STAT
1.全及总体 1.全及总体 简称总体或母体, 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 象的全体, 位组成。用字母N表示。 位组成。用字母N表示。 2.样本总体 2.样本总体 简称样本, 简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。 成的小总体。用字母n表示。
STAT
完全代表总体而导致的误差。 完全代表总体而导致的误差。
原 因
记 差 登 误 误差 统 误 系 性 差 表 误 代 性 差 机 差 随 误
三种误差的区别: 三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登 登记误差:由于人的主观失误在观察、 主观失误在观察
抽样调查的一般步骤
STAT
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
二、基本准则
STAT
1.随机原则 1.随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能. 有被抽取的可能 2.抽样误差最小 2.抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案. 最小的方案 在误差达到一定要求的条 3.费用最少 3.费用最少 件下,选择费用最少的方案 件下, —在其他条件相同的情况下,选费用最少的 在其他条件相同的情况下, 在其他条件相同的情况下 方案. 方案
现代社会调查方法之抽样
方便获取的样本:易得,但缺乏代表性; 例如:如何获取由100个学生构成的样本
访问者的偏好影响样本的代表性; 例如:有意回避具有某些特(“酷”、“冷”)
的受访者
抽样的地点影响样本的代表性 例如:图书馆门口访问
二、概率抽样的原理与程序
(一)概率抽样的基本原理 2.同质性和异质性
买100支单价为1元的铅笔,在结账的时候是用乘 法还是加法? 买10支单价为1元的铅笔、20支单价为2元的签字 笔和30支单价为5元的钢笔,结账时该如何计算? 10*1+20+2+30*5 100铅笔具有同质性,60支笔具有异质性(价格不同)
概率 抽样
非概 率抽样
依据研究者的主观意 愿、判断或是否方便 等因素来抽取对象, 往往产生较大误差, 难以保证样本的代表 性。
抽样方法
概率抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样
非概率抽样
偶遇抽样 判断抽样 定额抽样 雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1.无意识抽样导致的偏差
一、抽样的意义与作用
(二)抽样的作用 • 抽样是社会研究的主要内容之一,也是社会调查
的一个重要步骤。 • 它与研究目的及研究内容紧密相关。 • 它直接关系到资料的收集、整理与分析。 • 它还涉及到整个研究的费用以及应用的范围。 • 抽样是否科学,直接关系到研究的成败
一、抽样的意义与作用
(三)抽样的相关概念
章 第四章 抽样 抽样
目的要求
掌握概率抽样的原理、程序与方法; 掌握抽样误差的概念与测量方法; 熟悉非概率抽样方法与样本规模; 了解抽样的意义;
目录
1 抽样的意义与作用 2 概率抽样的原理与程序 3 概率抽样方法 4 非概率抽样方法 5 样本规模与抽样误差
访问者的偏好影响样本的代表性; 例如:有意回避具有某些特(“酷”、“冷”)
的受访者
抽样的地点影响样本的代表性 例如:图书馆门口访问
二、概率抽样的原理与程序
(一)概率抽样的基本原理 2.同质性和异质性
买100支单价为1元的铅笔,在结账的时候是用乘 法还是加法? 买10支单价为1元的铅笔、20支单价为2元的签字 笔和30支单价为5元的钢笔,结账时该如何计算? 10*1+20+2+30*5 100铅笔具有同质性,60支笔具有异质性(价格不同)
概率 抽样
非概 率抽样
依据研究者的主观意 愿、判断或是否方便 等因素来抽取对象, 往往产生较大误差, 难以保证样本的代表 性。
抽样方法
概率抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样
非概率抽样
偶遇抽样 判断抽样 定额抽样 雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1.无意识抽样导致的偏差
一、抽样的意义与作用
(二)抽样的作用 • 抽样是社会研究的主要内容之一,也是社会调查
的一个重要步骤。 • 它与研究目的及研究内容紧密相关。 • 它直接关系到资料的收集、整理与分析。 • 它还涉及到整个研究的费用以及应用的范围。 • 抽样是否科学,直接关系到研究的成败
一、抽样的意义与作用
(三)抽样的相关概念
章 第四章 抽样 抽样
目的要求
掌握概率抽样的原理、程序与方法; 掌握抽样误差的概念与测量方法; 熟悉非概率抽样方法与样本规模; 了解抽样的意义;
目录
1 抽样的意义与作用 2 概率抽样的原理与程序 3 概率抽样方法 4 非概率抽样方法 5 样本规模与抽样误差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、概率抽样的方法
1.简单随机抽样
概念:一般地,设一个总体的个体数为N,如果通过逐 个不放回地抽取的方法从中抽取n (n≤N) 个样本,且每 次抽取时各个个体被抽到的概率相等,就称这样的抽样 为简单随机抽样。 要点:它要求被抽取样本的总体的个体数有限 它是从总体中逐个进行抽取 它是一种不放回抽样 它是一种等概率抽样
1. 样本均值的数学期望
E( x )
2. 样本均值的方差(方差的概率意义在于刻画了随 机变量取值的分散程度。方差越小,随随机变量 的取值越集中在期望值附件。) 重复抽样
2 x
2
n
抽样的一般程序
界定总体:对从中抽取样本的总体范围与界限作明确的 界定 制定抽样框:依据已经明确界定的总体范围,收集总体 中全部抽样单位的名单,并通过对名单进行统一编号来 建立起供抽样使用的抽样框 决定抽样方案:选择抽样方法,确定样本规模 实际抽取样本:1.先抽好样本,再调查 2.一边抽样一 边调查 评估样本质量:对样本的质量、代表性、偏差等进行初步 的检验和衡量
总体分布(population distribution)
总体分布:
总体中各元素的观察值所形成的相对频数(频率)分布 分布通常是未知的(因为几乎得不到总体所有观察值) 可以(根据理论分析)假定它服从某种分布
总体
(sample distribution)
样本分布也称经验分布,指一个样本中各观察 值的形成的相对频数(频率)分布。当样本容 量n逐渐增大时,样本分布逐渐接近总体的分 布。
布的总体
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
x
中心极限定理(central limit theorem)
x 的分布 趋于正态 分布的过 程
抽样分布与总体分布的关系
总体分布
正态分布
非正态分布
大样本 小样本
正态分布
正态分布
非正态分布
样本均值的抽样分布
二、概率抽样的原理与程序
概率抽样: (1)每一个体有同等机会被抽取 (2)每一个体的抽取都是相互独立的
二、概率抽样的原理与程序
概率抽样的逻辑
(1)同质性和异质性
如果研究总体是完全同质的,抽样就没有必要; 社会科学中的研究总体往往具有较强的异质性; 为了实现“通过部分认识整体”,样本应该包含 总体的各种差异特征。
样本均值的抽样分布
在重复选取容量为n的样本时,由样本 均值的所有可能取值形成的相对频数分 布
总体分布、样本均值的抽样分布(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体分布、总体的均值、方差及分布如下
总体分布
三、概率抽样的方法
练习
1.高二(21)班有53名同学,现要从中抽取8名去参加一个
座谈会,请写出用抽签法抽选的过程。 2.假设一个总体有5个元素,分别记为a、b、c、d、e, 采用抽签法抽取一个容量为2的样本,样本共有多少个? 为了考察某公司生产的250克袋装牛奶的质量是否达标, 现从800袋牛奶中抽取60件产品进行检查.
复杂的社会现象
抽样
有限的研究资源
抽样主要涉及和处理有关总体与部分之间的关 系问题。抽样作为人们从部分认识整体这一过 程的关键环节,其基本作用是向人们提供一种 实现“由部分认识总体”这一目标的途径和手 段。
一、抽样的意义与作用
1.抽样的作用
抽样是社会研究的主要内容之一,也是社会调 查的一个重要步骤。 它与研究目的及研究内容紧密相关。 它直接关系到资料的收集、整理与分析。 它还涉及到整个研究的费用以及应用的范围。 抽样是否科学,直接关系到研究的成败
概率抽样的方法
抽样的类型
概率抽样
简单随机抽 系统多层抽样 分层抽样 整群抽样 多段抽样 偶遇抽样 判断抽样 定额抽样 雪球抽样
抽样类型
非概率抽样
三、概率抽样的方法
1.简单随机抽样:
概率抽样的最基本形式 方法: 1.总体较少:搅拌抽签; 2.总体较多:用随机数表 3.利用EXCEL的randbetween(a,b)函数实 现简单随机抽样
第四章 抽样
抽取样本
总体
推断总体
样本
第四章 抽样
1.抽样的意义与作用 2.概率抽样的原理与程序 3.概率抽样方法 4.非概率抽样方法 5.样本规模与抽样误差
一、抽样的意义与作用
1.抽样的意义与作用
人们在研究某个自然现象或社会现象时, 往往会遇到不方便、不可能或不必要对所有的 对象作调查的情况,于是从中抽取一部分对象 作调查,这就是抽样
从美国总统大选预测看抽样的效率:
年代 2000 1996 1992 1988 1984 1980 1976 1972 1968 1964 1960 1956 1952 1948 1944 1940 1936 候选人 布什 克林顿 克林顿 老布什 里根 里根 卡特 尼克松 尼克松 约翰逊 肯尼迪 艾森豪威尔 艾森豪威尔 杜鲁门 罗斯福 罗斯福 罗斯福 盖洛普民意测验结果(%) 48.0 52.0 49.0 56.0 59.0 47.0 48.0 62.0 43.0 64.0 51.0 59.5 51.0 44.5 51.5 52.0 55.7 总统选举真实结果(%) 47.9 49.2 43.3 53.9 59.2 50.8 50.1 61.8 43.5 61.3 50.1 57.8 55.4 49.5 53.8 55.0 62.5 盖洛普误差(%) +0.1 +2.8 +5.7 +2.1 -0.2 -3.8 -2.1 +0.2 -0.5 +2.7 +0.9 +1.7 -4.4 -5.0 -2.3 -3.0 -6.8
概率抽样的逻辑
如果总体中的每一个体都具有同等机会被选入样本, 那么从这一总体中抽取的样本就能够代表总体。
(3)代表性和选择的概率
概率抽样的优点
(1)样本对总体更具代表性(相对其它类型抽样) (2)可以对样本的精确性和代表性作出估计
二、概率抽样的原理与程序
总体分布、样本分布、抽样分布
当样本容量继续增大,样本平均数的分布会进 一步发生变化。这种变化趋势是:平均数的范 围将逐步缩小(即底部越来越窄);相同的平均数 会相应增多;全部平均数的分布向总体平均数 集中的趋势也会越来越明显.
用从个体数为N的总体中抽取一个容量为n的 n 样本,那么每个个体被抽取的概率等于
N
三、概率抽样的方法
1.简单随机抽样
抽签法(抓阄法)
将总体中的所有个体(共N个)编号(号码可以从 1到N),并把号码写在形状、大小相同的号签上 ( 号签可以用小球、卡片、纸条等制作),然后 将这些号签放在同一个箱子里,进行均匀搅拌。抽 签时,每次从中抽出1 个号签,连续抽取n次,就 得到一个容量为n的样本。对个体编号时,也可以 利用已有的编号。例如学生的学号,座位号等。
一、抽样的意义与作用
2.抽样的概念
在我们的日常生活中经常存在着抽样。如抽血化验,尝 试水温,窥一斑而知全豹。 抽样(sampling) 从组成某个总体的所有元素的集合中, 按一定的方式选择或抽取样本的过程 抽样调查,就是从研究总体中抽取一部分代表加以调查 研究,然后用所得结果推论和说明总体的特性。 总体(population): 构成它的所有元素的集合 样本(sample) 从总体中按一定方式抽取出的一部分元 素的集合 抽样单位(sampling unit) 一次直接的抽样所使用的基本 单位
=10
n=4 x 5 n =16 x 2.5
= 50
X
总体分布
x 50
x
抽样分布
中心极限定理 (central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总体中 抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似 服从均值为μ、方差为σ2/n的正态分布 x 一个任意分
当总体的个数较多时,将总体“搅拌均匀”比较困 难,抽签法产生的样本代表性差的可能性很大。
三、概率抽样的方法
第二个观察值
1 1,1 2,1 3,1 2 1,2 2,2 3,2 3 1,3 2,3 3,3 4 1,4 2,4 3,4
4
4,1
4,2
4,3
4,4
计算出各样本的均值,如下表。并给出样 本均值的抽样分布
16个样本的均值(
第一个 观察值
x
x
n
)
P(x)
第二个观察值 1 2 3 4
0.3
0.2
一、抽样的意义与作用
抽样框(sampling frame) 抽样范围,指一次直接抽 样时总体中所有抽样单位的名单 参数值(parameter) 是对总体中某一变量的综合描 述,或总体中所有元素某些特征的综合数量表现。最常 见的参数值是总体某一变量的平均值。 统计值(statistic)是对样本中某一变量的综合描述, 或样本中所有元素某些特征的综合数量表现。根据样本 计算出来的关于样本变量的数量表现 置信度(confidence level) 总体参数值落在样本统计 值某一区间内的概率,或者说,是总体参数值落在样本 统计值某一区间内的把握性程度 置信区间(confidence intevalue) 上述“某一区 间”,就是置信区间
1
2
1.0
1.5
1.5
2.0
2.0
2.5
2.5
0.1