第四章抽样(1)
04-第四章_分层随机抽样
L
下面讨论估计量的期望与方差。 (1)对于一般分层抽样
ˆ )也 对于一般的分层抽样,若 Y h 是 Y h 的无偏估计量,则 Y st (或 Y st
是 Y (或 Y )的无偏估计:
Ù
Ù
E (Y st ) = å Wh E (Y h ) = Y
h =1
Ù
L
Ù
ˆst ) = NE (Y st ) = N Y = Y E (Y
L
2 L Sh S2 - å Wh2 h nh h =1 Nh
=å
简便公式
2 L Wh2 Sh W S2 -å h h nh N h =1 h =1
V ( y st ) = V (å Wh y h )
h =1
L
= å Wh2V ( y h )
h =1 L
L
= å Wh2
h =1
Sh2 (1 - f h ) nh
åN
h =1
L
h
=N。
Wh =
Nh 称为层权,它也是已知的。 N
以 Yhi 表示第 h 层总体的第 i 个单元的指标值,以 yhi 表示第 h 层样本的 第 i 个单元的指标值。
Yh =
1 Nh 1 nh
åY
i =1 nh i =1
Nh
hi
表示第 h 层的总体均值,
yh =
åy
hi
表示第 h 层的样本均值(其中 nh 是第 h 层的样本量) ,
h =1 h =1 h =1 L L Ù L Ù Ù
Ù
3
(2)对于分层随机抽样
Ù
特别对于分层随机抽样,Y h 一般均取为简单估计:层样本均值 y h ,因 此 Y 的简单估计为:
抽样的基本概念1:总体、样本、抽样、抽样单位、抽样框
第四章 抽样
知识点1 抽样的基本概念1
总体、样本、抽样、抽样单位、抽样框
学习导航
抽样的基本概念 总体 样本 抽样 抽样单位 抽样框
抽样的推断
样本 400人
研究结果
抽样的基本概念
抽样(sampling)就是从总体中按照一定方 式抽取样本的过程。
总体用N表示,样本用n表示。
抽样的基本概念
抽样单位(Sampling Unit):一次直接抽样所使用 的基本单位。
调查1000名大学生的价值 观念 元素:每一个大学生 抽样单位:每一个大学生
调查1000名大学生的价值 观念(直接从200个班级中 抽取40个班级) 元素:每一个大学生 抽样单位:班级
抽样的基本概念
总体(Population):构成它的所有元素(Element) 的集合。
调查某市大学生的价值观念 总体:该市所有的在校大学 生
调查某城市居民的家庭生活 质量 总体:该市所有居民家庭
元素:每一个大学生
元素:每一户家庭
样本(Sample):从总体中按一定方式抽取出的一部 分元素的集合。
选民的地址与姓名大都取自于电话簿与汽车俱乐部会 员名单
THE END
谢 谢 观 看!
抽样框(Sampling Frame):又称作抽样范围,一 次直接抽样中总体中所有抽样单位的名单。
抽样框的经典例子
《文学摘要》杂志在1920年、1924年、1928年和1932 年,以邮寄明信片的方式对美国总统大选,进行了民 意测验,并准确预测出这4次选举的结果。当1936年总 统大选来临时,杂志回收了200多万份明信片。测验结 果显示57%的人支持共和党的候选人兰登,民主党候 选人、在任总统罗斯福的支持率为43%。然而,两星 期后的选举结果,罗斯福以62%的得票率当选。杂志 因此声誉扫地,不久就关门大吉了。
第4章__抽样调查
4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章专题学习活动-抽样报告
案例分析【案例呈现】(1)某市电大某年级行政管理专业有学生100人,拟抽取其中25人为样本,调查学生作业完成情况。
(2)某城市有10万个家庭,拟以其中1万个家庭为样本,做家庭生活指数抽样调查。
(3)某市共有中学生6万人,分布在30所中学,拟抽取其中6000人作为中学生体质状况调查对象。
(4)在全国范围抽取1万个家庭进行人口调查。
【问题提出】1上述案例分别采用哪种抽样类型最为简便、适宜?为什么?如何具体实施?答:1、抽样的类型:根据抽取对象的具体方式,人们把抽样分为许多不同的类型。
总的来说,各种抽样都可以归为概率抽样与非概率抽样两大类。
这是两种有着本质区别的抽样类型。
概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性;而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,它不考虑抽样中的等概率原则,因而往往产生较大的误差,难以保证样本的代表性。
概率抽样与非概率抽样又各有包括了许多具体类型。
抽样方法:概率抽样:(1)简单随机抽样;(2)系统抽样;(3)分类抽样;(4)整群抽样;(5)多阶段抽样。
非概率抽样:(1)偶遇抽样;(2)判断抽样;(3)定额抽样;(4)滚雪球抽样。
2、虽然不同的抽样方法具有不同的操作要求,但它们通常都要经历这样以下抽样的程序:(1)界定总体;在抽样前,明确从中抽取样本的总体的范围与界限。
(2)决定抽样方法;依据调查研究的目的、界限的总体范围、要求确定样本的规模和要求量化的精确程度来决定具体采用哪种抽样方法。
(3)设计抽样方案;遵循目的性、可测性、可行性、经济性原则合理进行抽样设计。
(4)制定抽样框;依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并且统一编号。
(5)实际抽样样本;严格按照所选定的抽样方法,从抽样框中抽取一个个的抽样单位,构成样本。
(6)样本评估。
对样本的质量和代表性进行检验,其目的是防止因样本的偏差过大而导致的失误。
第四章抽样技术
Z
2
P
(1
P
)
n0
2
2 p
E mail:lhq.716@
市场调查与预测
第四章 抽样设计
不重复抽样情况下:
Z2 P(1P)N
n0
(N
2
1)2p
Z2
P(1P)
2
E mail:lhq.716@
市场调查与预测
第四章 抽样设计
第四步,确定抽样方式,并根据不同抽样方 式的设计效应(deff)对样本容量进行调整:
E mail:lhq.716@
市场调查与预测
112345678910 212345678910 312345678910 412345678910
1 6119690446 2645747774 5192433729 6539459593 2 1547445266 9527079953 5936783848 8239610118 3 9455728573 6789754387 5462244431 9119042592 4 4248116213 9734408721 1686848767 0307112059 5 2352378317 7320889837 6893591416 2625229663
y1
2
2
4
3
E mail:lhq.716@
市场调查与预测
第四章 抽样设计
如果抽到的是拥有最多书的2个人,则其 样本均值为:
y2
1214 2
13
上述两种抽出的结果与总体均值的误差 都很大
E mail:lhq.716@
市场调查与预测
第四章 抽样设计
如果在新生中抽1人,老生中抽1人共同 组成样本,这时样本最小的可能值为:
[高等教育]现代社会调查 第四章 抽样
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第四章 抽样技术
• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四章 抽样
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽样
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
06 第四章 抽样
现在,我们决定从那里开始。可以闭着眼睛随便戳一个数字。也
(二)方法
A 总体元素较少时,类似于抽签方法。
B 总体元素较多时,随机数表法 小总体时 抓阄,抽签, 较大总体时 随机数字表.使用方法. 简单随机样本是概率抽样的理想类型,他从 随机样本的抽取到对总体进行推断有一套健全的规 则.但是当总体所含个体的数目太多时采用这种方法 不仅费事,工作繁杂,而且费用太高.此外当总体内分 类明显时,这种抽样无法按类别特征自动分配样本数, 若想保证样本的代表性,必须增大样本量,从而使整 个工作的工作量增大.
因此,我们在使用系统抽样方法时,一定要注意抽样
框的编制方法。
注意:
总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况
例如:我们从2000户家庭的社区,抽取50户进行消费状况的调查,
而2000户家庭的名单是按照家庭收入的多少按照由高到低排列的。
抽样间距=2000/50=40
如果两个人选择样本,一个人选择初始号码为3,另一个人选择初 始号码为38,那么肯定前者家庭平均收入远远高于后者。
随机数表中的数码
8432990906 1053873020 9427410041 0139022507 9361404310 1359866042 6321912683 9420582507 2725651176
选用的数码
0906
不选用的原因
后面四位数大于3000
社会调查研究方法——第4章抽样PPT课件
2021/3/25
授课:XXX
10
3、抽样的作用
▪ (1)现实生活中有些研究总体是不可能进行 全面调查的,只可能调查其中的一部分。
▪ (2)节约人力、物力。 ▪ (3)对其他调查方法所得到的资料的可信性
的检验,尤其是对普查资料的修正与补充, 必须进行抽样调查。
2021/3/25
授课:XXX
11
4、抽样的优越性
4
2、抽样的概念
▪ (1)总体(population) ▪ (2)样本(sample) ▪ (3)抽样(sampling) ▪ (4)抽样单位(sampling unit) ▪ (5)抽样框(sampling frame) ▪ (6)参数值(parameter) ▪ (7)统计值(statistic) ▪ (8)抽样误差 ▪ (9)置信水平与置信区间
第四章 抽样
▪ 第一节 抽样的意义与作用 ▪ 第二节 非概率抽样方法 ▪ 第三节 概率抽样的原理与程 ▪ 第四节 概率抽样方法 ▪ 第五节 户内抽样与PPS抽样 ▪ 第六节 样本规模与抽样误差
2021/3/25
授课:XXX
1
教学要求:
▪ 了解抽样的概念、意义 ▪ 掌握概率抽样和非概率抽样的的几种方法 ▪ 教学重点:概率抽样 ▪ 教学难点:概率抽样中的分层抽样
▪ (1)调查费用较低。 ▪ (2)速度快 ▪ (3)应用范围广。 ▪ (4)可获得内容丰富的资料。 ▪ (5)准确度高。
2021/3/25
授课:XXX
12
▪5、抽样的类型
抽样技术
非概率抽样
概率抽样
方便抽样 判断抽样 配额抽样 滚雪球抽样
简单随机抽样 系统抽样 分层抽样 整群抽样 多级抽样 其他抽样技术
第四章 审计抽样-抽样风险
2015年注册会计师资格考试内部资料审计第四章 审计抽样知识点:抽样风险● 定义:抽样风险是由于采用抽样(样本量或抽样方法)而引起的风险。
● 详细描述:审计抽样的基本模型:(一)抽样风险 1.抽样风险:指注册会计师根据样本得出的结论,可能不同于如果对整个总体实施与样本相同的审计程序得出的结论的风险。
2.抽样风险的控制 抽样风险是抽出的样本不能完全代表总体的可能性。
抽样风险与样本量成反向关系,即样本量越大,抽样风险越低。
只要有抽样就存在抽样风险,但可以控制。
扩大样本规模是控制抽样风险的一种有效方法。
3.抽样风险的类型 (1)控制测试 注册会计师在进行控制测试时,注册会计师运用抽样,将面临着抽样风险。
信赖过度风险:根据样本推断的控制有效性高于实际,评估的重大错报风险低于实际水平,从而影响审计效果(质量)。
信赖不足风险:根据样本推断的控制有效性低于实际,评估的重大错报风险高于实际水平,从而影响审计效率。
(2)细节测试 注册会计师在进行细节测试时,注册会计师运用抽样,将面临着抽样风险。
误受风险是指注册会计师推断某一重大错报不存在而实际上存在的风险,从而影响审计效果(质量)。
误拒风险是指注册会计师推断某一重大错报存在而实际上不存在的风险,从而影响审计效率。
注意:第一,只要抽样,抽样风险就存在。
第二,抽样风险与样本规模成反方向变动:样本规模越小,抽样风险越大;样本规模越大,抽样风险越小。
如果对总体中的所有项目都实施检查,就不存在抽样风险,此时审计风险完全由非抽样风险产生。
总结:抽样风险对审计工作的影响例题:1.关于抽样风险和非抽样风险的理解,以下表述中,不正确的是()。
A.抽样风险与样本规模呈反方向变动,注册会计师可以通过扩大样本规模降低抽样风险B.通过采取适当的质量控制政策和程序可以将非抽样风险降至可接受的水平C.抽样风险和非抽样风险均不能量化D.抽样风险和非抽样风险通过影响重大错报风险的评估和检查风险的确定进而影响审计风险正确答案:C解析:选项C不正确。
第四章 抽样调查
p
p1 p
n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为2%。
例: :
一批食品罐头共60000桶,随机抽查300桶,发 现有6桶不合格,求合格品率的抽样平均误差?
解: 已知 N 60000 n 300 n1 6
解:
x xf 12600 126件 f 100
s x x 2 f 4144 6.47件
f 1
99
x
s 2 1 n n N
6.472 1 100 0.614件
100 1000
x
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的 1
n
③可通过调整样本单位数来控制抽样平均误差。
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则:
x
3n
1 0.577 3
二、抽样调查的特点
1、 是专门组织的一次性的非全面调查 2、 抽选样本单位遵循随机原则 3、 用样本指标数值去推断总体指标数值 (与重点调查的区别) 4、 抽样误差可计算并控制在一定范围内 (与典型调查的区别)
三、抽样调查的几个基本概念 (一) 全及总体和抽样总体
全及总体 指研究对象的全体。其单位数 (总体) 用N 表示。
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例: 某厂生产一种新型灯泡共2000只,随机抽出 400只作耐用时间试验,测试结果平均使用寿 命为4800小时,样本标准差为300小时,求抽 样推断的平均误差?
第4章 抽样调查作业答案(1)
第4章抽样调查作业答案一.单项选择题1.抽样调奁的主要目的在于( 3 )。
①计算和控制误差:②了解总体单位情况③用样本来推断总体:④对调查单位作深入的研究2.抽样调查所必须遵循的基本原则是( 4 )。
①随意原则:②可比性原则:③准确性原则:④随机原则。
3.极限误差与抽样平均误差数值之间的关系为( 4 )①前者一定小于后者②前者一定大于后者③前者一定等于后者④前者既可以大于后者,也可以小于后者4.无偏性是指( 1 )。
①抽样指标等于总体指标:②样本平均数的平均数等于总体平均数:③样本平均数等于总体平均数;④样本成数等于总体成数。
5.一致性是指当样本的单位数充分大时,抽样指标( 4 )。
①小于总体指标;②等于总体指标:③大予总体指标:④充分靠近总体指标6.有效性是指作为优良估计量的方差与其他估计量的方差相比有( 1 )。
①前者小于后者;②前者大于后者:③两者相等;④两者不等。
7.能够事先加以计算和控制的误差是( 1 )。
①抽样误差:②登记误差:③代表性误差;④系统性误差。
8.从总体N个不同单位每次抽取n个单位作为样本。
如果采用考虑顺序的重复抽样方法,则样本的可能数目为( 3 )。
③N n9.从总体N个不同单位每次抽取n个单位作为样本,如果采用不考虑顺序的不重复抽样方法,则样本的可能数目为( 4 )。
④()(N+n-1)!/(N-1)!n!1O.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 2 )。
①第一个工厂大;②第二个工厂大:③两工厂一样大;④无法做出结论。
(不重复抽样的:抽样平均平均误差=方差*(1-n/N)1/2/n1/2)11.?抽样平均误差是指抽样平均数(或抽样成数)的()。
①平均数:②平均差③标准差④标准差系数12.在同样情况F,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( 3 )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总统选举真实结果(%) 盖洛普误差(%)
47.9
+0.1
49.2
+2.8
43.3
+5.7
53.9
+2.1
59.2
-0.2
50.8
-3.8
50.1
-2.1
61.8
+0.2
43.5
-0.5
61.3
+2.7
50.1
+0.9
57.8
+1.7
55.4
-4.4
49.5
-5.0
53.8
-2.3
55.0
-3.0
62.5
要点:它要求被抽取样本的总体的个体数有限 ➢ 它是从总体中逐个进行抽取 ➢ 它是一种不放回抽样 ➢ 它是一种等概率抽样
用从个体数为N的总体中抽取一个容量为n的 样本,那么每个个体被抽取的概率等于
第四章抽样(1)
三、概率抽样的方法
1.简单随机抽样
n 抽签法(抓阄法)
将总体中的所有个体(共N个)编号(号码可以从 1到N),并把号码写在形状、大小相同的号签上 ( 号签可以用小球、卡片、纸条等制作),然后 将这些号签放在同一个箱子里,进行均匀搅拌。抽 签时,每次从中抽出1 个号签,连续抽取n次,就 得到一个容量为n的样本。对个体编号时,也可以 利用已有的编号。例如学生的学号,座位号等。
3,4
4
44
第四章抽样(1)
计算出各样本的均值,如下表。并给出样 本均值的抽样分布
16个样本的均值(
)
第一个
第二个观察值
观察值
1
2
3
4
1
1.0 1.5 2.0 2.5
2
1.5 2.0 2.5 3.0
3
2.0 2.5 3.0 3.5
4
2.5 3.0 3.5 4.0
P(x) 0.3
n 它与研究目的及研究内容紧密相关。 n 它直接关系到资料的收集、整理与分析。 n 它还涉及到整个研究的费用以及应用的范围。 n 抽样是否科学,直接关系到研究的成败
第四章抽样(1)
一个著名的案例——抽样中的泰坦尼克事件
侯选人 罗斯福 兰顿
《Literary Digest》预测% 选举结果%
43
62
第-6.四8 章抽样(1)
一、抽样的意义与作用
2.抽样的概念
n 在我们的日常生活中经常存在着抽样。如抽血化验,尝 试水温,窥一斑而知全豹。
n 抽样(sampling) 从组成某个总体的所有元素的集合中, 按一定的方式选择或抽取样本的过程
n 抽样调查,就是从研究总体中抽取一部分代表加以调查 研究,然后用所得结果推论和说明总体的特性。
总体分布
均值和方差
.3
.2
.1
0 1
234
第四章抽样(1)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下 ,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
第四章抽样(1)
二、概率抽样的原理与程序
n 概率抽样的逻辑
(3)代表性和选择的概率
如果总体中的每一个体都具有同等机会被选入样本,那 么从这一总体中抽取的样本就能够代表总体。
概率抽样的优点 (1)样本对总体更具代表性(相对其它类型抽样) (2)可以对样本的精确性和代表性作出估计
第四章抽样(1)
二、概率抽样的原理与程序
n 参数值(parameter) 是对总体中某一变量的综合描 述,或总体中所有元素某些特征的综合数量表现。最常 见的参数值是总体某一变量的平均值。
n 统计值(statistic)是对样本中某一变量的综合描述, 或样本中所有元素某些特征的综合数量表现。根据样本 计算出来的关于样本变量的数量表现
n 置信度(confidence level) 总体参数值落在样本统计 值某一区间内的概率,或者说,是总体参数值落在样本 统计值某一区间内的把握性程度
57
38
n 1936年美国正从经济大恐慌中复苏,全国仍有9百万人失
业.当年的美国总统大选,由民主党员罗斯福与共和党员兰登
进行角逐.《文学文摘》(Literary Digest)杂志对结果进行了
调查预测.他们根据当时的电话号码簿及该杂志订户俱乐部会
员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员
第四章、抽样(1)
2020/11/28
第四章抽样(1)
第四章 抽样
1.抽样的意义与作用 2.概率抽样的原理与程序 3.概率抽样方法 4.非概率抽样方法 5.样本规模与抽样误差
第四章抽样(1)
一、抽样的意义与作用
1.抽样的意义与作用
人们在研究某个自然现象或社会现象时, 往往会遇到不方便、不可能或不必要对所有的 对象作调查的情况,于是从中抽取一部分对象 作调查,这就是抽样
x 的分布 趋于正态 分布的过 程
第四章抽样(1)
抽样分布与总体分布的关系
总体分布
正态分布 正态分布
非正态分布
大样本
小样本
正态分布 非正态分布
第四章抽样(1)
样本均值的抽样分布
1. 样本均值的数学期望 2. 样本均值的方差(方差的概率意义在于刻画了随
机变量取值的分散程度。方差越小,随随机变量 的取值越集中在期望值附件。) 重复抽样
第四章抽样(1)
样本均值的抽样分布与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所 有容量为n的样本的均值x也服从正态分布,x 的数学
期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n= 4
n =16
= 50 X
总体分布
x
抽样分布
第四章抽样(1)
中心极限定理 (central limit theorem)
n 总体分布、样本分布、抽样分布
当样本容量继续增大,样本平均数的分布会进 一步发生变化。这种变化趋势是:平均数的范 围将逐步缩小(即底部越来越窄);相同的平均数 会相应增多;全部平均数的分布向总体平均数 集中的趋势也会越来越明显.
第四章抽样(1)
总体分布(population distribution)
候选人
布什 克林顿 克林顿 老布什 里根 里根 卡特 尼克松 尼克松 约翰逊 肯尼迪 艾森豪威尔 艾森豪威尔 杜鲁门 罗斯福 罗斯福 罗斯福
盖洛普民意测验结果(%)
48.0 52.0 49.0 56.0 59.0 47.0 48.0 62.0 43.0 64.0 51.0 59.5 51.0 44.5 51.5 52.0 55.7
获得了大量的样本,对此进行了精确的计算,根据数据的整理
分析结果,他们断言:在总统选举中,兰登将以370∶161的优
势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,
一个名叫乔治•盖洛普的人,对《文学文摘》调查结果的可信度
提出质疑.他也组织了抽样调查,进行民意测验.他的预测与
《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福
第四章抽样(1)
三、概率抽样的方法
练习
n 1.高二(21)班有53名同学,现要从中抽取8名去参加一个
座谈会,请写出用抽签法抽选的过程。 n 2.假设一个总体有5个元素,分别记为a、b、c、d、e,
采用抽签法抽取一个容量为2的样本,样本共有多少个? n 为了考察某公司生产的250克袋装牛奶的质量是否达标,
边调查 n 评估样本质量:对样本的质量、代表性、偏差等进行初步
的检验和衡量
第四章抽样(1)
概率抽样的方法
抽样的类型
简单随机抽
系统多层抽样
概率抽样 分层抽样
整群抽样
多段抽样
抽样类型
偶遇抽样
判断抽样
非概率抽样 定额抽样
雪球抽样
第四章抽样(1)
三、概率抽样的方法
1.简单随机抽样:
概率抽样的最基本形式 方法:
第四章抽样(1)
样本均值的抽样分布
n 在重复选取容量为n的样本时,由样本 均值的所有可能取值形成的相对频数分 布
第四章抽样(1)
总体分布、样本均值的抽样分布(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体分布、总体的均值、方差及分布如下
1.总体较少:搅拌抽签; 2.总体较多:用随机数表 见P269.表4-2
3.利用EXCEL的randbetween(a,b)函数 实现简单随机抽样
第四章抽样(1)
三、概率抽样的方法
1.简单随机抽样
概念:一般地,设一个总体的个体数为N,如果通过逐 个不放回地抽取的方法从中抽取n (n≤N) 个样本,且每 次抽取时各个个体被抽到的概率相等,就称这样的抽样 为简单随机抽样。
复杂的社会现象 抽样 有限的研究资源
抽样主要涉及和处理有关总体与部分之间的关 系问题。抽样作为人们从部分认识整体这一过 程的关键环节,其基本作用是向人们提供一种 实现“由部分认识总体”这一目标的途径和手 段。
第四章抽样(1)
一、抽样的意义与作用
1.抽样的作用
n 抽样是社会研究的主要内容之一,也是社会调 查的一个重要步骤。
总体分布:
总体中各元素的观察值所形成的相对频数(频率)分布 分布通常是未知的(因为几乎得不到总体所有观察值) 可以(根据理论分析)假定它服从某种分布