简单随机抽样2
第2章简单随机抽样
称简单随机抽样,所得的样本称为不放回的
简单随机样本,简称简单随机样本
精选可编辑ppt
2
简单随机抽样的实施方法:将总体中的单元 依次从1到N进行编号,然后利用抽签法或随 机数法来进行简单随机抽样
抽签法:一般用于总体所含单元不多的情况, 首先做N个签并依次写上1至N的号码,然后 将签充分混合均匀,再一次抽取其中的n个 签或逐个不放回地抽取n个签,则编号为这n 个签上的号码的单元就构成一个简单随机样 本
注3: V(y),V(Yˆ) 中的 S
2 Y
一般是未知的,因此需要通
过样本进行估计
精选可编辑ppt
14
定理2.2.3
在简单随机抽样中,样本方差
s
2 y
是总体方差
S
2 Y
的无偏估计量,样本协方差 s y x
是总体协方差 S Y X 的无偏估计量
推论2.2.1 在简单随机抽样中,
Vˆ(y) ˆ 1 f n
在一定条件下,利用辅助指标的信息可以提 高对主要指标的估计的精度
一般地,辅助指标可以是主要指标的前期资 料,也可以是表示单元规模的量,或者是单 元的某个易测指标,等等
精选可编辑ppt
31
如果主要指标Y与辅助指标X之间有正相关关 系,就可以构造比估计量
在简单随机抽样中,称 YˆR ˆ yR ˆ RˆX 为总体均 值 Y 的比估计量,称 YˆRˆ NyRRˆX为总体总 值 Y 的比估计量,其中 X 或 X 必须已知
sy2
是
V
(
y
) 的无偏估计量
Vˆ(Yˆ)ˆ N21f n
sy2 是 V
( Yˆ )
的无偏估计量
注:把 Vˆ(y), Vˆ(Yˆ) 分别作为 V(y), V(Yˆ) 的估计 量,都称为标准差估计量
抽样调查理论与方法 金勇进(第二版)-第2章-简单随机抽样
X
2
n
N
1
i 1
(Y i R X i )
2
定理 的方差为:
Y 2.7:对于简单随机抽样,n较大时, R N y R
N 1 2 1 f 2 V (Y R ) N (Yi R X i ) n N 1 i 1
推论 2.12:对于简单随机抽样,n较大时, Y y 的方差为:
n N
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为个:
1,2
1,3 1,4 1,5
2,3
2,4 2,5
3,4
3,5
4,5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取2个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
i
Y X
Y X
r
n
yi xi
i 1
y x
i 1
i 1
简单估计量
1 Y y n
n
yi
y1 y 2 y n n
i 1
N Y Ny n
n
yi
i 1
a 1 P p n n
n
yi y Y
i 1
ˆ R
【例2.5】
根据例【2.4】的数据和结果,比较两种思路下对应的 方差估计结果。
2.4 回归估计量及其性质
属于简单估计量,不属于比率估计量。
引理 的期望为:
2.3:对于简单随机抽样,n较大时, R r
抽样调查-第2章简单随机抽样
N2 1
f
S2
n
V (P)
V ( p)
1
f
1 NP(1 P)
n n 1
返回
总体总量的估计量方差是总体均值方差的直接 推导,下面我们来推导总体比例估计量的方差。
1 f 1
V (P)
NP(1 P)
n N 1
只需证明此时S 2 1 NP(1 P)即可。 N 1
返回
设N个样本单元中有N1个具有某一特 性,即有N1个单元取值为1,有N-N1个单元 取值为0.
Yi 2
N( 1 N
N
Yi )2 ]
i 1
返回
1 n( N
f 1)
[
N i 1
Yi 2
2
NY ]
1 f n( N 1)
N
(Yi 2
Y
2
)
i 1
1 f n( N 1)
N
(Yi
i 1
Y )2
S 2 (1 f ) n
即 V (y) 1 f S 2 n
C C2 n2 2 N 2
每个样本被抽中的概率为:
C C2 n2 2 N 2
/
CNn
n(n 1) N (N 1)
返回
引理二 从总体规模为N的总体中抽取一个样 本量为n的简单随机样本。若对总体中的每个单
元 Yi ,引进随机变量 ai 如下:
ai
1,
若Yi入样
0,若Yi不入样(i 1,2,, N )
N i1
(Yi
Y )2
N 2
N 1
返回
总体指标值上面带符号“ ”的表示由样本得
2简单随机抽样的方法
5年至10年 10年以上
人数
300
500
200
试利用上述资料设计一个抽样比为1/10的抽样方法。
23
练习、在1000个有机会中奖的号码(编号为 000~999)中,在公证部门的监督下,按随机抽 取的方法确定最后两位数为88的号码为中奖号码, 这是运用那种抽样方法确定中奖号码的?依次写 出这10个中奖号码。
1%的学生进行调
你认为哪些因素影响学生视 查,你认为应当怎
力?抽样要考虑和因素? 样抽取样本? 13
2.1.3 分层抽样
14
一、分层抽样的定义。 一般地,在抽样时,将总体分成互不交叉
的层,然后按照一定的比例,从各层独立地抽 取一定数量的个体,将各层取出的个体合在一 起作为样本,这种抽样的方法叫分层抽样。
号可能是( B )
A.5,10,15,20,25 B、3,13,23,33,43 C、1, 2, 3, 4, 5 D、2, 4, 6, 16,32
10
例3:从2005个编号中抽取20个号码入样,采
用系统抽样的方法,则抽样的间隔为
( C)
A.99
B、99.5
C.100 D、100.5
例4:某小礼堂有25排座位,每排20个座位,一次 心理学讲座,礼堂中坐满了学生,会后为了了解 有关情况,留下座位号是15的所有25名学生进行
分层抽样抽取容量为45的样本,那么高一、高
二、高三各年级抽取的人数分别为(D )
A.15,5,25
B.15,15,15
C.10,5,30
D15,10,20
例2:一个地区共有5个乡镇,人口3万人, 其中人口比例为3:2:5:2:3,从3万人中抽 取一个300人的样本,分析某种疾病的发病率, 已知这种疾病与不同的地理位置及水土有关, 问应采取什么样的方法?并写出具体过程。
2.1.1-2 简单随机抽和系统抽样样
思考3:一般地,抽签法的操作步骤如何? 第一步:将总体中的所有个体编号,并把号码写在形状、
大小相同的号签上.
第二步:将号签放在一个容器中,并搅拌均匀. 第三步:每次从中抽取一个号签,连续抽取n次,就得 到一个容量为n的样本.
思考4:你认为抽签法有哪些优 点和 缺 点?
优点:简单易行,当总体个数不多的时候搅拌均匀很容易, 个体有均等的机会被抽中,从而能保证样本的代表性. 缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性 差的可能性很大.
思考:假设我们要考察某公司生产的500克袋装牛奶的质 量是否达标,现从800袋牛奶中抽取60袋进行检验,利用 随机数表抽取样本时应如何操作? 第一步:将800袋牛奶编号为000,001,002,…,799.
第二步:在随机数表中任选一个数作为起始数(例如选出
第8行第7列的数7为起始数). 第三步:从选定的数7开始依次向右读(读数的方向也可 以是向左、向上、向下等),将编号范围内的数取出,编 号范围外的数去掉,直到取满60个号码为止,就得到一个
第二章 统计
2.1 随机抽样
2.1.1 简单随机抽样
1936年,美国总统选举前,一份颇有名气的杂志的工作人员做了 一次民意测验,调查共和党的兰顿(当时任堪萨斯州州长)和民主党的
罗斯福(当时的总统)谁将当选下一届总统。为了了解公众意向,调查
者通过电话簿和车辆登记簿的名单给一大批人发了调查表(注意在1936 年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿
可得到一个容量为40的样本.
1.为了解1200名学生对学校某项教改试验的意见,打算从 中抽取一个容量为30的样本,考虑采用系统抽样,则分段
的间隔k为( A )
第2章-简单随机抽样总结
n N
【例2.1】
设总体有5个单元(1、2、3、4、5), 按不放回简单随机抽样的方式抽取2个单 元,则所有可能的样本为10个:
1, 2
1, 3 1, 4 1, 5
2, 3
2, 4 2, 5
3, 4
3, 5
4, 5
【例2.2】
设总体有5个单元(1、2、3、4、5),按放回 简单随机抽样的方式抽取 2 个单元,则所有可 能的样本为25个(考虑样本单元的顺序):
1, 1 1, 2 1, 3 1, 4 1, 5 2, 1 2, 2 2, 3 2, 4 2, 5 3, 1 3, 2 3, 3 3, 4 3, 5 4, 1 4, 2 4, 3 4, 4 4, 5 5, 1 5, 2 5, 3 5, 4 5, 5
简单随机抽样的抽取规则
(1)按随机原则取样; (2)每个抽样单元被抽中的概率都是已知 的或事先确定的; (3)每个抽样单元被抽中的概率都是相等 的。(等概随机抽样)
N
i
X
Y Y X X
i
r
y x
i 1 i 1 n
n
i
y x
i
简单估计量
y y2 1 n Y y yi 1 n i1 n yn
N Y Ny n
y
i 1
n
i
a 1 n P p yi y Y n n i1
ˆ R
y x
i 1 i 1 n
n
总体指标值 上面带符号 “^”的表 示由样本得 到的总体指 标的估计。
i
y x
i
2.2 简单估计量及其性质
引理 2.1:从大小为N的总体中抽取一个样本量为n的 简单随机样本,则总体中每个特定单元入样的概率为 n/N,两个特定单元都入样的概率为: n n 1
简单随机抽样,系统抽样,分层抽样 (2)
课 题 简单随机抽样,系统抽样,分层抽样 教学目标1.正确理解三种抽样方法的一般步骤和方法2.正确理解三中抽样方法间的区别和联系;重点、难点三种抽样方法概念的理解 2能够灵活应用三种抽样的方法解决统计问题。
考点及考试要求综合题考点一、简单随机抽样的概念一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【说明】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N 是有限的。
(2)简单随机样本数n 小于等于样本总体的个数N 。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为Nn 。
思考:下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
抽签法和随机数表法 1、抽签法的定义。
抽签法就是把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本。
【说明】抽签法的一般步骤:(1)将总体的个体编号。
(2)连续抽签获取样本号码。
思考:你认为抽签法有什么优点和缺点:当总体中的个体数很多时,用抽签法方便吗?2、随机数表法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法,这里仅介绍随机数表法。
【说明】随机数表法的步骤: (1)将总体的个体编号。
(2)在随机数表中选择开始数字。
(3)读数获取样本号码。
【例题精析】例1:人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?[分析] 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。
简单随机抽样(教学课件)高一数学(人教A版2019必修第二册)
生的平均身高等.要正确阅读并理解这些数据,需要具备一些统计学的知
识.
统计的研究对象是数据,核心是通过数据分析研究和解决问题,因
此,首先要设法获取与问题有关的数据,从而为解决问题奠定基础.
温故知新
统计的相关概念
名称
定义
总体
所要 考察对象 的全体叫作总体
)
A.要求总体的个体数有限
B.从总体中逐个抽取
C.每个个体被抽到的机会不一样
D.这是一种不放回抽样
【解答】解:根据随机抽样的定义可知,要求总体的
个体数有限,为了保证抽样的公平性,
要求每个个体被抽到的机会是相同的.从总体
中逐个抽取,这是一种不放回抽样.
综合以上几点可知C错误.
故选:C.
变式训练
下列抽样方法是简单随机抽样的是(
过程,直到抽足所需要人数.
比较随机数法与抽签法,它们各有什么优点和缺点?
(1)随机数法的概念:
利用随机数工具产生的随机数进行抽样方法,叫做随机数法.
(2)随机数法的步骤:
①将总体的个体编号;
②在产生的随机数选择数字;
③读数获取样本号码.
如果生成的随机数有重复,即同与编号被多次抽到,
可以剔除重复的编号并重新产生随机数,直到产生的
个”抽取,故不是简单随机抽样;
故选:C.
解题技巧
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样
的四个特征:
上述四点特征,如果有一点不满足,就不是简单随机抽样.
典例分析
题型二 抽签法的应用
例2.用抽签法从50个个体中选出5个个体,则共需制作号签的
个数为(
2.1.1简单随机抽样(三种抽样方法)
上的,由于它充分利用了已知信息,因此它获取的样本更 具代表性,在实用中更为广泛。
第28页,共36页。
2、分层抽样的抽取步骤:
第1页,共36页。
笑一笑,十年少
一天,爸爸叫儿子去买一盒火柴,临出门 前,爸爸嘱咐儿子要买能划燃的火柴,儿子拿 着钱出门了,过了好一会儿,儿子才回到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?”
儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
问:这则笑话中,儿子采用的是什么调查方式?这其 中的全体是什么?这种调查方式好不好?
性是( )C 。
A.与第几次抽样有关,第一次抽的可能性最大 B.与第几次抽样有关,第一次抽的可能性最小 C.与第几次抽样无关,每次抽到的可能性相等 D.与第几次抽样无关,与抽取几个样本无关
第20页,共36页。
问题某:校高一年级共有20个班,每班有50名学生。
为了了解高一学生的视力状况,从这1000人中抽 取一个容量为100的样本进行检查,应该怎样抽样?
中任意拿出一个零件进行质量检验后,再把它放回盒子里;
4. ③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,
对编号随机抽取)
5. A.① B.② C.③
D.以上都不对
四个特点:①总体个数有限;②逐个抽取;③不 放回;④每个个体机会均等,与先后无关。
第10页,共36页。
B 2.在简单随机抽样中,某一个个体被抽中的可能性是( )
为了解1200名学生对学校教改试验的意见打算从中抽取一个容量为30的样本考虑采用系统抽样则分段间隔k2某商场新进3000袋奶粉为检查其三聚氰胺是否超标先采用系统抽样的方法从中抽取150检查若第一组抽取号码是11则第61组抽出的号码2采用系统抽样的方法从个体数为1003的总体中抽取一个容量50的样本则在抽样过程中被剔除的个体数为抽样间隔为1某工厂生产产品用传送带将产品送放下一道工序质检人员每隔十分钟在传送带的某一个位置取一件检验则这种抽样方法是a
2.1.1简单随机抽样2
第四步:以上号码对应的6名同学就是要抽取的对象。
2.1 随机抽样
2.1.2 系统抽样
探究:某学校为了了解高一年级学生对教师教学
的意见,打算从高一年级500名学生中抽取50名进
一般地,在抽样时,将总体分成互不交叉的 层,然后按照一定的比例,从各层独立地抽 取一定数量的个体,将各层取出的个体合在 一起作为样本,这种抽样方法叫作分层抽样。
练习1:一批电视机中,有TCL厂生产的56台,长 虹厂生产的42台,用分层抽样的方法从中抽出一个 容量为14的样本。试确定各厂被抽取电视机的台数。
2.1.3 分层抽样
探究:
例1:假设某地区有高中
近视率/%
生2400人,初中生
80 60
10900人,小学生
40
11000人.
20 0 小学
初中
高中 年级
此地区教育部门为了了解本地区中小学生的近 视情况及其形成原因,要从本地区的中小学生 中抽取1%的学生进行调查,你认为应当怎样抽 取样本?
分层抽样概念:
练习2:要从班里62名同学中抽出12名同学参加 活动,试设计抽样方案。
第一步:将62个个体编号,号码是1,2,…,62;
第二步:用随机数表法随机抽取2个号码,如14,38,将 编号为14,38的2个号码剔除;
第三步:将剩下的60名同学重新编号,号码为1, 2,…, 60,由于 60÷12=5,则间隔为5,将编号按顺序每5个一 段,分成12段;
后勤的人数分别为
、13 4、
。3
3. 在120个零件中,一级品24个,二级品36个,三级 品60个,从全部零件中抽取容量为20的样本,则每
第二章统计简单随机抽样知识梳理简...
第二章统计2.1 随机抽样2.1.1 简单随机抽样知识梳理:1.简单随机抽样的含义一般地,设一个总体含有N个个体,从中________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会________,就把这种抽样方法叫做简单随机抽样。
2.简单随机抽样的方法(1)抽签法(抓阄法)一般地,抽签法就是________,把号码写在号签上,把号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
(2)随机数法随机数法:利用________、________或________产生的随机数进行抽样。
思考探究:1.简单随机抽样有哪些特点?2.在用随机数法抽样时,如果题目所给的编号数不一致,该如何处理?自主测评:1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法中正确的是()A.1 000名学生是总体B.每名学生是个体C.每名学生的成绩是所抽取的一个样本D.样本的容量是1002.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本有关3.抽签法中确保样本代表性的关键是()A.制签B.搅拌均匀C.逐一抽取D.抽取不放回4.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件进行检查,对100件产品采用下面编号方法:①01,02,03,…,100;②001,002,003,…,100;③00,01,02,…99。
其中最恰当的序号是________。
典例探究突破:类型一:简单随机抽样的概念例1:下面抽取样本的方式是简单随机抽样吗,为什么?(1)从无限多个个体中抽取50个个体作为样本;(2)箱子里共有100个零件,今从中选取10个零进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里;(3)从50个个体中一次性抽取5个个体作为样本;(4)某班45名同学指定个子最高的5名同学参加学校组织的某项活动。
简单随机抽样(人教A版2019 必修第二册)
(1)关于简单随机抽样的特点有以下几种说
)
D.每个个体被抽到的机会不一样,与先后顺序有关
(2)下列问题中最适合用简单随机抽样方法的是(
)
A.某学校有学生1 320人,卫生部门为了了解学生身体发育
情况,准备从中抽取一个容量为300的样本
B.为了准备省政协会议,某政协委员计划从1 135个村庄中
抽取50个进行收入调查
(2)如果用随机试验生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
【解析】
(1)第一步,将500袋牛奶编号为001,002,…,500.
第二步,用随机数工具产生1~500范围内的随机数.
第三步,把产生的随机数作为抽中的编号,使编号对应的袋装牛奶进入样本.
第四步,重复上述过程,直到产生不同的编号等于样本所需要的数量.
A.与第几次抽样无关,第一次抽到的概率要大些
B.与第几次抽样无关,每次抽到的概率都相等
C.与第几次抽样有关,最后一次抽到的概率要大些
D.每个个体被抽到的概率无法确定
(二)简单随机抽样
知识点三 抽签法
先给总体中的N个个体 编号 ,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)
上作为号签,并将这些小纸片放在一个不透明的盒里, 充分搅拌
一件玩,玩后放回再拿一件,连续玩了5件它不是“逐个”抽取.②不是简单随机抽样.虽然“一次性抽取”和
“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”.③不是简单随机抽样.因
为5名同学是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”
的要求.④是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,等可能的抽
第二章(简单随机抽样)
1 ∑ Yi = N i =1
N
∑Y
i =1
N
i
=Y
性质二
对于简单随机抽样,V(y) =
1− f 2 n S , 其中f = ,为抽样比。 n N
证明:
n 1 n 1 2 V(y) E ( y − Y ) = E[ ∑ yi − Y ] = 2 E[∑ ( yi − Y )]2 = n i =1 n i =1 2
引入一个0 引入一个0-1变量
αi
1 i ∈s = 0 i ∉s
n P(αi =1) = = f N
n E(αi ) = E(α ) = N
2 i
n n n n 2 V(αi ) = E(αi ) − E(αi ) = − = (1− ) = f (1− f ) N N N N
| θˆ − θ | P( ≤ µα ) = 1 − α ˆ) S (θ
[θ ± µ S (θˆ)]
α
【例2.3】 例2.3
• 我们从某个N=100的总体中抽出一个大小为 n=10的简单随机样本,要估计总体平均水 平并给出置信度为95%的区间估计。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
1 n( N − 1) 2 N −n 2 = S −n S ] = S2 [ n −1 N nN
1− f 2 1− f 1− f 2 2 所以,E[v( y )] = E ( )s = E (s ) = S n n n
• 大样本下,抽样调查估计量渐进正态
讲稿2-简单随机抽样
n
(1
N
N
1 n n n ) (1 ) N N 1 N N N n
i 1
N
Y iY j cov V ( i , j ) ji ) N 1 1
i 1 ji
N
N
Y iY j
N
n N
N
(1
n N
1 n n 1
2
N n 1 2 (1 ) Y N N i 1 i N 1
i 1 N
Y iY j ji
p a n
2
1 N
i 1
N
Yi
Y i 0或 1
N N 1
1
n
n
yi
n
y i 0或 1
y
2
i 1
S
2
Y 1
i 1
i
Y
2
2
s
y n 1
i 1
1
i
Y
R
i 1
N
i
i 1
N
X
i
Y X
Y X
ˆ R
i 1
n
yi xi
y x
三、地位与作用
优点
简单直观 理论基础 N很大时难以获得抽样框 样本分散不易实施,调查费用高
抽样技术2简单随机抽样
4,1 4,2 4,3 4,4 4,5
5,1 5,2 5,3 5,4 5,5
(2)不放回简单随机抽样 (SRS without replacement)
当从总体N个抽样单元中依次抽取n个抽样 单元时,每个被抽中的单元不再放回总体, 而是从总体剩下的单元中进行抽样。
不放回简单随机抽样的样本量要受总体大 小的限制。
E i j
( yi
Y
)( y j
Y
)
n(n 1) N (N 1)
i j
(Yi
Y )(Y j
Y)
E(yi Y )(y j Y )中的求和是对 n(n 1) 2 项的,
i j
(Yi Y )(Yj Y ) 中的求和是对 N (N 1) 2 项的
i j
V y
1 n2
n E
i1
( yi
N 1
N 1
估计量
a p
n
性质5:对于简单随机抽样, p 是 P 的
无偏估计。 p 的方差为:
V p PQ N n
n N 1
v p 1 f pq
n 1
证明
S 2 1 A(1 P)2 (N A)P 2 N PQ
N 1
N 1
s 2 n pq n 1
v( p) 1 f s2 n
总用水量的比重。 估计婴儿出生性别比。 检测食盐中碘含量。
一、对总体均值的估计
y
1 n
n i1
yi
以样本均值作为总体均值的估计
y 性质1:对于简单随机抽样, 的无偏估计。
是Y
Ey Y
例设总体为{0,1,3,5,6},计算总体均值Y =3、总体方差2=5.2和 S2 =6.5;
§2 2.1 简单随机抽样
抽样方法
2.1 简单随机抽样
正确理解随机抽样的概念,掌握抽签法、 1. 正确理解随机抽样的概念,掌握抽签法、随机数法的一 般步骤. 般步骤. 理解随机抽样的必要性和重要性. 2. 理解随机抽样的必要性和重要性.
调查的方法:普查、 调查的方法:普查、抽样 简单随机抽样
抽样
分层抽样 系统抽样
简单随机抽样: 简单随机抽样: 一般地,设总体含有N个个体, 一般地,设总体含有N个个体,从中逐个不放回地抽 如果每次抽取时, 取n个个体作为样本(n≤N) ,如果每次抽取时,每个个体 个个体作为样本( 被抽到的概率都相等,这种抽样方法叫作简单随机抽样. 被抽到的概率都相等,这种抽样方法叫作简单随机抽样. 特点: 特点:1、总体的个数有限(较少) 总体的个数有限(较少) 2、从总体中逐个进行抽取 3、不放回抽样 4、每个个体被抽到的机会相等
从容器中逐个抽取n个号签,并记录上面的编号. 4. 从容器中逐个抽取n个号签,并记录上面的编号. 对应上面n个编号的学生,即为所取学生. 5. 对应上面n个编号的学生,即为所取学生. 对样本的每一个个体进行调查: 6. 对样本的每一个个体进行调查: (1)设计调查问卷; 设计调查问卷; (2)发放调查问卷,并回收; 发放调查问卷,并回收; (3)汇总数据,得出结论,写成调查报告. 汇总数据,得出结论,写成调查报告.
注:随机抽样并不是随意或随便抽取,因为随意或随 随机抽样并不是随意或随便抽取, 便抽取都会带有主观或客观的影响因素. 便抽取都会带有主观或客观的影响因素.
修凿可以使道路平直,但只有崎岖的未经 修凿的道路才是天才的道路.
简单随机抽样的类型
抽签法: 抽签法: 把总体中的个体的代号写在形状、大小相同的签上, 把总体中的个体的代号写在形状、大小相同的签上, 然后将这些签均匀搅拌,每次随机地从中抽取一个( 然后将这些签均匀搅拌,每次随机地从中抽取一个(不放 回),然后将签均匀搅拌,再进行下一次抽取.如此下去, ),然后将签均匀搅拌,再进行下一次抽取.如此下去, 然后将签均匀搅拌 直到抽到预先设定的样本数. 直到抽到预先设定的样本数.
抽样调查的组织形式
实例2答案:
产业类别 第一产业 第二产业 第三产业 合 计 总体单位数 10,000 30,000 50,000 90,000 样本单位数 100 300 500 900
等比例分配法考虑了各类型组规模不 等的因素,大的类型组多抽,小的类型组 少抽,有利于减少人为的抽样偏差,且计 算操作很方便。所以,实际工作中应用很 普遍。
小结:
抽样调查的组织形式有:简单随机抽样, 类型抽样,等距抽样,整群抽样。 抽样调查的组织方式完全取决于调查研究 的目的要求、调查对象的特点和客观的条 件。凡是能够最经济、最省时而又能够满 足预期精确度和可靠性要求的组织方式, 便是一种好的组织方式,这也是抽样设计 的最根本的原则。
思考题:
实例1表答案:
产业类别 总体单位数 样本单位数
第一产业 第二产业 第三产业
合 计
10,000 30,000 50,000
90,000
300 300 300
900
2、等比例分配
按各类型组在总体中所占的比 例分配样本单位数,使各类型组中 抽取的单位数占各类型组单位数的 比例相等。
实例2表:
产业类别 第一产业 第二产业 第三产业 合 计 总体单位数 10,000 30,000 50,000 90,000 样本单位数
注意:
当总体内部差异较大时,简单随机抽 样方法也不能保证抽中的样本单位在总体 中有较均匀的分布,以致抽样误差偏大。 因此,这种抽样方式限于总体规模不大, 内部差异也不很大的情况。
(二)类型抽样
类型抽样也称分层抽样,它是将总体全 部单位按照某个标志分成若干个类型组,然后 从各类型组中采用简单随机抽样方式或其他方 式抽取样本单位。 各类型组中样本数的分配,通常有以下三 种方法: 1.等额分配 2.等比例分配 3.最优分配
《抽样技术》第二章-简单随机抽样
1
f
公式V y S 2 1 f 的说明
n
(1)V y 主要取决于S 2和n,与f 关系不大;
(2)当f n 5%时,1 f 可忽略,即V y S 2 ;
N
n
(3)V y S 2 1 f 2 N n 放回时的V y 2 。
n
n N 1
n
❖ 推论2 y 的标准误
Xi——第i个家庭的成年女子数 Yi——第i个家庭成年女子化妆品的总费用 i=1,2,⋯,N
每个成年女子化妆品的平均费用为
N
总的费用 R 总的成年女子数
Yi
i1 N
Xi
Y X
Y X
i1
比率的例子
❖ (3)在某住宅小区的房价调查中,要估计该小区的平 均房屋单价。令
Xi——第i套住宅的建筑面积 Yi——第i套住宅的市场价格 i=1,2,⋯,N
1, 1
2, 3
3, 4
4, 5
1, 2
2, 4
3, 5
1, 3
2, 5
1, 4
二、简单随机抽样的抽选
❖ 首先将容量为N的有限总体中的所有单元从1 到N编好号码,然后从这N个编号中抽取n个。
❖ 具体的抽取方式一般有: (1)抽签法; (2)随机数表法; (3)计算机产生伪随机数法。
随机数表法
❖ 随机数表是由0, 1, 2, ⋯, 9这十个数字组成的,书中 表3.2给出了由2500个一位数字组成的随机数表。这 个随机数表是这样产生的:在这2500个位置上分别 独立地做一次等可能地产生0, 1, 2, ⋯, 9的随机试验。 因此,在任意一个位置上0~9这十个数字出现的可 能性都相同,在任意两个位置上00~99这一百个数 字出现的可能性也都是相同的,在任意三个位置上 000~999这一千个数字出现的可能性也都是相同的, 依次类推。
2.概率与统计
抽样方法【基础知识】1、简单随机抽样:2、分层抽样:3、系统抽样:【基本训练】1.一个单位有职工360人,其中业务人员276人,管理人员36人,后勤人员48人,为了了解职工的住房情况,要从中抽取一个容量为30的样本,若采用分层抽样的抽样方法,则应从后勤人员中抽取人2.一个总体中有100个个体,随机编号为0,l,2,…,99,依编号顺序平均分成l0个小组,组号依次为l,2,3,…,l0.现用系统抽样方法抽取一个容量为10的样本,规定如果在第l组中随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是.【课后作业】1.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在抽取20人进行分层抽样,各年龄段人数分别是2.一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样方法抽取一个容量为20的样本,则一级品、二级品、三级品抽取的个数分别是3.将一个总体的100个个体编号为0,1,2,3,…,99,并依次将其分为10个小组,组号为0,1,…,9,要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0组(号码为0—9)随机抽取的号码为2,则所抽取的10个号码为5.一个单位有职工160人,其中业务员120人,管理人员16人,后勤服务人员24人。
为了了解职工的某种情况,从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,抽取各种人员的个数是业务员管理员。
样本的分析图表【基础知识】1、频数、频率、2、频率分布表、频率分布直方图、频率折线图、茎叶图【基本训练】1.采用简单随机抽样,从含有6个个体的总体中抽取一个容量为3的样本,每个个体被抽到的可能性为2.从存放号码分别为l,2,…,l0的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到的号码为奇数的频率是图1乙甲7518736247954368534321第3组的频率和累积频率分别为4.下图是容量为100的样本的频率分布直方图,试根据图中的数据回答下列问题:(1)样本数据落在[2,6)内的频率为 ; (2)样本数据落在[6,10)内的频数为 . 5.图1是某赛季甲、乙两名篮球运动员每场比赛得分的茎 叶图,则甲、乙两人这几场比赛得分的中位数之和是( ) A .65 B .64 C .63 D .62 【课后作业】1.一个社会调查机构就某地居民的月收入调查了 10000人,并根据所得数据画了样本的频率分布直 方图(如右图).为了分析居民的收入与年龄、学历、 职业等方面的关系,要从这10000人中再用分层 抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出 人.2.在学校开展的综合实践活动中,某班进行了小制作比赛,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计.绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2:3:4:6:4:l ,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率最高?样本的数字特征【基础知识】1、 众 数;中位数;平均数:=x2、 方 差:=2s 标准差:=s 方差和标准差是反映总体波动大小的特征数,当方差和标准差 时,则说明总体的波动性【基本训练】1.已知一组数据为20、30、40、50、50、60、70、80,其平均数、中位数和众数分别为2.已知5个数据3,5,7,4,6,则该样本标准差为3.期中考试以后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N, 那么NM 为4.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,已知这组数据的平均数为10,方差为2,则||y x 的值为【典型例题】例2.为了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数 据(精确到0.1米)进行整理后,分成6组画出频率分 布直方图的一部分(如下图)已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30.第6小组的频数是7. (1)请将频率分布直方图补充完整; (2)该校参加这次铅球测试的男生有多少人?(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球测试的成绩的合格率; (4)在这次测试中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗?用样体估计总体【基本训练】1.为了了解某次数学竞赛中1000名学生的成绩,从中抽出一容量为100的样本,则每个样本被抽到的概率是2.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为 3.某瓜农采用大棚栽培技术种植了一亩地的良种西瓜,这亩地西瓜约600个,在西瓜上市时随机摘了10个成熟的西瓜,称得如下:则这10个西瓜的平均质量是千克,这亩地西瓜产量约是千克。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
• 练习:从50个产品中抽取10个进行检查, 则总体个数为( ),样本容量为( )。
12
在抽样调查中要注意什么问题?
那么,怎样从总体中抽取样本呢?如何表示样 本数据?如何从样本数据中提取基本信息(样本分 布、样本数字特征等),来推断总体的情况呢?这 些正是本章要解决的问题。
数理统计所要解决的问题是如何根据样本来推 断总体。首先必须清楚地知道要收集的数据是什么; 其次,我们检验样本的目的是为了了解总体的情况; 再次,我们要知道如何才能收集到高质量的样本数 据。 13
注意以下点: (1)它要求被抽取样本的总体的个体数
有限; (2)它是从总体中逐个进行抽取;
(3)它是一种不放回抽样;
(4)它是一Leabharlann 等概率抽样。18• 简单随机抽样是在特定总体中抽取样本, 总体中每一个体被抽取的可能性是等同 的,而且任何个体之间彼此被抽取的机 会是独立的。如果用从个体数为 N 的总 体中抽取一个容量为 n 的样本,那么每 个个体被抽取的概卒等于 n/N .
21
练习:抽签法中确保样本代表性的关键是( ) A,制签 B,搅拌均匀 C,逐一抽取 D,抽取不放回
22
例一:从20名学生中抽取5名进行阅卷 调查,写出抽取样本的过程。
23
2、用随机数表法进行抽取
(1)随机数表是统计工作者用计算机生成的随机数,并保 证表中的每个位置上的数字是等可能出现的。 (2)用随机数表进行抽样的步骤:将总体中个体编号;选 定开始的数字;获取样本号码。 (3)用随机数表抽取样本,可以任选一个数作为开始,读 数的方向可以向左,也可以向右、向上、向下等等。因此并 不是唯一的. (4)由于随机数表是等概率的,因此利用随机数表抽取样 本保证了被抽取个体的概率是相等的。
24
用随机数表法抽取样本的步骤: (1)对总体中的个体进行编号(每个号码位数一 致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的 数码若不在编号中,则跳过,若在编号中,则取出, 如果得到的号码前面己经取出,也跳过,如此继续下 去, 直到取满为止; (4)根据选定的号码抽取样本。
把组成总体的每一个考察的对 象叫做个体
从总体中取出的一部分个体的 集体叫做这个总体的一个样本。 样本中的个体的数目叫做 样本的容量。
10
15000
• 练习:现从80件产品中随机抽出10件进行 质量检验,下列说法正确的是( ) • A,80件产品是总体 • B,10件产品是样本 • C,样本容量是80 • D,样本容量是10
进一步,从节约费用的角度考虑,在保证样本估计总体达 到一定的精度的前提下,样本中包含的个体数越少越好。
9
要了解全国高中生的视力情况,在全国抽取了这15所中学 的全部高中生15000人进行视力测试。
考察对象是什么?
全国每位高中学生的 视力情况。 这15000名学生的视力情 况又组成一个集体
在统计中,我们把所要考察的 对象的全体叫做总体
生活中的“数学”
品尝一勺汤,就可以知道一锅汤的味道,你知道其中蕴 涵的道理吗?
高质量的样本数据来自“搅拌均匀”的总体。如果我们 能够设法将总体“搅拌均匀”,那么从中任意抽取一部分 个体的样本,它们含有与总体基本相同的信息。
16
17
简单随机抽样
一般地,设一个总体的个体数为 N ,如果通过 逐个不放回地抽取的方法从中抽取一个样本,且每 次抽取时各个个体被抽到的概率相等,就称这样的 抽样为简单随机抽样。
1
本章引言
数 字 化 的 时 代
产品的合格率
农作物的产量
2
产品的销售量
某地的气温
3
自然资源
就业状况
4
30 25 20 15 10 5 0 上海 南京 天津 沈阳 哈尔滨 缺水量/
电视台的收视率
我国是世界上的第13个贫水 国,人均淡水占量排世界第 109位
5
我国土地沙漠化问题非常严重,全国沙漠化土地面积已超 过174000平方公里,并以每年3400平方公里的速度扩张。
1.简单随机抽样的概念
一般地,设一个总体的个体数为 N ,如果通过逐个 抽取的方法从中抽取一个样本,且每次抽取时各个个体 被抽到的概率相等,就称这样的抽样为简单随机抽样。
2.简单随机抽样的方法:
抽签法
随机数表法
注:随机抽样并不是随意或随便抽取,因为随意或
随便抽取都会带有主观或客观的影响因素.
30
你知道这些数据是怎么来的吗? 怎么调查?
通过调查获得的。
是对考察对象进行全面调查还是抽样调查?
6
统计学: 研究客观事物的数量特征和数量关系, 它是关于数据的搜集、整理、归纳和分析 方法的科学。
统计的基本思想:
用样本估计总体,即通常不直接去研究总 体,而是通过从总体中抽取一个样本,根据 样本的情况去估计总体的相应情况。
19
练习:对于简单随机抽样,个体被抽到的机 会( ) A,相等 B,不相等 C,不确定 D,与抽取的次数有关
20
1、抽签法(抓阄法)
一般地,用抽签法从个体个数为N的总体中抽取一个 容量为k的样本的步骤为: (1)将总体中的N个体编号(号码可以从0到N-1); (2)将0到N-1这N个号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作); (3)将号签放在同一箱中,并搅拌均匀; (4)从箱中每次不放回的抽出1个号签,并记录其编号, 连续抽取k次; (5)从总体中将与抽到的签的编号相一致的个体取出。 简记为:编号;制签;搅匀;抽签;取个体。
C)
③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑 已编好号,对编号随机抽取)
A.① B.② C.③ D.以上都不对
四个特点:①总体个数有限;②逐个抽取; ③不放回;④每个个体机会均等,与先后 无关。
27
例题
2.在简单随机抽样中,某一个个体被抽中的可能性是 ( B) 答: A.与第n次抽样无关,第一次抽中的可能性大一些; B.与第n次抽样无关,每次抽中的可能性都相等; C.与第n次抽样无关,最后一次抽中的可能性大一些; D.与第n次抽样无关,每次都是等可能抽样,但每次 抽中的可能性不一样;
简述为:编号、选数、取号、抽取
25
例二:为了检验某种产品质量, 决定从40件产品中抽取10件进行 检查,写出用随机数表法抽取样 本的过程。
26
例题:
1. 下列抽取样本的方式是属于简单随机抽样的是( ①从无限多个个体中抽取100个个体作样本; ②盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操 作时,从中任意拿出一个零件进行质量检验后,再把它放回盒 子里;
7
看一看
妈妈:“儿子,帮妈妈买盒火柴去。” 妈妈:“这次注意点,上次你买的火柴好多划不着。” ……… 儿子高兴地跑回来。 孩子:“妈妈,这次的火柴全划得着,我每根都试过了。” 笑过之后,谈谈你的看法
这个调查具有破坏性,不可能每根试过,不能展开全面 调查。
8
提出问题
例如,为了了解一批计算器的寿命,我们能将它们逐一测 试吗?很明显,这既不可能也没必要。实践中,由于所考察 的总体中的个体数往往很多,而且许多考察带有破坏性,因 此,我们通常只考察总体中的一个样本,通过样本来了解总 体的情况。
28
3、从总体为N的一批零件中抽取一个容量 为30的样本,若每个零件被抽取的可能性 为25%,则N=____. 4、为了了解全校240名学生的身高情况, 从中抽取40名学生进行测量。下列说法正 确的是( ) A 总体是240 C 样本是40名学生 B 个体是每一个学生 D 样本容量是40
29
小结
阅
读
一个著名的案例
在抽样调查中,样本的选择是至关重要的,样本能否代表总体, 直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计 调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一 个好的样本如此重要。 在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了 一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的 总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话 簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年 电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿 非常受欢迎,于是杂志预测兰顿将在选举中获胜。
实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如
下: 候选人 罗斯福 兰顿 预测结果 43 57 选举结果 62 38
14
思 考
你认为预期结果出错的原因是什么?
原因是:用于统计推断的样本来自少数富人,只能代 表富人的观点,不能代表全体选民的观点(样本不具有代 表性)。 像本例中这样容易得到的样本称为方便样本。如果使 用“方便样本”,那么得出与事实不符的结论的可能性就 会大大增加。 结论:在抽样时不能只图方便。如果只从一些容易得 到的个体中抽取样本,那么所得到的样本只是一个“方便 样本”,“方便样本”的代表性差,基本这种方便样本得 出的结论就会与事实相左。 15