第五章 抽样分布与参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于某一研究对象,当研究目的确定时,全及总体是确定的, 样本总体是不确定的。
(二)总体指标与样本指标
1、总体指标:根据总体中各单位的标志值计算出来的用于反
映总体的数量特征的指标。又称为全及指标或母体参数。
①总体平均数(总体均值):
N
Xi
X i1 N
②总体成数:
P N1 N
N1 —总体中具有某种
另外还有二重抽样法、比估计法、回归估计等
七、抽样调查中的几个基本概念
(一)全及总体与样本总体
1.全及总体是指根据调查目的所确定的研究对象全体.简称 为总体.常用 N 表示总体单位数。 2.样本总体是指根据随机原则从总体中抽取一部分单位所组 成的整体.常用 n 表示样本单位数(样本容量)。
一般 n 30 时,称为大样本;n 30 时,称为小样本
对于重复抽样: x u / 2x
u / 2
s n
nx
u / 22 s 2 2x
同理可得:
np
u / 22 p(1 2p
p)
对于不重复抽样:
x u / 2x u / 2
s2 (1 n ) nN
nx
Nu / 22 s 2 N2x u / 22s 2
同理: n p
Nu / 22 p(1 p) N2p u / 22 p(1 p)
具体排队时又分
按无关标志排队 按有关标志排队
5.多阶段随机抽样
多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。
例如:我国农产量调查就采用五阶段抽样方式。省抽县、县 抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实 割实测的调查方法。

加强自身建设,增强个人的休养。2020年11月17日 上午2时 24分20.11.1720.11.17

精益求精,追求卓越,因为相信而伟 大。2020年11月17日 星期二 上午2时 24分28秒02:24:2820.11.17

让自己更加强大,更加专业,这才能 让自己 更好。2020年11月上 午2时24分20.11.1702:24November 17, 2020
七.样本单位的抽选方法
在组织抽样调查时,根据样本单位是否重复抽取,分 别有重复抽样和不重复抽样两种方法。
1、重复抽样
重复抽样是指每次从总体中抽取一个单位进行观察后, 再把这个单位重新放回总体,使之继续参加下次抽选。这 种抽选法也称为放回抽样。
2、不重复抽样
不重复抽样是指每次从总体中抽取一个单位进 行观察后不再把这个单位重新放回总体,这个总 体单位不再继续参加下次抽选。这种抽选法也称 为不放回抽样。

这些年的努力就为了得到相应的回报 。2020年11月17日星 期二2时 24分28秒02:24:2817 November 2020

科学,你是国力的灵魂;同时又是社 会发展 的标志 。上午2时24分 28秒上 午2时24分02:24:2820.11.17

每天都是美好的一天,新的一天开启 。20.11.1720.11.1702:2402:24:2802:24:28Nov-20
第五章 抽样分布与参数估计
本章主要内容
❖ 一、抽样调查概述 ❖ 二、抽样推断的原理 ❖ 三、抽样分布与误差 ❖ 四、必要样本容量的确定
第一节 抽样调查概述
一、抽样调查的意义
按照一定的程序,从总体中抽取一部分单位 进行调查,根据样本资料的估计值,对总体待 估参数做出具有一定可靠程度的估计和推断, 以反映总体的数量特征或数量表现。
各层抽样比例相同
标志变动度大的组多抽 标志变动度小的组少抽
3.整群随机抽样
整群随机抽样是先将总体按某一标志分成若干组 ,每 一组称为一个群,以群为单位进行简单随机抽样,然后对 抽到的群进行全面调查的抽样方式。
例如:了解某地区职工家庭生活状况时,按居委会分群, 然后对抽到的群(居委会)中,所辖每户职工家庭进行调 查登记。
总体
样本均值
样本
样本方差
抽样分布
二、抽样调查的分类
❖ 随机抽样:按照随机原则,完全排除了人为的主观 因素,总体中每个单位都有一定的概率被选入样本。
❖ 非随机抽样:从方便出发或者根据研究者主观的判 断来抽取样本,不遵循随机原则。无法估计和控制 抽样误差,无法用样本的数量特征来推断总体。 (方便抽样、配额抽样、 不等概率PPS抽样等)
四、抽样调查的应用
对一些社会现象不可能或不必要进行全面调查时, 一种是被调查总体包含有无穷多个单位,第二种是 对破坏性和消耗性产品的检验(如:家用电器检验、 食品卫生检验等)。
企业产品质量的管理。 对一些时效性较强但有来不及采取全面调查的。 可以对大规模的全面调查进行检验,以修正资料。
五、抽样推断中的理论依据
对于不重复抽样:
x
s2 N n
n N 1
修正系数
当 N 很大时,通常大于 500,N-1 近似为N,此时
x
s2 N n nN
s2 (1 n ) nN
抽样比
同理可得:
p
p(1 p) N n
n
N
当N很大时
p
p(1 p) (1 n )
n
N
3.抽样极限误差
抽样极限误差是指以样本估计总体在某种概率意义下所 允许的最大误差范围。
第三节 必要样本容量的确定
抽样调查理论中,样本容量 n 的确定具有 实实在在的意义。 n 过大,违背抽样调查的 宗旨, n 过小,则抽样误差偏大,无法作出 精确的估计。
一、影响因素
1.总体标志变动度
总体方差 2越大 各调查单位标志值之间的差异越大
抽样分布越分散 抽样误差越大 若想满足一定的精度要求 , 则必要样本量就越多
1、大数定律(切贝雪夫大数定律)
设 X1, X2, , Xn 是一列两两相互独立的随机变量,服从
同一分布,且存在有限的数学期望 和方差 2 ,则对于
任意小的正数 0 ,有:
lim P( X ) 1
n
n
对于抽样推断:随着样本容量 n 的增加,样本平均
数将接近于总体平均数。
❖ 2、中心极限定理:设从均值为,方差为 2的一个任 意总体中抽取容量为n的样本,当n充分大时,样本均值 的抽样分布近似服从均值为μ、方差为σ2/n的正态分
第二节 抽样推断的原理
抽样推断主要任务: 利用样本指标推断总体指标
本章中即: x X p P
只要 n N 则样本指标同总体指标之间就有不同,
即利用样本推断总体存在误差。
一、抽样误差
1. 概念
抽样误差是由于抽样造成的误差,是由于用 样本估计总体而产生的误差,无法避免,在概率 抽样中,抽样误差事先可以计算并控制。
对于分层抽样: 层内是抽样调查 , 层间是全面调查
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。 它是先将总体中各单位按一定的标志排队,然后每隔一定 的距离抽取一个总体单位(个体)的抽样方式。
例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么 编号为 3,13,23,33,43,53,63,73,83,93的10个 人组成样本。
通常用“”来表示
抽样极限误差与抽样平均误差之比的系数称为抽
样概率度 , 记为 t。样本容量较大时,t分布与正态分
布差别不大,用 u /2 。
即 u / 2
x u / 2 x
p u / 2 p
三、总体指标的估计
1.点估计
点估计也叫定值估计,就是以所抽样本资料为依据, 直接根据所选择的估计量对总体指标作出一个确定值 的估计,同时表明估计的精度和概率保证程度。
③样本标准差: s
(x x)2
n 1
s p(1 p) n 1
对于某一研究对象,当研究目的确定时,总体指标是确定的,
样本指标是不确定的。
(三)抽样框和抽样单元
抽样框:指供抽样所用的总体清单,是抽样的实际 总体。包括具体的目录以及能够计数的全部抽样单 位,而又不用把它们一一列出来。
抽样单元:把总体划分为有限个互不交叉而又内 容完备的部分,每个部分称为一个抽样单元。
特性个体数目
③总体标准差:
(X X )2
N
P(1 P)
针对数量标志
针对是否标志
2、样本指标:根据样本中各单位的标志值计算出来的用于反
映样本数量特征的指标称为样本指标,也称样本参数。
①样本平均数(样本均值):
n
xi
x i1 n
②样本成数:
p n1 n
n1 —样本中具有某种 特性个体数目
❖ 采用简单随机重复抽样的方法,在2000件产品中抽取200件, 其中合格品190件,求:
❖ (1)计算合格品率及抽样平均误差; ❖ (2)以95%置信水平对合格品率和合格品数量进行区间估计。
❖ 有一批送检产品,据经验估计其一级品率为20%,成数的最大允 许抽样误差不超过5%,在95%的置信水平下,求:
本章主要讨论随机抽样的原理和方法
三、抽样调查的特点
➢ 按照随机原则抽取样本,完全排除了主观因素的 影响,样本对总体具有代表性。
➢ 可节省人力、物力和财力,提高时效。 ➢ 可以通过分析样本的特性,估计和推断被调查总
体的数量特征。 ➢ 抽样误差可以事先计算并加以控制,抽样调查具
有一定的精确性和可靠性。
布。
在一定条件下,大量独立随机变量的平均数是以正态 分布为极限的。
六、抽样组织的方式
1.简单随机抽样
简单随机抽样是一种对总体的每个单位(个体)都不 加任何限制的抽样。在总体中不作任何分组、划类、排队 等,完全随机地抽取调查单位。
它是抽样调查中最简单组织形式,又叫单纯随机抽样。
具体抽样时,可直接抽样,按号码签抽样,按随机数字表抽等

做一枚螺丝钉,那里需要那里上。20. 11.1702 :24:280 2:24No v-2017 -No v-2 0

日复一日的努力只为成就美好的明天 。02:24:2802:24:2802:24Tues day, November 17, 2020

安全放在第一位,防微杜渐。20.11.1720.11.1702:24:2802:24:28November 17, 2020
❖ (1)用重复随机抽样,必要抽样单位数是多少?
❖ (2)抽样方法同上,若允许误差减少50%,其必要抽样单位数 又为多少?

生活中的辛苦阻挠不了我对生活的热 爱。20.11.1720.11.17Tuesday, November 17, 2020

人生得意须尽欢,莫使金樽空对月。02:24:2802:24:2802:2411/17/2020 2:24:28 AM
2. 影响因素
总体标志变动度
总体方差 2越大 各调查单位标志值之间的差异越大
抽样分布越分散 抽样误差越大
当总体方差 2为0, 即总体内各调查单位标志值之间无
差异,则不存在抽样误差
样本容量
样本容量是影响抽样误差大小最直接、最有效的因素
其他条件相同时,n 越接近 N ,误差越小
抽样方法、方式
其他条件相同时,重复抽样误差﹥不重复抽样的误差 从抽样方式上看,简单随机抽样、分层抽样、系统 抽样、整群抽样与多阶段抽样的抽样误差也有区别。
2.抽样推断可靠度和精确度要求
要求越高, 所需样本量就越大 衡量可靠度一般用 t 分布 ,衡量精确度一般用抽样误 差
3.抽样方法、方式
其他条件相同时,重复抽样所需 n﹥不重复抽样所需 n 分层抽样所需样本量最少, 整群抽样所需样本量最多
本章主要研究简单随机抽样下如何确定 n 。
二、计算方法
简单随机抽样下必备样本量的确定
二、抽样误差的表现形式
1.抽样实际误差
抽样实际误差指抽样估计值与总体指标值之间的离差,
表示为:
xX 或
pP
2.抽样平均误差
抽样平均误差指所有可能样本抽样误差的平均数, 是抽 样误差的一般水平。
本章中主要讲述: x
p
(1)简单随机抽样的抽样平均误差
对于重复抽样:
x
n
s n
p
P(1 P) n
p(1 p) n
xX 或 pP
2.区间估计
区间估计就是以点估计为依据,用一个具有一定可靠 程度的区间范围来估计总体指标。
对总体平均数的区间估计为:
x x X x x
或 x u / 2 x X x u / 2 x
对总体成数的区间估计为:
pp P pp
或 p u / 2 p P p u / 2 p
2.分层随机抽样
分层随机抽样又称为类型随机抽样或分类随机抽样。 它是按照某一标志先将总体分成若干组(类),其中每一 组称为一层,然后在每一层内按照简单随机抽样方式进行 抽样的抽样方式。
例如:将工业企业划分为冶金、电力、石油化工、煤炭、 机械、电子等部门,每个部门中进行抽样调查。
进Βιβλιοθήκη Baidu步细分
类型比例抽样 类型适宜抽样
相关文档
最新文档