_《统计学》第9章抽样与抽样估计
统计学填空题
第一章思考题及练习题1、统计工作与统计资料的关系是过程和成果的关系。
2、统计工作与统计学的关系是实践和理论的关系。
3、统计活动具有、、、和的职能。
4、统计指标反映的是现象总体的数量特征,数量标志反映的是个体的数量特征。
5、在人口总体中,个体是“个人”,“文化程度”是品质标志。
6、统计研究过程的各个阶段,运用着各种专门的方法,如大量观察法、统计分组法、综合指标法、统计模型法和统计推断法等。
7、统计标志是总体中各个体所共同具有的属性或特征的名称。
它分为指标名称和指标数值两种。
8、要了解一个企业的产品质量情况,总体是企业的所有产品、个体是单个产品。
9、性别是品质标志,标志表现则具体为不变标志或可变标志两种结果。
10、一件商品的价格在标志分类上属于数量标志。
11、一项完整的统计指标应该由指标名称、具体数据、计量单位、计算方法、时间限制和空间限制等构成。
12、统计指标按所反映的数量特点不同,可以分为和。
13、反映社会经济现象相对水平或工作质量的指标称为指标。
14、统计活动过程通常被划分为统计调查、统计整理和统计分析三个阶段。
15、经过 300 余年的发展,形成了今天的统计学。
16、古典统计学时期有两大学派,它们分别是国势学派和政治算术学派。
17、《关于死之表的自然和政治观察》一书的作者是,他第一次编制了“生命表”。
18、提出了着名的误差理论和“平均人”思想。
19、统计研究的数量性是指通过数来反映事物的量的、量的、量的和量的。
20、统计学包括和两部分内容。
21、总体中所包含的个体数量的多少称为总体容量;样本中所包含的个体数量的多少称为样本容量。
22、总体中的一个组或类,可被称为一个研究域或。
23、从总体中随机抽取的一部分个体所组成的集合称为样本。
24、统计理论与方法,事实上就是关于样本的理论和方法。
25、总体的三大特征是大量性、同质性和差异性。
26、总体的差异性要求体现在至少具有一个用以说明个体特征的差异27、企业性质标志适用的测定尺度是定性变量,产品质量等级标志适用的测定尺度是定性变量,企业利润标志适用的测定尺度是定量变量,企业产量标志适用的测定尺度是定量变量。
第二节 抽样估计的基本方法
面向21世纪 课程教材
第四章
抽样与抽样估计
第二节
一
(四)影响抽ห้องสมุดไป่ตู้误差的因素
1、总体各单位的差异程度(即标准差 的大小) : 越大,抽样误差越大; 2、样本单位数的多少n : 越大,抽样 误差越小; 3、抽样方法:不重复抽样的抽样误差 比重复抽样的抽样误差小; 4、抽样组织方式:简单随机抽样的误 差最大。
面向21世纪 课程教材
第四章
抽样与抽样估计
第二节
一
(三)估计量优劣的标准 评价估计量的优劣常用下列三个标准。 1.无偏性 2.有效性 3.一致性 点估计的优点是简单、具体明确。但由于样本 的随机性,从一个样本得到的估计值往往不会 恰好等于实际值,总有一定的抽样误差。而点 估计本身无法说明抽样误差的大小,也无法说 明估计结果有多大的把握程度。
xf
336 812 2160 2852 2688 2376 816 560 12600
x x f
2
588 700 648 92 84 648 600 784 4144
—
面向21世纪 课程教材
第四章
抽样与抽样估计
第二节
二
解:
xf 12600 126件 x 100 f x x f 4144 6.47件 s 99 f 1
126 1.203 X 126 1.203
,
1000126 1.203 N X 1000126 1.203
即该企业工人人均产量在124.797至 127.203件之间,其日总产量在124797至 127203件之间,估计的可靠程度为95﹪。
面向21世纪 课程教材
但对于某一项调查来说,根据客观要求,一般应 有一个允许的误差限,也就是说若抽样误差在这 个限度之内,就认为是可允许的,这一允许的误 差限度就称为极限误差。
统计学第9章抽样与抽样估计
整理ppt
1
第1节 抽样与抽样分布
一、有关抽样的基本概念
总体(Population) 研究对象的全体称为总体
样本(子样)(Sample) 从总体中抽取一部分个体进行试验或观察,这种从总体
中抽取个体的行为称为抽样。而从总体中抽样所得的一部分 个体叫样本 总体参数(Population parameter)
整理ppt
10
抽样平均误差和抽样极限误差
抽样平均误差:所有可能的样本指标与总体指标间的平均 差异程度。
x (xm X)2, p (p m P )2
整理ppt
11
抽样极限误差
样本指标与总体指标之间允许的误差范围叫抽样极限误 差。也称抽样允许误差。
它是样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
X
X 2.5
X2
1.250.625 2
整理ppt
18
大数定律及中心极限定理
不重复抽样:
(1)总体是正态分布,样本必然是正态分布 (2)样本平均数的平均数等于总体平均数 (3)样本平均数的方差等于总体方差除以样本
容量n
x2
2
n
Nn N1
(4)n越大,样本平均数越趋近于正态分布
整理ppt
19
抽样平均误差 (1)均值 重复抽样:
整理ppt
22
例、从某校1000名学生中简单随机抽取50名学生,称得平均体重为50千克, 若已知总体标准差为10千克,计算重复抽样及不重复抽样下抽样平均误 差。
解:重复抽样条件下,
V ( x ) 2 10 2 2 n 50
x
n
2 1.41
不重复抽样条件下,
9.1.1 简单随机抽样(课件)2022-2023学年高一数学同步备课(人教A版2019 必修第二册
A、从无数个个体中抽取50个个体作为样本; B、某车间工人加工一种零件100个,为了解这100个零件的直 径,从中不放回地依次抽取5个进行测量; C、从100名运动员中挑选10名优秀的运动员参赛; D、一彩民选号,从装有36个大小、形状都相同的号签的盒子 中不放回地逐个抽出7个号签.
注:若生成的随机数有重复,则需剔除重复的编号并重新新产生 随机数,直到产生的不同编号个数等于样本所需要的人数.
随机数法的特点:方便快捷,取到相同编号时要剔除. 随机数法一般适用于总体容量较大,但样本量不大的情形.
1.3简单随机抽样的方法——②随机数法
产生随机数的方法: 1.用随机试验产生随机数: 准备10个大小、质地一样的小球,小球上分别写上数字0,1,2 ,…,9, 把它们放入一个不透明的袋中. 从袋中有放回摸取3次 , 每次摸前充分 搅拌 , 并把第一、二、三次摸到的数字分别作为百、十、个位数,这 样就生成了一个三位随机数 . 若这个三位数在1~712范围内,就代表 对应编号的学生被抽中,否则舍弃编号. 注:这样产生的随机数可能会有重复.
2.总体均值和样本均值
上面我们通过简单随机抽样得到部分学生的平均身高,并把样本 平均身高作为树人中学高一年级所有学生平均身高的估计值.
概念
总体均值(总体平均数)
样本均值(样本平均数)
条件 总体中有N个个体,它们的变量 从总体中抽取一个容量为n的样本,
【问题1】树人中学高一年级有712名学生,通过简单随机抽样的方 法调查高一年级学生的平均身高. 1.编号:先给712名学生编号,例如1~712进行编号; 2.获取样本号码:用随机数工具产生1~712范围内的整数随机数, 把产生的随机数作为抽中的编号,使与编号对应的学生进入样本; 3.按所得号码抽取样本:重复上述过程,直到抽足样本所需要的人数.
抽样估计
假如从中抽取30名,得到样本的平均数、标准差和成数是 x 1554420 x 51814 .00 n 30 2 30名中层干部。 则,样本:抽取到的 ( x x ) s 325009260 / 293347 .72 统计量:根据样本分布计算的综合指标,是样本变量的 n1 函数。 p 19 / 30 0 .63 另注意区分样本容量和样本个数: 样本容量是指一个样本所包含的单位数。 样本个数是指样本的可能数目。
2、样本平均数的标准差(Standard Deviation of x )
设 = 样 本 均 值 分 布 的 标 准 差 ; = 总 体 标 准 差 x
n=样本容量; N=总体单位个数 则,样本均值标准差随总体抽样方法和是否有限有所不同:
2 xΒιβλιοθήκη 不重置抽样时 N n 重置抽样时 ( 无限总体 ) ( 有限总体 ) ( )
0 .3 相 对 0 .2 频 数 0 .1
图4.1 500个 x 的相对频数分布 显然,不同的样本对应着不同的样本统计量,而由于样本 抽取的随机性,样本统计量即为一种随机变量。 一般地,样本统计量的可能取值及其取值概率,形成其概 率分布,统计上称为抽样分布(sampling distribution)。 ▲正是抽样分布及其特征使得用样本统计量估计总体参数 的“精确程度”能够给予概率上的描述。
2 p ~ N ( 0 . 6 ,0 . 089 )
四、正态分布
1、正态分布的密度函数
f( x )
式中 x 为正态分布的平均数, 是它的标准差。这两个 ( x, 2 ) 参数决定正态分布密度函数的形状。也可简记为N 正态分布密度函数有如下特性: (1)对称性。 (2)非负性。 (3)当x处于中心位置是, 密度函数值最大。 (4)在处为密度函数的拐点,越大图形越扁平。 (5)当x ±∞时,密度函数f(x) 0,即曲线向两边下垂, 伸向无穷远处。
统计学各章练习——抽样推断
第九章抽样推断一、名词1、抽样推断:即由样本指标来推断总体指标的统计方法。
2、抽样误差:是指抽样指标和全及指标之间的绝对离差。
3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。
4、点估计:就是直接用样本指标代表总体指标的估计方法。
5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。
6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。
二、填空题1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。
2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。
3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。
4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。
5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。
6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。
7.抽样估计的方法有(点估计)和(区间估计)两种。
8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。
9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。
10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。
11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。
12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。
统计学原理 抽样估计
(三)样本容量和样本个数
n
N样本代表性高
(四)抽样方法
1、重复抽样(回置抽样)
n
抽一个单位——登记结果——重新放回——样本需要单位
特点:N 不变,每一个单位有均等抽中的机会。
如,设总体有A、B、C、D4个商店,重复抽样随机抽取
2个商店组成样本。则共有 4 4 =16 样本
AA AB AC AD N N N N… = Nn
设:Q —— 表示不具有某种属性的单位数所占的比重。
P——表示总体中具有某种属性标志的单位数在总体
中所占的比重。
产品产量
N = N1 + N0
不具有某种属性
具有某种属性 合格产品 N1
不合格产品
N Q= 0 N 成数方差 = P Q =P(1-P)
P =
N P + Q = 1 Q = 1- P
例如: 某厂生产的电子元件 1000件中有50件不合格,则
DA DB DC
三、抽样误差
(一)抽样误差 (随机误差) P121 x - X
调查误差——调查过程中由于观察、登记、测量、计算上 系统偏差 引起的。 预防、杜绝 登记误差 抽样误差——样本结构与总体结构发生差异引起的误差, 加以控制。 影响抽样误差的因素 P121
标志值的变异程度
样本的单位数
抽样的方法 抽样调查的组织方式
4、抽样推断的误差可以事先计算并加以控制
二、抽样推断中常用概念 (一)全及总体和样本 P12
1、全及总体(母体、总体) N 一次性调查中全及总体唯一确定的 2、样本(子样) n
n1
n3
一次性调查中样本不是唯一的,可变的。 n2
例: 研究某市工业企业的生产经营情况,则该市所有 工业企业 1000家就构成全及总体(母体、总体),若以 1%抽样调查,那么抽选的 10 家工业企业则称为抽样总体 (样本、子样)
统计学:抽样估计习题与答案
一、单选题1、从某生产线上每隔55分钟抽取5分钟的产品进行检验,这种抽样方式属于( )。
A.等距抽样B.分层抽样C.整群抽样D.简单随机抽样正确答案:A2、若总体平均数X̅=50,在一次抽样调查中测得x̅=50,则以下说法正确的是( )。
A.抽样极限误差为2B.抽样平均误差为2C.抽样实际误差为2D.以上都不对正确答案:C3、重复抽样条件下,成数的抽样标准误计算公式是( )。
A.√P2(1−P2)/nB.√P(1−P)/nC.√D. P(1−P)/√n正确答案:B4、在其它条件不变情况下,采用重复抽样方式,将允许误差扩大为原来的3倍,则样本容量( )。
A.扩大为原来的9倍B.扩大为原来的3倍C.缩小为原来的1/9倍D.缩小为原来的1/3倍正确答案:C5、如果随着样本容量的增大,估计量的值会越来越靠近总体参数的真值,符合这一要求的估计量被称为( )。
A.无偏估计量B.有效估计量C.一致估计量D.充分估计量正确答案:C6、下列关于抽样标准误的叙述哪个是错误的。
( )A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小正确答案:C7、简单重复随机抽样条件下,欲使误差范围缩小一半,其他要求不变,则样本容量须( )。
A.增加2倍B.增加3倍C.减少2倍D.减少3倍正确答案:B8、调查某市电话网100次通话,得知通话平均时间为4分钟,标准差为2分钟,在95.45%的置信水平下,估计通话的平均时间为( )。
A.[3.9,5.1]B.[3.8,4.2]C.[3.7,4.3]D.[3.6,4.4]正确答案:D9、从2000名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数的抽样标准误为( )。
A.0.24%B.4.85%C.4.97%D.以上都不对正确答案:B10、重复抽样条件下,平均数的抽样标准误计算公式是()。
《统计学》第9章 抽样与抽样分布
二、抽样中的基本概念
⚫ 样本比例(成数)
p = n1 ,q = n0 = 1− p
n
n
⚫ 样本是非标志的标准差
(n = n0 + n1)
sp =
n p (1− p) =
n −1
n pq n −1
⚫ 样本是非标志的方差
s
2 p
=
n n −1
p(1 −
p)
=
n n −1
pq
第一节 抽样和抽样方法
三、抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 在实践中总体所包括的单位数很多,分布很广,通过一次 抽样就选出有代表性的样本是很困难的。此时可将整个抽 样过程分为几个阶段,然后逐阶段进行抽样,最终得到所 需要的有代表性的样本。
第一节 抽样和抽样方法
三、抽样方法
⚫ 多阶段抽样
⚫ 阶段数不宜过多,一般采用两个、三个阶段,至多四个阶 段为宜,否则,手续繁琐,效果也不一定好。
第一节 抽样和抽样方法
二、抽样中的基本概念
⚫ 总体参数
⚫ 总体参数是根据总体各单位的标志值或特征计算的、反 映总体某一属性的综合指标。
⚫ 总体参数是唯一的、确定的常数,但一般情况下又是未 知的。
⚫ 常用的总体参数有 ⚫ 总体均值 ⚫ 总体标准差、总体方差 ⚫ 总体比例(成数)
第一节 抽样和抽样方法
⚫ 样本标准差
s =
1 n −1
n i =1
(xi
−
x )2,或s
=
1
m
m
(xi − x )2 fi
fi −1 i=1
i =1
⚫ 样本方差
( ) ( ) s2 = 1 n n −1 i=1
(抽样检验)抽样与参数估计最全版
(抽样检验)抽样与参数估计最全版(抽样检验)抽样与参数估计抽样和参数估计推断统计:利⽤样本统计量对总体某些性质或数量特征进⾏推断。
从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。
这个调查例⼦是估计总体参数(某种意见的⽐例)的壹个过程。
估计(estimation)是统计推断的重要内容之壹。
统计推断的另壹个主要内容是本章第⼆节要介绍的假设检验(hypothesistesting)。
因此本节内容就是由样本数据对总体参数进⾏估计,即:学习⽬标:了解抽样和抽样分布的基本概念理解抽样分布和总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体⽐例和总体⽅差的区间估计第⼀节抽样和抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进⾏调查,且根据样本数据所提供的信息来推断总体的数量特征。
总体(Population):调查研究的事物或现象的全体参数个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Samplesize):样本中所含个体的数量壹般将样本单位数不少于三⼗个的样本称为⼤样本,样本单位数不到三⼗个的样本称为⼩样本。
壹、抽样⽅法及抽样分布1、抽样⽅法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机会(概率)被抽中。
注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,⼜可分为重复抽样和不重复抽样。
⽽且,根据抽样中是否排序,所能抽到的样本个数往往不同。
②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进⾏抽样③、整群抽样:将壹组被调查者(群)作为壹个抽样单位④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者(2)⾮概率抽样:不是完全按随机原则选取样本①、⾮随机抽样:由调查⼈员⾃由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择壹群特定数⽬、满⾜特定条件的被调查者2、抽样分布壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。
徐国祥《统计学》(第2版)配套题库【章节题库】第7章~第9章 【圣才出品】
十万种考研考证电子书、题库视频学习平台
第 7 章 抽样和抽样分布
一、单项选择题 1.进行抽样推断时,必须遵循的基本原则是( )。 A.准确性原则 B.标准化原则 C.随机性原则 D.可靠性原则 【答案】C 【解析】抽样推断是指按照随机的原则从调查总体中抽取一部分样本单位进行观察,并 以样本指标对总体指标做出具有一定可靠性的估计和推断,从而达到对调查总体的认识的一 种统计方法。
2 / 65
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( )。 A.简单随机抽样 B.分层抽样 C.等距抽样 D.整群抽样 【答案】D
6.下列关于样本平均数和总体平均数的说法,正确的是( )。 A.前者是一个确定值,后者是随机变量 B.前者是随机变量,后者是一个确定值 C.两者都是随机变量 D.两者都是确定值 【答案】B
A.类型抽样 B.等距抽样 C.整群抽样 D.多阶段抽样 【答案】A 【解析】类型抽样即分类抽样或分层抽样,它是指先将总体按主要标志进行分组,再按
4 / 65
圣才电子书 十万种考研考证电子书、题库视频学习平台
随机原则从各组中抽取样本单位的一种抽样组织形式。
10.通常所说的大样本是指样本容量( )。 A.大于等于 30 B.小于 30 C.大于 10 D.在 10~20 之间 【答案】A
2.抽样调查中,无法避免和消除的是( )。 A.登记误差 B.系统性误差 C.测量工具误差 D.随机误差 【答案】D 【解析】随机误差是指遵守了随机原则,但可能抽到不同的样本而产生的误差。随机误 差在抽样调查中是不可避免的,是偶然的代表性误差。这种误差的大小可以计算并加以控制。
应用统计单项选择题
应用统计单项选择题1.社会经济统计是(C)的有利工具。
A.处理问题B.进行交流C.认识社会D.引进外资2.(A)是用图形、表格和概括性的数字对数据进行描述的统计方法。
A.描述统计B.推断统计C.理论统计D.应用统计3.(A)是我们所要研究的所有基本单位(通常是人、物体、交易或事件)的总和。
A.总体B.变量C.样本D.统计4.经济数据是对(B)进行计算的结果。
A.主观现象B.客观现象C.数字特征D.社会现象5.美国盖洛普(Gallup)调查公司在美国总统大选前通常会从全美国的选民中随机抽取1500人左右,对大选结果进行调查和预测,并会给出2%左右的预测误差。
这是利用样本信息和概率论原理进行(B)的过程。
A.统计描述B.统计推断C.统计分析D.统计应用6.统计学的核心内容是(C)。
A.统计数据的收集B.统计数据的整理C.统计数据的分析D.统计数据的应用7.(A)在《政治算术》一书中用大量的数字对英国、法国、荷兰三国的经济实力进行比较,用数字、重量、尺度等定量的方法进行分析和比较,表达他的思想和观点。
A.威廉配第B.约翰格朗特C.帕斯卡D.费马8.统计整理主要是对(C)的整理。
9.著名统计学家(B)给出了F统计量、最大似然估计、方差分析等方法和思想。
A.戈赛特B.费希尔C.奈曼和皮尔逊D.沃尔德10.统计数据的搜集活动是(B)。
A.应用统计B.统计工作C.统计数据D.统计学第02章-统计数据的描述1.某企业男性职工占60%,月平均工资为550元,女性职工占40%,月平均工资为500元,该企业全部职工的平均工资为(B)。
A.525元B.530元C.535元D.540元2.如果数据是左偏分布,则有(C)。
A.平均数=中位数=众数B.平均数>中位数>众数C.平均数A.抽样调查B.典型调查C.重点调查D.普查4.今有四位工人的工资分别为:400元,600元,700元,900元,计算四人平均工资,应采用的计算方式是(A)。
统计学 抽样估计习题
第六章抽样估计题一、单项选择题1、抽样推断的基本内容是:A.参数估计B.假设检验C.参数估计和假设检验两方面D.数据的收集2、抽样平均误差的实质是A. 总体标准差B. 抽样总体的标准差C. 抽样总体方差D. 样本平均数(成数〉的标准差3、不重复抽样平均误差:A. 总是大于重复抽样平均误差B. 总是小于重复抽样平均误差C. 总是等于重复抽样平均误差D. 上情况都可能发生4、在其它条件不变的情况下,抽样单位数增加一半,抽样平差A. 缩小为原来的81.6%B. 缩小为原来的50%C. 缩小为原来的25%D.扩大为原来的四倍5、样本的形成是:A.随机的B.随意的C. 非随机的D.确定的6、抽样误差之所以产生是由于:A. 破坏了随机抽样的原则。
B. 抽样总体的结构不足以代表总体的结构。
C. 破坏了抽样的系统。
D.调查人员的素质。
7、抽样误差指的是:A. 代表性随机误差B. 非抽样误差C. 代表性误差D. 随机性误差8、抽样误差大小A. 可以事先计算,但不能控制B. 不可事先计算,但能控制C. 能够控制和消灭D.能够控制,但不能消灭9、随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。
在概率为0.9545时,计算工龄不到一年的工人比重的极限抽样误差。
A.0.6%B. 6%C. 0.9%D. 3%10、根据抽样调查25个工厂(抽取2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.954时,计算流动资金平均周转时间的极限抽样误差。
A.0.8B.3.96C.4D.22611、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少?A.53.3B.1.65C.720D.132012、根据某市公共电话网100次通话情形抽样调查,知道每次通话平均持续时间为4分钟,均方差为2分钟。
在概率为0.9545时,计算每次通话平均持续时间的极限抽样误差。
第6讲 抽样和抽样估计精品文档
2. 用[L,U]去框,估计结论或者正确或者错误,但
是如果多次重复估计的话,则平均100次估计中,只 有100 次估计错误,有100(1- )估计正确。
3. 这个某种程度称为置信水平,表示为 (1
为是总体参数未在区间内的比例 ,显著性水平,
也称风险值
常用的为0.01,0.05,0.10,相应的置信水平
值有 99%, 95%, 90%
如何理解1-?
1. 由于 作为总体参数,是固定不变的常数,它或在给 出的区间 [L,U]内,或在该区间外,概率只能是0
样本抽样分布特征的证明
设从总体中抽出的样本为x1,x2,x3…xn ,由于是重复抽样, 每个xi都是从总体中随机抽出的,都是与总体同分布的随机
变量,并且是相互独立的。总体的平均数为,方差为 2,则:
E
(
x)
E
(
x1
+x2
x3 n
xn
)
1 n
[E(x1)+E(x2 )+E(x3 )
E(xn )]
第6讲 抽样与抽样估计
6.1 抽样调查的基本概念 6.2 抽样分布(重点) 6.3 抽样估计的基本方法(难点) 6.4 样本容量的确定
学习目的: 1. 掌握抽样调查的基本概念 2. 区分总体分布、样本分布、抽样分布,理解抽样分布与总体分布
的关系 3. 掌握抽样估计的基本方法,点估计和区间估计
6.1 抽样调查的基本概念
N
5
E(x)= 8, D(x)= 2 8 4
n2
抽 样平均误差 D(x) 2 x
社会统计学 第九章 参数估计
[例]研究者要调查某社区居民家庭收入分 布的差异情况,现随机抽查了10户,得到样本 方差为=200(元2)。试以此资料估计总体家庭 收入分布的差异情况。
[解] 因为样本容量较小,宜用修正样本 方差作为总体方差点估计量。即
=
=ห้องสมุดไป่ตู้
=222.2
第二节 区间估计(Interval estimation)
区间估计的任务是,在点估计值的两侧设置 一个区间,使得总体参数被估计到的概率大大增 加。可靠性和精确性(即信度和效度)在区间估计中 是相互矛盾的两个方面。
10元以内,问样本容量为多少? (2)若置信水平为90%,平均收入的最大误差在
10元以内,问样本容量为多少? (3)若置信水平为99%,平均收入的最大误差在
10元以内,问样本容量为多少? (4)若置信水平为95%,平均收入的最大误差在
20元以内,问样本容量为多少? (5)改变最大误差,对样本大小有什么影响? (6)改变置信水平,对样本大小有什么影响? (983,697,1704,246)
率度
=
(24)=2.064
代入公式得
=52±2.064
=52±5.06
因此,置信水平95%的总体均值的置信区 间是从46.94到57.06。
2. 大样本总体成数的估计 从总体的均值估计过渡到总体的成数估计,其方法和
思路完全相同,只要用 代替 ,用 代替
若总体成数未知,允许误差取 或
[例]假若从某社区抽取一个由200个家庭组成的样 本,发现其中有36%的家庭由丈夫在家庭开支上作决 定的次数超过半数。试问家庭开支的半数以上由丈夫 决定的家庭的置信区间是多少?(置信水平99%)
层内方差的平均(层间方差不进入): 回置抽样:
第9讲 大学统计学课件-抽样调查
总体方差(δ2)和总体标准差(δ)——测定全及总体标 志变异程度的指标
抽样指标 —— 根据抽样总体各个单位标志值计 算的综合 指标,与全及指标相对应
抽样平均数 (x)——抽样总体中某一变量 值(观测值)的算术平均数
抽样成数(p)——具有某种标志的单位数 在抽样总体 中所占的比重 样本方差 (s2) 和样本标准差 (s)—— 说明 抽样总体标志变异程度的指标
2.5 3.0 4.0 4.5 5.0
0.98760 0.99730 0.99940 0.99993 0.99999
例 6.3 某大学有 500 人进行高等数学统考,随机抽查 20% , 所得有关成绩数据如表。 试以95.45%的概率保证:
(1)估计全部学生的平均成绩;
(2)确定成绩在80分以上学生所占的比重和估计人数。
区间推断的可靠程度(置信度)
令 x t则 t x x
x
p
p
则
t 则 p t p
式中:t — 概率自由度(极限误差为平均误 差的倍数)
x t x X x t x
依据中心极限定律,当 n≥30,抽样平均指标近似服从 正态分布,全及指标所落范围就可以用曲线所围成的面积大 小来计算。
x
s n
x
p
s2 n (1 ) n N
p(1 p) n (1 ) n N
抽样成数 p 平均误差
p(1 p) n
应用条件
n 5% N
n 5% N
影响抽样误差的因素
全及总体标志变动程度 ——与抽样误差的大小成正比关系
样本单位数
——与抽样误差的大小成反比关系 抽样组织形式 ——抽样组织形式不同,抽样误差的大小不同
抽样与抽样估计
第四章抽样与抽样估计一、单项选择题1.抽样估计的基本内容是()A.参数估计B.假设检验C.参数估计和假设检验两方面D.数据的收集2.估计量的标准差实质上就是()A.总体标准差B.抽样总体的标准差C.抽样总体方差D.样本统计量的标准差3.不放回抽样的误差()A.总是大于放回抽样的误差B.总是小于放回抽样的误差C.总是等于放回抽样的误差D.上情况都可能发生4.在简单随机抽样中,当其它条件保持不变,样本量增加一倍,则估计量的标准差()A.缩小为原来的81.6%B.缩小为原来的50%C.缩小为原来的25%D.扩大为原来的四倍5.概率抽样中,样本的形成是()A.随机的B.随意的C.非随机的D.确定的6.抽样误差之所以产生是由于()A.破坏了抽样的随机原则B.抽样的随机性C.破坏了抽样的系统D.调查人员的素质7.抽样误差指的是()A.系统性误差B.抽样框误差C.代表性误差D.随机性误差8.抽样误差的大小()A.可以事先计算,但不能控制B.不能事先计算,但能控制C.可以事先计算并进行控制D.能够控制,但不能消除9.随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。
在概率为0.9545时,工龄不到一年的工人比重的估计标准差应为()A.0.6%B. 6%C.0.9%D. 3%10.根据抽样调查25个工厂(抽样比为2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.9545时,流动资金平均周转时间估计量的标准差为()A.0.8B.3.96C.4D.22611.假定10亿人口大国和100万人口小国的居民年龄的变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄的抽样标准差()A.两者相等B.前者比后者大C.前者比后者小D.不能确定12.根据抽样调查的资料,某城市人均日摄入热量2500千卡,抽样标准差150千卡,则在多大的置信度下可以断定该市人均摄入热量在2350千卡至2650千卡之间()A.0.9545B.0.6827C.1D.0.9013.在抽样调查某企业工人生产定额完成情况时,从工人按姓氏笔划多少的顺序名单中进行每五人抽样。
统计学第九章抽样与抽样估计
第九章抽样与抽样估计一、单项选择题1、抽样极限误差是指抽样指标和总体指标之间(D)。
A.抽样误差的平均数B.抽样误差的标准差C.抽样误差的可靠程度D.抽样误差的最大可能范围2、样本平均数和总体平均数(B)。
解析:样本平均数是以总体平均数为中心,在其范围内变动(P213)A.前者是一个确定值,B.前者是随机变量,后者是随机变量后者是一个确定值C.两者都是随机变量D.两者都是确定值3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%,95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。
A.144B.105C.76D.1094、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。
A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/35、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。
A.增加9倍B.增加8倍C.为原来的2.25倍D.增加2.25倍6、抽样误差是指(C)。
解析:这题考的是抽样误差的定义(P213)A.在抽查过程中由于观察、测量等差错所引起的误差B.在调查中违反随机原则出现的系统误差C.随机抽样而产生的代表性误差D.人为原因所造成的误差7、在一定的抽样平均误差条件下(A)。
A.扩大极限误差范围,可以提高推断的可靠程度B.扩大极限误差范围,会降低推断的可靠程度C.缩小极限误差范围,可以提高推断的可靠程度D.缩小极限误差范围,不改变推断的可靠程度8、抽样平均误差是(B)。
解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差C.抽样指标的标准差D.抽样误差的平均差9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
整群抽样:也称丛聚抽样或集团抽样。它是将总体 分为若干部分(每一部分称为一个群),然后按随机 原则从中一群一群地抽选,对抽中群内的所有单位 进行全面调查。
系统抽样也称机械抽样。它是先将总体单位按一定 顺序排队,计算出抽样间隔(或抽样距离),然后 按固定的顺序和间隔抽取样本单位。
p
P(1 P) n
0.95 0.05 100
=0.0218
Δp=zα/2 p =1.96×0.0218=0.0359或3.59% 95%-3.59%=91.41%,95%+3.59%=98.59% 故该批产品合格率的置信区间为(91.41%,98.59%)
在重复抽样下,
x
z / 2
n
所以,必要抽样单位数
(2)总体方差σ2。其他条件不变的情况下,总体方差σ2愈大, 总体单位的差异程度愈大,则样本单位数应愈多;反之,样本 单位数可愈少。
(3)抽样估计的可靠程度1-α。当其他条件不变时,抽样估 计的可靠程度愈高,zα/2数值愈大,抽样数目就必须愈多;反 之,抽样估计的可靠程度愈低,抽样数目就可以愈少。
置信下限为58-1.96=57.04,
置信上限为58+1.96=59.96
故所求置信区间为(57.04,59.96)千克。
由于 T x ~t(n-1),对于给定的置信度1-α,有
s/ n
P
{t / 2
x
s/ n
t / 2} 1
P {x t / 2
s n
x t / 2
s } 1
抽样分布反映样本统计量的分布特征,根据抽 样分布的规律,可揭示样本统计量与总体参数 之间的关系,计算抽样误差,并说明抽样推断 的可靠程度。
登记性误差
登记性误差是指在调查和汇总过程中由 于观察、测量、登记、计算等方法的差 错或被调查者提供虚假资料而造成的误 差。任何一种统计调查都可能产生登记 性误差。
重置抽样(重复抽样)(Sampling with replacement)
要从总体N个单位中随机抽取一个容量为n的样本,每 次从总体中抽取一个单位,把顺序号登记下来之后, 重新放回参加下一次抽选,连续反复抽取n次组成所 要求容量的样本。
不重置抽样(不重复抽样)(Sampling without replacement)
容量n
2 x
2
n
N N
n 1
(4)n越大,样本平均数越趋近于正态分布
抽样平均误差 (1)均值 重复抽样:
x
2
nn
不重复抽样:
x
2 N n
n N 1 n
N n N 1
抽样平均误差 (1)比例 重复抽样:
p
p(1 p) n
不重复抽样:
p
p(1 p) N n n N 1
P{ z 2
x / n
z } 1 2
即
P x
z / 2
1
n
可见,极限误差的计算公式为
x
z / 2
n
z / 2 x
则总体均值的置信区间为
(x , x )
x
x
解:已知 x =58,σ=10,zα/2=1.96,n=100
x
n=10/10=1(千克)
x
z / 2=x1.96×1=1.96(千克)
重复抽样:
(1)总体是正态分布,样本必然是正态分布
(2)样本平均数的平均数等于总体平均数
(3)样本平均数的方差等于总体方差除以样本
容量n
2 x
2
n
(4)n越大,样本平均数越趋近于正态分布
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。 总体的均值、方差及分布如下
n z2 / 2 2 1.962 1102 46( 5 户)
2
10 2
x
解:
n (z 2 )2 2 (1.96)2 20002
E2
400 2
96.04 97
(1)允许误差范围Δ。当其它条件不变时,允许误差愈小, 必要的抽样单位数就需要愈多;反之,允许误差愈大,抽样单 位数就可以愈少。
系统性误差是指由于非随机因素引起的样 本代表性不足而产生的误差,表现为样本 估计量的值系统偏低或偏高。。
误差
系统性误差
代表性误差
随机性误差
代表性误差是指用样本指标推断 总体指标时,由于样本结构与总 体结构不一致、样本不能完全代 表总体而产生的误差。
随机性误差又称 偶然性误差,是 指遵循随机原则 抽样,由于随机 因素(偶然性因 素)引起的误差。 抽样估计中的所 谓抽样误差,就 是指的这种随机 误差。
总体分布
.3
.2
.1 0
1
234
均值和方差
N
Xi
X i1 2.5 N
N
(Xi X )2
2 i1
1.25
N
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
16个样本的均值
n
置信下限
x t /2 (n 1)
s置信上限
n
x t /2 (n 1)
s n
在大样本下,总体均值的置信区间为
s
s
(x t /2 (n 1)
n , x t /2 (n 1)
) n
解:
x x 407 /10 40.( 7 岁)
n
s (x x)2 634.1/ 9 8.3939( 7 岁) n 1
(x X )2
m
, p
( p P)2 m
抽样极限误差
样本指标与总体指标之间允许的误差范围叫抽样极限误 差。也称抽样允许误差。
它是样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
即:
X x
pP p
X
x- 3 x- 2 x-
x X+ X+2 X+ 3
68.27%的样本
95.45% 的样本 99.73% 的样本
估计。
样本均值是总体均值的点估计量,样本方差s2是总体方差σ2的 点估计量,样本比例p是总体比例P的点估计量。
优良估计量的标准: 无偏性 有效性 一致性
区间估计就是根据样本求出总体未知参数的估计区间,并使其可 靠程度达到预定要求。
(1) 总体方差σ2已知时
由于 有
z x N (0,1) ,所以对于给定的置信度1-α, / n
总体(Population) 研究对象的全体称为总体
样本(子样)(Sample) 从总体中抽取一部分个体进行试验或观察,这种从总体
中抽取个体的行为称为抽样。而从总体中抽样所得的一部分 个体叫样本 总体参数(Population parameter)
描述总体分布特征的数值 样本统计量(Sample statistic)
➢ 抽样的方法。
在其他条件不变的情况下,重复抽样的抽样误差大于不重 复抽样。
➢ 抽样的组织形式。
例、从某校1000名学生中简单随机抽取50名学生,称得平均体重为50千克, 若已知总体标准差为10千克,计算重复抽样及不重复抽样下抽样平均误 差。
解:重复抽样条件下,
V (x) 2 102 2
n 50
登记性误差:存在于一切调查中 代表性误差:仅产生于抽样调查,不可避免。
代表性误差
系统性误差:不随样本量增减而变化 随机误差(抽样误差):随样本量增大而减小
抽样误差在实际一次调查中是调查不出来的,但其平均值是 可以推算的
抽样平均误差:所有可能的样本指标与总体指标间的平均 差异程度。
x
s 8.39382 2.6544(岁)
x
n
10
当置信度为95%时, x
t / 2 x
=2.2622
2.6544=6.00(岁)
因为40.7-6.00=34.7 40.7+6.00=46.7
所以该保险公司投保人的平均年龄的置信区间为(34.7,46.7)岁。
在大样本条件下,若np>5,n(1-p)> 5,则样本比例趋 近于正态分布。
(4)抽样方法。相同条件下,由于采用重复抽样比不重复抽 样的误差大,所以,前者应比后者多抽一些样本单位。
除上述因素之外,抽样组织方式也是影响抽样单位数的一个 原因 。
1. 总体分布、样本分布、抽样分布 2. 单总体参数推断时样本统计量的分布 3. 参数估计的一般问题 4. 一个总体参数的区间估计 5. 样本容量的确定
x
n
2 1.41
不重复抽样条件下,
2
V(x)
N
n
102
1000 50
1.9
n N 1 50 1000 1
x 1.9 1.38
在样本量相同的情况下,不重复抽样的平均误差要小于重复抽样的平 均误差。
抽样估计必须包括三要素:
1)估计值 2)估计值的误差范围 3)概率保证程度(置信度)
一、点估计(Point estimate) 点估计也称定值估计,常用点估计方法有矩估计,极大似然
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( X ) 抽样分布