统计学第九章抽样与抽样估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章抽样与抽样估计
一、单项选择题
1、抽样极限误差是指抽样指标和总体指标之间(D)。
A.抽样误差的平均数B.抽样误差的标准差
C.抽样误差的可靠程度D.抽样误差的最大可能范围
2、样本平均数和总体平均数(B)。
解析:样本平均数是以总体平均数为中心,在其范围内变动(P213)
A.前者是一个确定值,B.前者是随机变量,
后者是随机变量后者是一个确定值
C.两者都是随机变量D.两者都是确定值
3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%,
95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。
A.144B.105C.76D.109
4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。
A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3
5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。
A.增加9倍B.增加8倍
C.为原来的2.25倍D.增加2.25倍
6、抽样误差是指(C)。
解析:这题考的是抽样误差的定义(P213)
A.在抽查过程中由于观察、测量等差错所引起的误差
B.在调查中违反随机原则出现的系统误差
C.随机抽样而产生的代表性误差
D.人为原因所造成的误差
7、在一定的抽样平均误差条件下(A)。
A.扩大极限误差范围,可以提高推断的可靠程度
B.扩大极限误差范围,会降低推断的可靠程度
C.缩小极限误差范围,可以提高推断的可靠程度
D.缩小极限误差范围,不改变推断的可靠程度
8、抽样平均误差是(B)。
解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差
C.抽样指标的标准差D.抽样误差的平均差
9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进
行检验,这种抽查方式(D)。
A.简单随机抽样B.类型抽样
C.等距抽样D.整群抽样
10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,
这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。
A.简单随机抽样B.机械抽样
C.分层抽样D.整群抽样
11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》
或抽签的方式来抽取样本的抽样组织形式,被称为(B)。
A.简单随机抽样B.机械抽样
C.分层抽样D.整群抽样
12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相
比,(A)。
A.前着小于后者B.前者大于后者
C.两者相等D.无法判断
13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其
他条件不变),必要的样本容量将会(C)。
A.增加一倍B.增加两倍C.增加三倍D.减少一半
14、比例与比例方差的关系是(B)。
A.比例的数值越接近于1,比例方差越大
B.比例数值越接近于0,比例的方差越大
C.比例的数值越接近于0.5,比例的方差越大
D.比例的数值越大,比咯的方差越大
15、假定一个人口一亿的大国与百万人口的小国居民年龄变异程度相同,现在各
自用重复抽样方法抽取本国1%人口计算平均年龄,则平均年龄抽样平均差
(D)。
A.不能确定B.两者相等
C.前者比后者大D.前者比后者小
二、多项选择题
1、下面说法错误的是(ABC)。
A.抽样调查中的代表性误差是可以避免的
B.抽样调查中的系统误差是可以避免的
C.抽样调查中的随机误差是可以避免的
D.抽样调查中的随机误差是不可以避免的
E.抽样调查中的系统误差是不可以避免的
2、从一个总体中可以抽取一系列样本,所以(ACD)。
A.样本指标的数值不是唯一确定的
B.总体指标是随机变量
C.样本指标是随机变量
D.样本指标的数值随样本的不同而不同
E.样本指标是一般变量
3、影响抽样平均误差的因素有(ABCD)。
A.总体标志变异程度
B.样本容量
C.抽样方法
D.抽样组织方式
E.可靠程度
4、抽样组织方式有(ABD)。
A.简单随机抽样
B.分层抽样
C.机械抽样
D.整群抽样
E.重置抽样
5、在其他条件不变的情况下(ABCD)。
A.总体方差越大,所需的样本容量越多
B.总体方差越小,所需的样本容量越少
C.允许的最大估计误差越小,所需的样本容量越多
D.允许的最大估计误差越大,所需的样本容量越少
E.当置信度越高,所需样本容量越少
6、样本容量n受三个因素的影响(ABC)。
A.总体方差
B.允许最大估计误差
C.置信度
D.概率分布
E.抽样估计标准差
7、总体参数的区间估计必须同时具备的要素有(ADE)。
此题有争议,求共同
语言
A.样本单位数
B.抽样指标—总体参数的估计值
C.抽样误差的范围
D.概率保证程度
E.抽样标准误差
8、抽样推断中,常用的总体参数有(BD)。
A.统计量
B.总体平均数
C.总体成数
D.总体方差
E.总体标准差
9、置信度、概率度和精确关系表现在(AC)。
A.概率度增大,估计的可靠新也增大
B.概率度增大,估计的精确度下降
C.概率度缩小,估计的精确度也缩小D.概率度缩小,估计的置信度也缩小E.概率度增大,估计的可靠性缩小
10、影响抽样误差的因素有(ACE)。
A.是有限总体还是无线总体
B.是变量总体还是属性总体
C.是重复抽样还是不重复抽样
D.总体被研究标志的变异程度
E.抽样单位数的多少
三、判断题
1、典型调查、重点调查、配额调查、方便调查等都属于抽样调查。
(错)(解释:这些抽样是属于非随机抽样。
)
2、抽样调查是一个随机变量。
这种误差的平均值是可以推算的。
(对)
3、在样本容量相同的情况下,不重复抽样的平均数误差小于重复抽样的平均误差。
(对)
4、在抽样调查中,当样本单位数大于30时,该样本是一个大样本。
(错)
5、在其他条件不变的情况下,抽样极限误差范围缩小,区间估计的可靠程度降低。
(对)
6、在重复抽样的情况下,当△x缩小一半,则样本单位数n必须增加到原来样本单数的2倍。
(对)
7、测定比例方差时要首先知道成数P,如果没有进行过这方面调查,可取P=0.5。
(对)
8、当计算的抽样单位数是267.33时,应该抽取的样本单位数是267个。
(对)
9、抽样平均误差是所有样本平均数与总体平均数的标准差。
(对)
10、总体平均数(成数)落在一定区间是一个必然事件。
(错)
四、简答题
1、随机抽样最基本的组织方式有哪些?分别说明它们的主要特点。
1.答:随机抽样最基本的组织方式有哪些?分别说明他们的主要特点。
答:随机抽样的最基本的组织方式有:简单随机抽样、分层抽样、整群抽样、系统抽样。
特点:随机抽样:其特点是总体中每个单位被抽中的概率是相同的,完全由许多随机因素综合作用来决定,既排除了抽样时人的主观随意性,也排除了人的主观能动性。
分层抽样:分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
整群抽样:依据某种标准将总体划分为若干子群体,依据简单随机抽样或等距抽样或分层抽样的方法从总体中抽取一些子群体,然后由所抽中群体中的所有单位构成样本。
系统抽样:就是没有明显区别,但是按照排序的方法,把样本
分成几个小样本,因为样本间没有区别,所以研究的时候可以从一个样本中抽取一个样本,然后其他样本中也取出同样号数的样本,一起组成要研究的样本。
系统抽样最主要的特点是没有区别,分组,编号。
2、简述重复抽样与不重复抽样的区别。
2、答:重复抽样:每次从总体中抽取的样本单位,经检验之后又重新放回总
体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。
不重复抽样:每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前面已抽中过的样品单位。
总体每经一次抽样,其样品单位数就减少一个,因此每个样品单位在各次抽样中被抽中的概率是不同的。
3、简述统计误差的种类及其产生的原因。
3、答:种类:统计误差通常可以分为登记统计误差和代表性误差两大类。
所谓登记性误差就是指由于调查者或被调查者的主观原因而导致调查所得总体指标与总体实际指标之间的差异。
统计误差的成因大体可分为主观因素和客观因素两种类型。
主观因素即人的因素。
由于人的主要因素造成的统计误差具体可划分为两种,即认识误差和人为误差。
由于人们所持有的世界观不同,对客观世界的认识也不相同,这种认识上的差异就叫作认识误差;人们为了某种目的和需要,根据人的意愿对生产出来的统计产品进行故意的伪装、篡改或故意编造虚假的统计数据。
4、什么是抽样平均误差?影响其大小的因素有哪些?
抽样平均误差是指所有可能的样本指标与总体指标间的平均差异程度,即样本计量的标准差。
也称抽样分布的标准差。
影响其大小的因素:
(1)全及总体标志的变动程度
(2)样本容量n的多少
(3)抽样组织方式
(4)抽样方法
5、在确定抽样单位数时要注意哪几点?
5、答:(1) 抽样推断的可靠程度。
它与概率度t 有关。
若要求抽样的可靠程度较高,t 也较大,抽样的数目就要多数;若可靠程度要求不高,t 也较小,抽样的数目就要少些。
(2) 总体方差的大小。
若变异程度大,则需多抽取一些样本单位;若变异程度较小,则可少抽取一些。
如果总体各单位标志值相等,只抽一个样本单位即可。
(3) 抽样极限误差的大小。
即抽样推断的精确程度。
如极限误差小,即允许误差小,则需多抽取样本单位。
如果不允许有抽样误差,就只能进行全面调查。
(4) 抽样方法与组织形式。
一般在同样条件下,重复抽样需要多抽取样本,此外,抽样单位数目的多少还取决于不同的抽样组织形式。
一般分层抽样和等距抽样可以比纯随机抽样需要的样本单位数少,整群抽样比纯随机抽样需要的样本单位数多。
五、综合题
1、假定某统计总体有5000个总体单位,某被研究标志的方差为400,若要求抽样极限误差不超过3,概率保证程度为0.9545。
试问采用不重复抽样应抽取多少样本单位?
1、 解:已知N=5000
4002=σ t=2
3=∆ 求n 1
2
--==∆N n N n t t σμ 化简并解得n=172
2、一个电视节目主持人想了解观众对某个电视专题节目的喜欢情况,他用简单随机重复抽样的方法选取了5000个观众做样本,结果发现喜欢该节目的有175人。
试以95%的概率来估计观众喜欢这一专题节目的区间范围。
若该节目主持人希望估计的极限误差不超过5%,问有多大的把握程度?
解:p=n/N=175/500=7/20
因为F(t)=95%
所以t=1.96
Up=pq/N-1=[0.2×(500-175)/500]/499=0.00026
Sp ≈0.0204
△ p=1.96×0.0204=0.04
所以置信区间下限L=0.2-0.04=0.16
置信区间下限U=0.2+0.04=0.24
(2)1.96×0.0204/√根号下175×5%=34%
P233
3、用简单随机重复抽样的方法,从660个工厂中抽取33个工厂调查月产值情况,得资料如下:
试求月产值的抽样平均误差。
3、解:由题意可得
平均月产值x =
33235225915205⨯+⨯+⨯+⨯=33
3558.10≈(万元) 样本方差:2x σ 91.72)28.117128.40376.1588.672(33
1]2)358.10(2)258.10(9)158.10(20)58.10[(33
12222=+++=⨯-+⨯-+⨯-+⨯-=
抽样平均误差:49.13391
.72===n x
x u σ
4、设成人身高的打标值为165厘米。
从一批成人中用简单重复抽样的方法随机抽取7人,得身高(单位:厘米)分别为15
5、160、165、170、175、180、185。
要求:
(1)以95.45%的概率保证程度求平均身高的极限误差;
(2)以99.73%的概率保证程度求身高达标率的极限误差。
4、解:(1) f f x x ∑-∑=
)(2σ =72)5()10()15(222⨯⎥⎦⎤⎢⎣⎡-+-+- =10
71002
==n σμ=7710
由概率95.49﹪得概率度t=2
56.727710≈⨯==∆μt x
(2)由题意得身高达标人数为5,身高达标率为75
)1(p p -=σ =
)1(7575-⨯ =-
7275⨯ =
4910 n σμ= =34330
由99.73﹪概率保证得到概率度为t=3 极限误差26.0334330≈⨯==∆μt x
5、某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩作为样本进行实割实测,测得样本平均亩产400斤,方差144斤。
以95.45%的可靠性推断小麦平均亩产的区间。
5、解:由题意可知:
样本小麦平均亩产400=x (斤) 抽样平均误差2.1100
144==
=
n
x
x u σ(斤)
由于可靠程度为95.45%,对应t=2
所以抽样极限误差为x ∆=4.22.12=⨯=⨯x t μ(斤) 所以该小麦置信亩产量下、上限为:
4
.4024.24006
.3974.2400=+==-=u l
所以小麦平均亩产区间为(397.6 402.4)
6、根据历史资料,某市职工家庭年收入的标准差为250元。
现再次调查收入情况,要求在95.45%的把握度下平均年收入的允许误差不超过20元。
问用简单随机抽样的方法应抽多少户家庭调查? 6、解:因为:F(Z)=95.45
所以:Z=2
(户)
650222
22220252===∆Z χησ
答:用简单随机抽样的方法应抽650户家庭调查
7、调查一批零件的合格率,根据过去的资料,合格率为97%。
如果要求误差不超过1%,把握程度为95%,问用简单随机抽样的方法需抽多少个零件检查? 7、解:由题可知:
有把握度为95% 可知t=1.96
根据过去的资料可知:合格率P=97%,不合格率Q=3%
所以:
1118%)
1(35
%9796.12
222=⨯⨯=∆=p t n 8、某工厂有1500个工人,用简单随机不重复抽样的方法抽出50个工人作为样本,调查其工资水平,资料如下:
要求:
(1)计算样本平均数和抽样平均误差;
(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。
8、解:(1)先列表:
样本平均数即平均工资:x =∑
∑f
xf
=
50
28000
=560(元)
样本方差:б=
∑∑-f
f
)(2
X X =
50
52640
=32.45(元) 抽样平均误差:
x =
)1(2
--N n N n σ
=
)
11500501500(50
)
45.32(2
--=4.51(元)
(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间: 解:极限误差:02.951.42=⨯=⨯=∆x u t x 上极限:98.55002.9560=-=∆-=x x L 下极限:02.56902.9560=+=∆+=x x U
即以95.45%的可靠性估计该厂工人的月平均工资和工资总额区间为(550.98,569.02)
9、某商店抽出36名顾客组成一个随机样本,调查他们对某种商品的需求量。
根据以往的经验,对这种商品的需求量服从正态分布,标准差为2,从调查结果算出样本平均数为20.试求总体平均数95%的置信区间。
9、解:由题意可知:
样本平均数20=x ,标准成为2=μ,样本数36=n 所以抽样平均误差3
136
2=
=
=
n
x σ
μ 由于可靠程度为95%,对应t=1.96 所以抽样极限误差65.03
1
96.1=⨯
=⨯=∆x t x μ 所以对商品需求量的置信区间的上、下限分别为:
65
.20665.02025
.1965.020=+==-=u l
所以对商品需求量的置信区间为(19.25,20.65)
10、某学校用简单随机抽样的方法抽查10个男生,平均身高170厘米,标准差12
厘米。
问有多少把握程度估计全校男生身高介于160.5~179.5厘米之间?
解:170=x (厘米),12=σ(厘米),n=10(个)
x μ=
n
σ
=
10
127947
.3≈
因为:置信区间上限u =x x ∆+ 所以:x ∆=5.91705.179=-=-x u 又因为:x ∆=x t μ⨯ 所以:37947
.35
.9≈=
∆=
x
x
t μ 查表得:置信度为99.73%。
注:
x μ:平均误差
x ∆:极限误差。