抽样推断 习题及答案

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章抽样推断习题答案
一、名词解释
用规范性的语言解释统计学中的名词。

1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。

2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。

3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。

4. 样本容量:是指样本中的总体单位数量。

5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。

这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。

6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。

7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。

8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

二、判断改错
对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。

1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。

(×)
不一定
2. 极限误差越大,则抽样估计的可靠性就越小。

(×)
越大
3. 抽样平均误差的大小与样本容量的大小成正比关系。

(×)
反比
4. 在一般的抽样推断中,抽样平均误差小于极限误差。

(×)
不一定
5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。

(×)
在其他条件相同的情况下
6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。

( ×)
不一定少
7. 正态分布总体有两个参数,一个是均值(期望值),一个是标准差,这两个参数确定以后,一个正态分布也就确定了。

( √)
8. 抽样调查就是凭主观意识,从总体中抽取部分单位进行调查。

( ×)
按照随机原则
9. 所有可能的样本平均数的平均数,等于总体平均数。

( √)
10. 抽样误差是不可避免的,但人们可以调整总体方差的大小来控制抽样误差的大小。

( ×)
样本容量的大小和抽样方法
11. 样本单位数的多少可以影响抽样误差的大小,而总体标志变异程度的大小和抽样误差无关。

( ×)
有关
12. 抽样估计中的点估计就是被估计的总体指标直接等于样本指标。

(√)
13. 抽样推断中样本指标和总体指标都是随机变量。

(×)
样本指标是随机变量,总体指标是确定性变量
14. 抽样误差是抽样推断本身所固有的,因此它是不可以避免的。

(√)
15. 抽样推断中的区间估计,是一个绝对可靠的范围。

(×)
不是
16. 抽样平均数应该是总体平均数的一个无偏估计量。

(√)
17. 抽样平均误差是随机变量。

()
不是
18. 抽样指标与被估计的总体指标之间一般存在着一定程度的离差,这种离差就是抽样误差。

(√)
19. 抽样平均误差,实质上是所有可能出现的样本指标的方差,它反映了抽样误差的一般水平。

()
标准差
20. 整群抽样一般适用于群间差异较大的总体,类型抽样适用于类内差异较大的总体。

(×)
群内,类间
21. 扩大抽样误差范围,就会降低抽样调查的精确度。

(√)
22. 按无关标志排序的等距抽样,其样本容量的确定与简单随机不重复抽样相同。

(√)
六、简答题
根据题意,用简明扼要的语言回答问题。

1.样本和总体有什么区别和联系?
【答题要点】
(1)区别:研究中实际观测或调查的一部分个体称为样本(sample),研究对象的全部称为总体。

样本单位数一般小于总体单位数。

(2)联系:样本来自于总体,样本是为了推断总体。

2.抽样平均误差、极限误差和概率度三者之间有何关系?
【答题要点】
抽样平均误差是所有样本误差的平均数,反映了抽样误差的一般水平;抽样极限误差是抽样推断中允许的最大误差范围;概率度是指在统计量分布确定的情况下,由概率所决定的常量。

抽样极限误差等于抽样平均误差乘以由概率决定的常量。

3. 区间估计为何比点估计运用广泛?
【答题要点】
点估计是指在估计总体指标时,直接用样本指标作为总体指标值。

这种方法简便、直接,但是没有考虑到估计结果的精确度和可靠性。

区间估计在估计总体指标时,构造一个区间,并且保证总体指标落在该区间有一定的概率。

它既能体现估计的精确度和结论成立的可靠度。

区间越大,则结论成立的精确度越高,反之,则越小;构造区间的置信概率越,则结论成立的可靠度越大,反之,则越小。

正是由于区间估计具有这样的特点,区间估计比点估计应用要广泛的多。

4. 怎样认识区间估计中精度和置信度的关系?
【答题要点】
(1)计量的精确度亦称准确度(Accuracy of Measurement),系指被测量的测得值之间的一致程度以及与其“真值”的接近程度,即是精密度和正确度的综合概念。

从测量误差的角度来说,精确度(准确度)是测得值的随机误差和系统误差的综合反映。

(2)置信度,是指结论成立的可靠程度。

样本一经确定,则抽样的平均误差就随之确定,抽样推断的精确度与置信度之间呈此消彼长的关系,即精确度越高,则结论成立的置信度越低;精确度越低,则结论成立的置信度越高。

5. 四种抽样组织方式各有何优点和应用条件?
【答题要点】
(1)简单随机抽样,也称纯随机抽样,是指对总体没有做任何的处理,直接按照随机原则从总体中抽取样本的一种组织方式。

该组织方式简单易行,但是要求总体是均匀分布,即总体各单位之间差异不大。

(2)分层抽样是先对总体按照一定的标志进行分层或分组,然后遵循随机原则在各层中抽取样本的一种组织方式。

分层后,总体的差异就被分解为层内差异和层间差异,此时只有层内差异影响到抽样误差,因此,这种抽样方式能充分地利用关于总体的各种信息进行分层,能显著的增强样本对总体的代表性,从而有效的减少抽样误差。

因为如此,在总体各单位差异程度较大时,应用分层抽样比较适宜。

(3)等距抽样将总体各抽样单元按一定的标志和顺序排列,按照相同的间距从总体中抽取样本单位组成样本,具有比较明确的顺序,方便寻找。

根据选择的标志是否与研究问题相关,分为有关标志排序和无关标志排序两种抽样方式。

如果是有关标志排序,等距抽样变成了特殊的分层抽样,具有分层抽样的优点和相同的应用条件;如果是无关标志排序,则等同于简单随机抽样,具有简单随机抽样的优点和同样的应用条件。

(4)整群抽样指总体分成的群进行抽样。

特点是群间差异影响抽样误差。

该抽样组织方式能大大简便抽样工作,节省经费开支。

七、论述题
根据题意回答要点,并适当从理论上进行阐述。

1.什么是随机原则?在抽样调查中为什么要遵循随机原则?
【答题要点】
(1)随机原则是指在抽样时排除主观上有意识地抽取调查单位,每个受试单位以概率均等的原则。

使每一个单位都有一定的机会被抽中。

例如可以使用随机数表等来保证随机性。

(2)为什么要遵循随机原则,这是因为:
首先,可以使抽取的样本分布最接近总体分布,从而增强样本对总体的代表性。

从总体中抽样样本时,总会存在信息的漏损而导致样本对总体代表性的不足,产生抽样误差。

遵循随机原则,就能最大限度的保证样本对总体的代表性。

其次,可以使样本的标准差最小。

构造样本推断总体统计量时,要遵循无偏性,一致性和有效性。

在随机原则上抽取的样本,由于其标准差最小,满足了样本量构造的有效性原则。

2.抽样误差受哪些因素影响?这些因素如何影响抽样误差?
【答题要点】
(1)总体单位标志值的差异程度。

差异程度愈大则抽样误差愈大,反之则愈小。

(2)样本单位数的多少。

在其他条件相同的情况下,样本单位数愈多,则抽样误差愈
小。

(3)抽样方法。

抽样的方法不同,抽样误差也不相同。

一般说,重复抽样比不重复抽样,误差要大些。

(4)抽样组织方式。

不同的组织方式具有不同的特点,可以增强样本对总体的代表性,从而有效的减少抽样误差。

3. 如何理解类型抽样与整群抽样之间的关系?
【答题要点】
类型抽样和整群抽样是两种不同的抽样调查方法,在实际工作中被广泛采用。

它们都是在分组(或分群)的基础上,利用已知信息进行抽样,提高抽样效果和节约人力、物力、财力的特点。

两者也有不同,主要表现在:
类型抽样,是将总体中所有单位按照某个标志分成若干组,然后在各组中随机抽取样本单位的一种抽样组织方式。

它是对总体在按相同水平归纳分组的基础上,再从每一组中进行抽选样本进行调查,对于每组来讲是全面调查;
整群抽样是将总体划分为由总体单位所组成的若干个群,然后按随机原则从中抽取若干个群作为样本,而对中选的群内所有单位进行全面调查的一种抽样组织方式。

它是对总体在按不同水平,但却属同一群体进行分组的基础上抽选若千个群,对抽中的群内全部单位进行调查,即属于全面调查。

类型抽样适用于类内差异较小、类间差异较大的情况,整群抽样适用于群内差异较大、群间差异较小的情况。

八、案例分析
把学习过的统计学原理与教科书中的案例内容结合起来,讨论案例后提出的问题。

案例分析:《国家统计局农调总队全国农村劳动力抽样调查简介》(见梁前德主编的《统计学》(第二版),高等教育出版社,2008年版)
问题1. 案例中采用了哪几种抽样调查方法,他们之间是如何结合的?
【答题要点】
案例中采用了多阶段抽样和等距抽样相结合,等距抽样根据不同的要求采用了半距起点的等距抽样和随机起点的对称等距抽样两种方式。

多阶段抽样是采取三阶段抽样,即省抽县,县抽村,村抽户。

除少数条件困难外,一般都实行三阶段抽样。

在各个阶段采用等距抽样方式抽出样本县、样本村和样本户。

遵循不同时期的农村特点和抽样工作要求,结合的方式不一样。

问题2. 案例中采用了哪几种提高样本代表性的方法?
【答题要点】
案例中采用了多阶段抽样、等距抽样以及样本轮换等方法来增强提高样本的代表性。

具体而言,按照目的要求,首先采用了多阶段抽样,克服省内各县、乡、村和户之间的差异。

在各个抽样阶段,使用等距抽样方法来从各阶段抽取样本县、样本乡、样本村和样本户;为提高样本的代表性,不同时期采用了半距起点等距抽样和随机起点对称等距抽样两种方式。

除此之外,还应用了样本轮换方法来提高样本的代表性。

在具体的抽样时,选用了不同的样本框作为抽样的依据。

问题3. 案例中采用了混合排队方法编制抽样框,你认为有什么优缺点? 【答题要点】
根据抽样的目的要求只能确定调查的目标总体,如何依据目标总体抽取样本单位,就需要将目标总体的所有单位集中在一个集合体内,这个集合体就是抽样框,抽样框中的单位不一定是目标总体的基本单位,但理想的抽样框要包括总体各单位,保证总体单位既不重复,也不遗漏。

案例中在从县中抽取村时,借用了按照村均粮食产量和村人均收入进行混合排队编制抽样框,抽取样本村,这样能够增加样本的代表性;但操作复杂、工作量大的问题。

九、能力训练
根据提供的训练资料和相应的训练要求,用已经学过的统计学基本原理和统计方法,分析一些具体的社会经济问题,以加深理抽样推断方法及其运用。

训练目标1
掌握抽样推断中抽样平均误差的计算分析方法。

【解答】【训练资料1】 已知 N=1500 n=50
某厂工人平均工资计算表 金额单位:元
==
∑∑
f
xf
x —
552.8(元) ∑∑
-
-=
f
f
x x s 2)(=20.4(元)
n
s =
μ=2.89(元)
【解答】【训练资料2】
已知 n=500 p=95% )1(*p p s -==21.8%
n
s p

=0.97%
训练目标2
掌握抽样推断中抽样估计的计算分析方法。

【解答】【训练资料1】 已知 N=100,000 n=400 x -
=252.4 σ=36.3
82.1==
n
σ
μ
57.3==∆μt x x x x X x ∆+≤≤∆-
因此有 252.4-3.57~252.4+3.57 (元) 即在248.83~255.97元之间。

【解答】【训练资料2】 已知 N=1385 n=50 t=1.96
工人平均月产量计算表
==
∑∑f
xf x —
76.6 ∑∑-
-=
f
f
x x s 2
)
(=1.47
n
s =
μ=2.08
=∆
-x
t
μ
=4.08
因为 x x x X x ∆+≤≤∆- 所以有 08.46.7608.46.76+≤≤-X 即在72.52~80.68件之间。

【解答】【训练资料3】 已知 N=1000 n=10 t=2
休闲食品平均每包重量计算表
==
∑∑f
xf x —
28.4 ∑∑-
-=
f
f
x x s 2
)
(=1.14
N
n
n
s x
-
=
1-
μ=0.36 72.036.02=⨯==∆x x t μ 因为 x x x X x ∆+≤≤∆- 所以有 72.04.2872.04.28+≤≤-X 即在 27.68~29.12克之间。

%101
==
n
n p %30)1(=-=p p s %49.9==
n
s μ
%98.18%49.92=⨯==∆p p t μ
因为 p p p P p μμ+≤≤-
所以有10%-18.98%≤≤P 10%+18.98% 即产品合格率为 28.98%以下。

简要分析:对某超市经销的小包装休闲食品进行重量合格抽查的数据显示,在把握程度为95.45%的情况下,平均每包的重量在27.68~29.12克之间,包装合格率仅在28.9%以下,短斤少两严重,需要及时改进。

【解答】【训练资料4】
已知 n=30 -
x =45 μ
-
x
=2
92.32
08
.4192.48=-=
∆x
μ
-
-
∆=
x
x t =1.96
查表得 α-1=95%(推断的保证程度) 【解答】【训练资料5】 已知 n=500 n 1
=175 ∆=5%
%351
==n
n p %70.47)1(=-=p p s
%13.2==
n
s μ
35.2==
-
-
∆μ
p
p
t
查表得 %12.981=-α(该节目主持人推断的置信度) 【解答】【训练资料6】 已知N=3000 n=300 t=1.96
员工生活消费情况计算分析表 金额单位:元
450==
∑∑f
xf
x —
(元)
4282
2
==
∑∑n
n s s i
i
i
19.12
==
n
s μ
33.219.196.1=⨯==∆x x t μ 因为 x x x X x ∆+≤≤∆- 所以有 33.245033.2-450+≤≤X 即在 447.67~452.33元之间。

训练目标3
掌握抽样推断中总体指标的计算分析方法。

【解答】【训练资料1】 已知 N=10000 n=1000 t=1.96
某校优秀学生计算分析表
%22==
∑∑n
n
p i
i
i p
6002
2
==
∑∑n
n s s i
i
i
%77.02
==n
s μ
%51.1%77.096.1=⨯==∆
μ
p
p
t
因为 μ
μ
P
P
p P p +
≤≤-
所以有 %51.1%22%51.1%22+≤≤-P 即优秀学生比例在20.49%~23.51%之间 因此优秀学生人数在2049~2351人之间。

【解答】【训练资料2】 已知N=2000 n=100 x -
=450 s=5 t=2
5.0==
n
s μ
μx t x -
-=∆=1 因为 x x x X x ∆+≤≤∆-
所以有 14501-450+≤≤X
即 451449≤≤X
因此2000亩小麦的总产量范围为898000~902000千克之间。

训练目标4
掌握抽样推断中样本容量的确定方法。

【解答】【训练资料1】
已知 N=1000 n=100
x -=1800 s=6 t=1 1. n s =
μ=0.6 6.0==--
∆μx x t 2. 2254.061222222=⨯==∆
σt n (只) 3. 9004.0622
2
2222=⨯==∆σt n (只) 4. 4006.06222
2222=⨯==∆σt n (只)
5. 在允许误差一定时,样本单位数与概率之间呈现正向关系,即概率越大,则抽取单位数越多,反之,则越少;若保持结论成立的概率给定时,样本单位与允许误差之间呈现反向关系,即允许误差越大,抽取单位数越少,反之,则越多。

【解答】【训练资料2】
已知
4.0=σ P=92% t=2 ∆-x =0.08 =∆p 5%
10008.04.02222222=⨯==∆
σt n (只) 11805.008
.092.02)
1(2222=⨯⨯=-=∆p p n t (只)
【解答】【训练资料3】
已知 N=10000
600=σ t=1 ∆=150
166001150100006001100002222
222222=⨯+⨯⨯⨯=+=
∆σσt t N N
n
【解答】【训练资料4】
(1)已知 N=2000 n=100。

因此,全及总体应划分为100个部分,每部分单位数为20,抽选距离为20。

(2)对2000个单位进行编号,从0001到2000号,若第1个单位编号为0010,则其它各样本单位编号依次为0030,0050,0070,依次类推;最后一个样本单位的编号应为1990。

总共可以抽到100个样本单位。

(3)抽选单位的号码如果用公式表示:
设A 为第一个单位的号码(可以1/2的抽选距离作为第一个单位的号码);
那么 抽选号码的顺序是 20⨯+i A (i= 0,1,2,3……99)。

相关文档
最新文档