统计学原理简答题和计算题综合练习题参考答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学原理简答题和计算题
综合练习及参考答案
一、简答题:
1、举例说明统计标志与标志表现有何不同?
答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。
标志表现是标志特征在各单位的具体表现,是标志的实际体现者。
标志是所要调查的项目,标志表现是调查所得到的结果。
例如:学生的“成绩”是标志,而成绩为“90”分则是标志表现。
2、简述品质标志与数量标志的区别并举例说明。
答:品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现;数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。
例如某人的“职业”是品质标志;而“工资水平”就是数量标志。
3、变量分组的种类及应用条件。
答:变量分组是指按数量标志分组,分组的种类有单项式分组和组距式分组。
由于变量有离散型和连续型之分,所以变量分组要根据变量的类型。
如果离散型变量的变量值变动幅度比较小,则采用单项式分组,如果离散型变量的变量值变动幅度很大,项数又很多,就要采用组距式分组。
而连续变量由于不能一一列举变量值,所以不能作单项式分组,只能进行组距式分组。
4、简述结构相对指标和比例相对指标有什么不同并举例说明。
答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。
比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况。
如:各工种的工人占全部工人的比重是结构相对指标。
而某地区工业企业中轻重工业比例就是比例相对指标。
5、简述调查对象、调查单位与填报单位的关系、区别并举例说明。
答:调查对象是应搜集其资料的许多单位的总体;调查对象由调查目的所决定。
调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者,是调查单位的组成要素;报告单位也叫填报单位,也是调查单位的组成要素,它是提交调查资料的单位,一般是基层企事业组织。
调查单位与填报单位有时一致,有时不一致。
例如人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人;人口普查的调查单位是每一个人;报告单位是每一户。
6、抽样误差的概念及影响其大小的因素。
答:抽样误差指由于抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
影响抽样误差大小的因素有:总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。
7、平均指数与综合指数的关系(用公式表示)
算数平均数指数=∑∑∑∑=00010
00
0p q p q p q p q k q =数量指标指数 调和平均数指数=∑∑∑∑=0
11111
111p q p q p q k p q p =质量指标指数 8、举例说明时期数列和时点数列的特点。
答:时期数列是指由反映现象在一段时期内发展过程总量的时期指标构成的动态数列。
时期数列的特点:(1)时期数列的各指标值具有连续统计的特点,(2)时期数列各指标值具有可加性的特点,(3)时期数列的各指标值的大小与所包括的时期长短有直接的关系。
例如工业生产总产值、新增人口数是时期指标。
时点数列是指由反映现象在某一瞬间总量的时点指标构成的动态数列。
时点指标的特点:(1)时点数列的各指标值不具有连续统计的特点。
(2)时点数列的各指标值不能相加。
(3)时点数列各指标值的大小与时间间隔长短无直接的关系。
例如居民年底储蓄存款余额、全国人口总数等是时点指标。
二、计算题(要求写出计算公式、计算过程,结果保留两位小数)
1、某班40名学生统计学考试成绩分别为:
68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定:60分以下为不及格,60—70分为及格,70—80分为中,80—90分为良,90—100分为优。
要求:
(1)将该班学生分为不及格、及格、中、良、优五组并编制一张次数分配表。
(2)指出分组标志、类型及分组方法;分析学生考试情况。
(3)计算该班学生平均成绩
解:(1)40名学生考试成绩次数分配表: 成绩 学生人数(人) 频率(%)
60分以下 3 7.5
60——70 6 15
70——80 15 37.5
80——90 12 30
90——100 4 10
合 计 40 100
(2)分组标志为“成绩”,其类型为“数量标志”。
分组方法为:变量分组中的组距式分组,而且是开口式分组。
该班学生的统计学考试成绩分布呈两头小、中间大的“正态分布”的形态。
(3)该班学生的平均成绩为:
7740
30804049512851575665355==⨯+⨯+⨯+⨯+⨯==∑∑f xf x (分)
2、某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为9.6件;乙组工人日产量资料如下:
要求:⑴计算乙组平均每个工人的日产量;
⑵比较甲、乙两生产小组哪个组的日产量更有代表性?
解:(1)根据所给资料列计算表如下: 序号 日产量x 工人数f xf x 2f
1 15 15 225 3375
2 25 38 950 23750
3 35 3
4 1190 41650
4 4
5 13 585 26325
合计 120 100 2950 95100
乙组平均每个工人的日产量为
50.29100
1345343538251515=⨯+⨯+⨯+⨯==∑∑f xf x (件) (2)因为乙组平均每个工人的日产量的标准差为:
99.8)1002950(10095100)(222=-=-=
∑∑∑∑f xf f f x σ(件)
甲、乙组平均每个工人的日产量的标准差系数为:
267.036
6.9===x V σ甲 305.05
.2999.8===x V σ乙 <甲V 乙V
所以甲组工人的平均日产量更有代表性。
3、甲、乙两农贸市场某农产品价格及成交量的资料如下:
试问该农产品市场哪一个市场的平均价格比较高?为什么? 解:(1)甲市场平均价格:
公斤)元/(375.145.51.5
1.51.4
2.81.21.25.5==++==∑∑x m m x
乙市场平均价格:
公斤)元/(325.143.511211.511.421.2==++⨯+⨯+⨯==∑∑f
xf x
通过计算说明,两个市场销售价格是相同的,成交量也是相同的,但甲市场的平均价格比乙市场的平均价格高。
影响到两个市场平
均价格高低不同的原因就在于各种价格的农产品在两个市场的成交
额不同。
4、某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工
人作为样本,调查其工资水平,资料如下:
月平均工资(元) 524 534 540 550 560 580 600 660 工人数(人) 4 6 9 10 8 6 4 3 要求:(1)计算样本平均数和抽样平均误差;(2)以95.45%的可靠
性估计该厂工人的月平均工资和工资总额的区间。
解:(1)计算样本平均数和抽样平均误差,列表计算如下:
月平均工资x 工人数f xf X2f 524 4 2096 1098304
534 6 3204 1710936
540 9 4860 2624400
550 10 5500 3025000
560 8 4480 2508800
580 6 3480 2018400
600 4 2400 1440000
660 3 1980 1306800
合计 50 28000 15732640
样本平均数 )(5605028000元===∑∑f
xf x 样本方差 45.325605015732640)(222=-=-=∑∑∑∑f
xf f f x σ 重复抽样: 59.45045
.32===n x σμ
(2)抽样极限误差x x t μ=∆ = 2×4.59 =9(元)
月平均产量的区间: 下限:-x △x =560-9=551(元)
上限:+x △x =560+9=569(元)
(2) 总产量的区间: ( 551×1500 ; 569×1500 )
即(826500元, 853500元)
以95.45%的概率保证,估计该厂工人的月平均工资在551元至569元之间,该厂的工资总额在82.65万元至85.35万元之间.
5、采用简单随机重复抽样的方法,在2000件产品中抽查200件,其中合格品190件.
要求:
(1)计算合格品率及其抽样平均误差
(2)以95.45%的概率保证程度(t=2)对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其概率保证程度是多少? 解: 已知: N=2000,n=200, n 1=190 z=2
(1) 样本合格率 %95200
1901===n n p
%54.1200
)95.01(95.0)1(=-=-=n p p p μ抽样平均误差 (2)按95.45%的可靠程度(t=2)对合格品和合格品数量进行区间估计
%.
08.98~%92.91%
08.3%95:%
08.3%54.12:即总体合格品率区间为抽样极限误差±=∆±=⨯==∆p p p p z μ 总体合格品数量区间为:
下限=2000×91.92%=1838 (件)
上限=2000×98.08%=1962 (件)
按95.45%的可靠程度估计,合格品率在91.92%---98.08%之间,合格品数量在1838件---1962件之间。
(3)当极限误差为2.32% 时,则概率度 5.1%54.1%31.2==∆=
p p z μ 查表可得概率保证程度F (z )=86.64%
6、在4000件成品中按不重复方法抽取200件进行检查,结果有废品8件,当概率为0.9545时,试估计这批成品废品量的范围。
解:这批产品的废品率为:%42008==
p , 废品率的平均误差为:%35.1)1()1(=--=N
n n p p p μ 废品率的极限误差为:%7.2%35.12=⨯==∆P p z μ
这批成品的废品率为:4%±2.7%,即1.3%~6.7%。
成品废品量的范围为:52~268件
7、检查五位学生统计学原理的学习时间与成绩如下表所示: 学习时数(小时) 学习成绩(分)
4 40
6 60
7 50
10 70
13 90
根据资料:
(1)建立学习成绩y 倚学习时间x 的直线回归方程,解释回归系数的含义。
(2)计算学习时数与学习成绩之间的相关系数。
解:(1)设学习成绩y 倚学习时间x 的直线回归方程为:bx a y C += ∵ n=5, ∑=++++=401310764x ,
∑=++++=3109070506040y
∑=⨯+⨯+⨯+⨯+⨯=274090137010507606404xy ,
3701310764222222=++++=∑
x 207009070506040222222=++++=∑
y 2.540
37053104027405)(222=-⨯⨯-⨯=-⋅-=∑∑∑∑∑x x n y
x xy n b 4.205
402.531051=⨯-⨯=-=x b y a
∴学习成绩y 倚学习时间x 的直线回归方程为:x y C 2.520.4+= 回归系数的含义为:学习时间每增加1小时,学习成绩将平均提高
5.2分。
(2)学习时数与学习成绩之间的相关系数为:∑∑∑∑∑∑∑-⨯--=2222)()(y y n x x n y
x xy n r
22310207005403705310
4027405-⨯⨯-⨯⨯-⨯= =96.015.1360130074002501300
==⨯ 分析相关关系:学习时数x 和成绩y 之间是高度正相关。
8、根据某企业产品销售额(万元)和销售利润率(%)资料计算出如下数据:
n=7,∑x=1890, ∑y=31.1, ∑x 2=535500, ∑y 2=174.15, ∑xy=9318 要求:(1)确定以利润率为因变量的直线回归方程;
(2)解释回归方程中回归系数的经济含义;
(3)当销售额为500万元时,利润率为多少?
解: (1) 设直线回归方程为y c =a+bx 22)(∑∑∑∑∑-⋅-=
x x n y x xy n b 0365.0189053550071.311890931872=-⨯⨯-⨯= x b y a -=41.518907
10365.01.3171-=⨯⨯-⨯= 则直线回归方程为 y c =-5.41+0.0365x
(2)回归系数b 的经济含义:当销售额每增加1万元,销售利润率增加0.0365%。
(3)当x=500万元时,利润率为:
y C =-5.41+0.0365×500=12.84%
9、有三种产品单位成本及产量资料如下: 产品名称 单位 单位成本(元/件) 产量
基期 报告期 基期 报告期
甲 件 350 320 50 60
乙 台 180 176 50 50
丙 吨 20 20 150 200
试计算三种产品的总成本指数、单位成本指数和产量指数。
解:三种产品的总成本指数=∑∑001
1p q p q
=150205018050350200205017660320⨯+⨯+⨯⨯+⨯+⨯%47.10829500
32000== 三种产品的单位成本指数=∑∑0111
p q p
q
=200205018006350200205017660320⨯+⨯+⨯⨯+⨯+⨯%94.1234000
32000== 三种产品的产量指数=∑∑0001
p q p
q %15.25129500
00043==
10、某商场三种产品价格及销售量资料如下: 产品名称 单位 价格(元) 产量
基期 报告期 基期 报告期
甲 双 20 21 30000 40000
乙 件 10 10 40000 50000
丙 只 4 4.4 20000 24000
计算:(1)个体价格指数及价格总指数
(2)销售量总指数
(3)价格和销售量共同变动影响销售额变动的绝对额。
解:(1)个体价格指数:%10520
2101===p p k p 甲 %0100
11001===p p k p 乙;%10144.401===p p k p 丙 价格总指数=∑∑011
1p q p q =24000
400050100400002004024.400050010400012⨯+⨯+⨯⨯+⨯+⨯ %103.551396000
0014456== (2)销售量总指数
=∑∑0001
p q p
q =20000
40000410030000200402400050010400002⨯+⨯+⨯⨯+⨯+⨯ %129.261080000
0013960== 价格和销售量共同变动影响销售额变动的绝对额:
(元)36560010800001445600001
1=-=-∑∑p q p q
11、某地区2002年和2000年两类商品的收购价格类指数和收购额资料如下: 商品类别 收购总额 (万元) 收购价格类指数(%) 2000年 2002年 甲 140 138.6 105 乙 60 78.4 98 试计算:
(1)收购价格总指数和由于收购价格变动而增加的收购额;
(2)收购量总指数和由于收购量变动而增加的收购额;
(3)收购额总指数及增加绝对额。
解: (1)收购价格总指数
=98
.04.7805.16.1384.786.138111
110111
++==∑∑∑∑p q k p q p q p q p =%36.102212217= 由于收购价格变动而增加的收购额:
)(52122170111万元=-=-∑∑p q p q
(2)收购量总指数=%106200
21260140212000
1==+=∑∑p q p q 由于收购量变动而增加的收购额:)(122002120001万元=-=-∑∑p q p q
(3)收购额总指数=%5.108200
217601404.786.1380011==++=∑∑p q p q 收购额增加绝对额:
)(172002170011万元=-=-∑∑p q p q
12、我国人口自然增长情况如下: (单位:万人) 年份 1995 1996 1997 1998 1999 2000 人口总数
121121 122389 123626 124810 125909 126583
比上年增加人口 — 1268 1237 1184 1099 674 计算我国在“九五”时期年平均人口数和年平均增加人口数。
解:(1)我国在“九五”时期年平均人口数为:
=124117.2(万人)
(2)我国在“九五”时期年平均增加人口数为:
(万人)4.10925
6471099118412371268=++++==∑n a a 13、某地区1994年平均人口数为120万人,2005年人口变动情况如下:
月份 1 2 5 9 11 次年1月 月初人数 122 125 132 147 151 157 计算:(1)2005年平均人口数;
(2)1994-2005年该地区人口的平均增长速度.
(3)假设从2005年起该地区人口以9‰的速度增长,则经过多少年人口将达到180万?
解:(1)2005年平均人口数∑
--++++++=f f a a f a a f a a a n n n 11232121222 2
243122
57151122151147424713213232152112521221++++⨯++⨯++⨯++⨯++⨯+=139.42(万人)
(2)1994-2005年该地区人口的平均增长速度:
%37.1%100%27.10110
21139.4211110=-=-=-=-n n a a x (3)设经过n 年人口将达到180万,由n n a a x 0
= 得:290039.01116.0009.1lg 2.139180lg lg lg 0
≈===x
a a n n 即大约经过29年人口将达到180万
14、某地区1990年底人口数为3000万人,假定以后每年以9‰的增长率增长;又假定该地区1990年粮食产量为220亿斤,要求到1995年平均每人粮食达到850斤,试计算1995年的粮食应该达到多少斤?粮食产量平均增长速度如何?
解:设人口数为a 数列,粮食产量为b 数列
(1)因为1995年该地区的人口总数: 45.3137)009.1(3000)(50=⨯==n n x a a (万人)
所以1995年的粮食应该达到:
1995年的粮食产量b n =人均产量×总人数
=850×3137.45=266.68 (亿斤)
(2)粮食产量的平均增长速度为%9.31220
68.266110=-=-=-n n b b x 即1995年的粮食应该达到266.68亿斤;粮食产量平均增长速度为
3.9%。
15、(1)某地区粮食产量2000—2002年平均发展速度是1.03%,2003—2004年平均发展速度是1.05%,2005年比2004年增长6%,试求2000—2005年6年的平均发展速度?
(2)已知2000年该地区生产总值为1430亿元,若以平均每年增长
8.5%的速度发展,到2010年生产总值将达到什么水平? 解: (1) 2000—2005年6年的平均发展速度
6123)06.1()05.1()03.1()(=∑=f f x x
%16.104277.16==
(2)已知:14300=a ,%,5.108=x n=10
到2010年生产总值将达到
==n n x a a )(01430×(1.085)10=3233.21
即到2010年生产总值将达到3233.21亿元。