统计课后作业题(哈尔滨工业大学MBA课程).
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、某大学拟从该校20 000名在校生中抽选 1 000人进行调查,以了解大学生课外生活情况。
调查项目主要包括:学生所在年级、课外时间的分配、课外活动的形式及占用时间、最喜欢
的课外活动等。
请写出这次调查的总体、样本及个体都是什么?
调查总体为该校20000名在校生;
调查样本为所抽选的1000名学生;
调查的个体为该校的每一个学生。
4、根据题3写出调查项目中的数据属于那一种测度水平
调查项目测度水平
学生所在年级定序水平的变量
课外时间的分配定距水平的变量
课外活动形式定类水平的变量
课外活动占用时间定距水平的变量
最喜欢的课外活动定类水平的变量
第二章
9、某集团公司下属40个企业,2002年的产品销售收入数据(单位:万元)如下:
152 105 117 124 119 108 97 88 129 114 105 116 115 110 123 115 100 87 107 103 103 137 119 138 92 118 120 95 142 136 127 135 117 104 125 112 146 113 108 126 要求:(1)根据上面的数据进行适当的分组,编制频数分布表,计算出累积频数和累积频率;
(2)按规定,销售收入在125万元以上为先进企业,115万元~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、
落后企业进行分组。
频数分布表
按销售额分组
企业数
(频数)
向下累计
频数
向上累计
频数
企业数
(频率)
向下累计
频率
向上累计
频率
100万元以下 5 40 5 0.125 1.000 0.125 100~110万元9 35 14 0.225 0.875 0.350 110~120万元12 26 26 0.300 0.650 0.650 120~130万元7 14 33 0.175 0.350 0.825 130~140万元 4 7 37 0.100 0.175 0.925 140万元以上 3 3 40 0.075 0.075 1.000 合计40 ———— 1.000 ————
按企业优良分组
企业优良按销售额分组
企业数
(频数)
向下累
计频数
向上累
计频数
企业数
(频率)
向下累
计频率
向上累
计频率
先进企业125万元以上11 40 11 0.275 1.000 0.275 良好企业115~125万元11 29 22 0.275 0.725 0.550 一般企业105~115万元9 18 31 0.225 0.450 0.775 落后企业105万元以下9 9 40 0.225 0.225 1.000 合计40 ———— 1.000 ————
7、甲、乙两个企业生产三种产品的单位成本和总成资料如下:
产品名称单位成本
总成本
甲企业乙企业
A 15 2100 3255
B 20 3000 1500
C 30 1500 1500
试比较哪个企业的总平均成本高并分析其原因。
解:根据甲、乙两企业的单位成本和总成本可得各产品生产数量:
产品名称单位成本
总成本产品数量
甲企业乙企业甲企业乙企业
A 15 2100 3255 140 217
B 20 3000 1500 150 75
C 30 1500 1500 50 50
由此,可得总平均成本:
产品名称
甲企业乙企业
产品数量总成本平均成本产品数量总成本平均成本
A 140 2100 15 217 3255 15
B 150 3000 20 75 1500 20
C 50 1500 30 50 1500 30
合计340 6600 19.41 342 6255 18.29
由此,看出甲企业的总平均成本高于乙企业的总平均成本,原因在于:尽管甲、乙企业的各
产品的单位成本一样,但是,由于乙企业生产A产品的数量较多,因此,在计算总平均成本时,产生的影响较大,使得乙企业的总平均成本低于甲企业的总平均成本,这说明,在用
组平均数进行平均时,其结构(该题中的生产数量)对总平均产生了影响。
8.根据下表数据评价说明甲乙两村平均产量的高低,并说明理由。
按耕作条件分组
甲村乙村
播种
面积
比重
(%)
总产量平均产量
播种
面积
比重
(%)
总产量平均产量
水田旱田650
350
65
35
260 000
70 000
400
200
675
825
45
55
276 750
185 625
410
225
合计 1 000 100 330 000 330 1 500 100 462 375 308
如果笼统的比较甲乙两村的总平均产量,则甲村的总平均产量(330)高于乙村的总平均产量(308),但是,如果按水田、旱田平均产量分别比较,乙村的平均产量(410,225)高于甲村的平均产量(400,200)。
出现这种现象的原因在于,由于对于耕作土地进行了分组
(水田、旱田),因此,在进行平均时,其结构(水旱田的比重)对总平均产生了影响,在
这里由于乙村旱田比较较大,因此,乙村的总平均产量低于甲村。
9、某百货公司6月份日销售额数据(单位:万元)如下:
257 271 272 276 292 284 297 261 268 252 281 303 238 301 273 310 274 263 240 267 322 236 280 249 265 291 269 278 258 295 要求:(1)计算该百货公司日销售额的均值、中位数和众数;
(2)计算日销售额的标准差;
解:(1)1.均值=∑日销售额/n=8223/30=274.10万元
2.由于数据n=30,经过排序可知X15=272,X16=273
所以得中位数Me=(X15+X16)/2=(272+273)/2=272.50万元
3.通过观察该组数据发现,所有数据均出现一次,所以该组数据无众数
(2)
X X-μ(X-μ)2
236 -38 1452
238 -36 1303
240 -34 1163
249 -25 630
252 -22 488
257 -17 292
258 -16 259
261 -13 172
263 -11 123
265 -9 83
267 -7 50
268 -6 37
269 -5 26
271 -3 10
272 -2 4
273 -1 1
274 0 0
276 2 4
278 4 15
280 6 35
281 7 48
284 10 98
291 17 286
292 18 320
295 21 437
297 23 524
301 27 724
303 29 835
310 36 1289
322 48 2294
∑X=8223
)
(X X 0.00
2
)
(X X 13002.70
由此可得:样本方差
2
S
2
)(X X /(n-1)= 13002.7/(30-1)=488.369 样本标准差S=)1/()(2
n X X
=
369.488=21.174
10. 对10名成年人和10名幼儿的身高(单位:
cm )进行抽样调查,结果如下
:
成年组166 169 172 177 180 170 172 174 168 173 幼儿组
68
69
68
70
71
73
72
73
74
75
要求:(1)要比较成年组和幼儿组的身高差异,应采用什么样的指标?
(2)比较分析哪一组的身高差异大。
解:(1)可以采用全距R ,平均差MAD ,方差S 2
,标准差S ,离散系数V S 来描述成年组和
幼儿组的身高差异。
描述指标
成年组
幼儿组
X
172.1 71.3
全距R
Xmax-Xmin
14 7 平均差MAD
n
X
X 3.12 2.1 方差S
2
1
2
n
X
X 17.65 6.23 标准差S
1
2
n
X
X 4.2 2.49 离散系数V S
X
S 0.024
0.035
(2)从以上结果来看,全距R ,平均差MAD ,方差S 2
,标准差S 所体现的都是成年组的
身高差异较大,但是比较均值不相同两组数据的相对离散程度时,,采用离散系数更为准确
一些,因此,从本例中可以看出,儿童组的离散系数较大,
也就是说儿童组的身高差异较大。
第五章
3、设已知某果园某种果树每株产量服从正态分布。
随机抽取6株计算其年产量(单位:kg )为222.2,190.4,201.9,204,256.1,236 试以95%的置信度,估计全部果树的平均年产量的置信区间。
解:由于n=6〈30 所以该样本服从
n-1的t 分布
X =(222.2+190.4+201.9+204+256.1+236)/6=218.43
S
=
1
2
n
X
X =24.53
又已知1-а=0.95,а=0.05查表可得t а/2(n-1)= t 0.05/2(5-1)=2.571
则μ的置信区间为(
n
S n t
X
)
1(2
/),
即(218.43±2.571×24.53/5),亦即(218.43±28.21)
从而(190.22,246.64)
所以全部果树在置信度95%的条件下,平均年产量的置信区间为190.22kg 至246.64kg 。
6、某地区共有奶牛
2500头,随机调查了几处共
400头,得出每头奶牛的平均年产奶量为
3000kg ,均方差为300,试以95%的置信度估计该地区牛奶全年总产量的置信区间。
解:
X
=3000kg ,S=300,n=400 1-а=0.95,а=0.05
因为n/N=400/2500=0.16﹥0.05,故需考虑用有限修正因子修正,查表可得z а/2= z 0.05/2=1.96,则μ的置信区间为
(12
/N
n N
n
z
X
)
即(3000±1.96×400
300
1
2500
4002500)=(3000±1.96×15×0.9165)
(3000±26.95),即(2973.05,3026.95)全年牛奶总产量的置信区间为(7432625,7567375)
7、上题中,若400头奶牛中有80%的是优等奶牛,试以95%的置信度估计全区优等奶牛的比
例的置信区间。
解:n p =400×0.8=320,n (1-p )=400×0.2=80都大于5,因为n/N=400/2500=0.16﹥0.05,故需考虑用有限修正因子修正。
所以根据公式
1
)1
(2
/N
n N n
p p z
p =1
2500
4002500400
)8.01(8.096
.18
.0=0.8±1.96×0.02×0.9167=0.8±1.96×0.02×0.9167=0.8±
0.036 即(0.764,0.836),也就是在95%的置信度区间内,全区优等奶牛的比例置信区间在(76.4%,83.6%)之间。
11、一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸的广告家庭占多大比例。
为了估计这个比例,首先要确定对多少个家庭做调查。
该公司希望以90%的置信度对这个比例作出估计,并使估计值处在真正比例附近0.04范围之内。
在一个有
15个家庭组
成的预备样本中,有35%的响应者指出他们家中某个人看过这种广告,试问应取多大的样
本。
解:由题意可得:由于预备样本中n=15,是小样本,服从二项分布,所以:
p=0.35 有
04.0p
,1-а=0.90 查表得64
.12
05
.02
z z
所以应取样本数量
383
0016
.065
.035.069.204
.0)35.01
(35.064
.1)
1
(2
2
2
22
p
p p n
z
所以应抽取的样本数量为
383人。
第六章
7、糖厂用自动打包机打包,每包标准质量是
100kg 。
每天开工后需要检验一次打包机工作
是否正常。
某日开工后测得9包质量如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5,已知包重服从正态分布,试检验该日打包机工作是否正常。
(а=0.05)解:根据题意,设:
原假设:
μ=100
备择假设:μ≠100有题中数据可知:n=9,S=99.98
S=1.212
由于n ﹤30,所以构造t 统计量:05
.0404
.002.03212
.1100
98
.99n
S X t
查表可得306
.2)
8()
19
()
1(025.02
05.02
t t n
t 因为t=-0.05﹥30.2)
8(025.0t ,
所以落在接受域内,接受原假设,拒绝备择假设,即:在95%的可靠程度内,该打包机该日的工作正常。
10、1545名男性样本与
1691名女性样本用于比较双职工家庭中男女所做家务的数量,
研究表明67.5%的男性以及60.8%的女性认为自己那份家务是公平的。
认为自己那份家务是公平的男性的比率比女性的比率大吗?试用
0.05的显著性水平检验。
解:设男性的比率为1p =67.5%
女性的比率为
2p =60.8%
根据题意,设:原假设:p 1= p 2备择假设:p 1﹥p 2
有题中可知:n 1=1545 n 2=1691 а=0.05 所以,得64
.03236
128.1028875
.10421691
1545
608
.01691675.01545
2
1
2
211n n p n p n p
构造z 统计量:
965
.30352
.036
.064
.0067.02
11
1
)(1
()21()
21(n n p p p p p p z
查表得z 0.05=1.64
由于z=3.965>z 0.05=1.64,落在拒绝域内。
所以拒绝原假设p 1= p 2,
接受备择假设
p 1﹥p 2
即在0.05的显著性水平上,认为自己那份家务是公平的男性的比率比女性的比率大。
11、某种工作的日工资为正态分布,其平均值为43.20元,标准差为 2.50元。
若从这种
工作的某家公司随机抽取40名工人并求得平均工资为42.20元,那么可用1%的显著性水平指责这家公司所支付的工资低于该行业的平均水平吗?试说明你的结果。
解:根据题意,设:原假设:μ=43.20 备择假设:μ﹤43.20 有题中可知:
20.42X
,σ=2.5,n=40
所以构造z 统计量:
53
.2395
.0140
50
.220
.4320.42n
X z
查表得z 0.01=2.330
由于z=-2.53〈-z 0.01=-2.330, 落在拒绝域内,拒绝原假设:μ=43.20
接受备择假设:μ﹤43.20
因此,在1%的显著性水平上可指责这家公司所支付的工资低于该行业的平均水平。
第八章
6、某高校教育经费(X )与高校学生人数(Y )连续六年的统计资料如下教育经费X (万元)316 343 373 393 418 455 在校学生数Y (万人)
11
16
18
20
22
25
求(1)建立教育经费与在校生人数的一元线性回归方程;解:根据资料,整理得到如下数据
教育经费X (万元)
在校学生数Y (万人)
XY X 2Y
2
1 316 11 3476 99856 121
2 34
3 16 5488 117649 256 3 373 18 671
4 139129 324 4 393 20 7860 154449 400
5 418 22 919
6 174724 484 6 455 25 11375 207025 625 合计
2298
112
44109
892832
2210
根据公式可得:
09553
.02298
89283261122298441096)
(
2
2
2
1
X X
n
Y X XY n b 92
.176
229809553
.06
1121
0n
X b n
Y b 所以求得一元线性回归方程式:
X
Y 09553.092.17(2)确定教育经费每增加一万元在校生人数变动的
95%的置信区间;
2
6
44109
09553.0112
92.1722102
1
2
n
XY
b Y b Y
S e
=0.93
6
2298892832
)()
(2
2
2
2
n
X X
X X =12698
查表,得77
.2)
4()
26
()
2(025.02
05.02
t t n
t 根据公式,可得教育经费每增加一万元在校生人数变动的95%的置信区间:
(2
2
1
)
()
2(X X
S n t b e )=
12698
93.077
.209553.0=(0.07267,0.11839)
即当教育经费每增加一万元,在校人数就平均增加727人至1184人之间,概率为95%。
(3)以90%概率估计教育经费达到480万元时在校人数的置信区间;
X 0=480,1-а=0.9
将X 0=480代入回归方程式,得:
0Y =-17.92+0.09553×
480=-17.92+45.85=27.93 查表当1-а=0.9可得:132
.2)
4()
26
()
2(05.02
1.02
t t n
t 则可得Y 0的双侧置信区间(2
20
2
)
()
(1
1
)
2(X X
X X n n
t Y )
=(
12698
94096
11
132
.293.27)=(38
.1132.293.27)
(24.99,30.87)即当教育经费达到480万元时在校人数的在
24.99万人至30.87万人之间变动,概率
为90%。
(4)对回归方程的有效性进行检验。
(а=0.1)
由以上数据,可得相关系数
}
)(}{)(
{2
2
2
2
Y Y
n X X
n
Y
X XY
n r
)
11222106)(22988928326(112
22984410962
2
=84
.73857278=0.9854
这说明X 与Y 高度相关。
在а=0.1的显著性水平下,根据题意设:原假设:ρ=0;备择假设:ρ≠0;构造t 统计量
58
.1108513
.09854
.02
69854
.019854.02
12
2
n r
r t
当а=0.1时,132
.2)4()26
()
2(05.02
1.02
t t n
t 因为t=11.58>2.132=t 0.05(4),落在拒绝域内,所以拒绝原假设,接受备择假设,即
X
与Y 具有显著线性相关系数。
9、某电器经销公司在
15个城市设有经销处,公司发现彩电销售量与该城市居民户数
多少有关系,并希望通过居民户数多少来预测其彩电销售量。
下表是有关彩电销售量与城市
户数的统计数据
城市编号
销售量(台)
户数(万户)
1 5425 189
2 6319 19
3 3 6827 197
4 7743 202
5 8365 20
6 6 8916 209
7 5970 185
8 471
9 179 9 5375 182 10 4500 175 11 3310 161 12 8239 214 13 4596 166 14 3652 163 15
4203
167
求(1)计算彩电销售量与城市居民户数之间的线性相关系数;由趋势图可得:
y = 100.19x - 12745
R 2
= 0.9423
1000
20003000400050006000700080009000100000
50100150200250
系列1
线性 (系列1)
线性回归方程:Y=100.19X-12745 线性相关系数
2
R
r =0.971
(2)拟合彩电销售量对城市居民户数的回归直线:Y=100.19X-12745
(3)决定系数R 2
=0.9423
(4)对回归方程的线性关系和回归方程进行显著性检验
(а=0.05),并对结果做简要分
析。
回归统计Multiple R 0.970735865
R Square 0.94232812 Adjusted R Square 0.937891822 标准误差448.1416242 观测值
15
方差分析
df
SS
MS
F
Significance F
回归分析 1 42659127.03 42659127.03 212.4131485
1.96804E-09
残差13 2610801.899 200830.9153
总计
14
45269928.93
第九章
10、某企业2000年各季度销售额和利润率资料如下表
季度销售额(万元)
销售利润率%
一220 32 二240 33 三250 35 四
280
36
试求2000年年平均利润率。
由题意可得,各季度利润即年度总销售额和总利润,如下表:
季度销售额(万元)
销售利润率%
利润(万元)
一220 32 70.4 二240 33 79.2 三250 35 87.5 四280 36
100.8 合计
990
337.9
由此,可得年平均利润率为=337.9/990=34.13%
12、某商店1994年商品销售额为650万元,到2000年要达到1000万元,问应以怎样的递增速度向前发展,才能达到此目标?如果照此速度向前发展,到2005年商品的销售应是多少?
解:设以每年X 的比率的速度向前发展,则
650(1+x )
(2000-1994)
= 650(1+x )6
=1000,得
1+x=1.0745 , 所以x=0.0745=7.45% 即每年以7.45%的递增速度向前发展,到
2000年可达1000万元,
到2005年销售额为:1000(1+0.0745)5=1432万元16、某商店1997-1999年各月羽绒服销售额资料如下
1
2 3 4 5 6 7 8 9 10 11 12 1997 36 15 5 0.7 0.2 0.5 0.4 0.3 4 10 30 48 1998 38 17 6 0.9 0.3 0.6 0.8 0.5 6 12 33 42 1999
40
19
6
1
0.8
0.7
1.2
1.5
10
16
40
45
解:整理得,长期趋势剔除法计算表
年份
月份
销售额
四项(季度)移
动平均移正平均Y
_
T ·C
1997
1
36.00
Coefficients
标准误差t Stat P-value Lower 95% Upper 95% 下限95.0%上限95.0%Intercept -12744.7475 1282.949373 -9.93394421 1.94295E-07 -15516.3911 -9973.10389 -15516.3911 -9973.10389
户数(万户)
100.1901766
6.874394387
14.57440045
1.96804E-09
85.3389505
115.0414028
85.3389505
115.0414028
2 15.00
3 5.00 14.18 9.70
4 0.70 5.23 3.41
5 0.20 1.60 1.03
6 0.50 0.45 0.40
7 0.40 0.35 0.83
8 0.30 1.30 2.49
9 4.00 3.68 7.38
10 10.00 11.08 15.79
11 30.00 20.50 24.75
12 38.00 29.00 29.88
1998 1 38.00 30.75 27.75
2 17.00 24.75 20.11
3 6.00 15.48 10.76
4 0.90 6.0
5 4.00
5 0.30 1.95 1.30
6 0.60 0.65 0.60
7 0.80 0.55 1.26
8 0.50 1.98 3.40
9 6.00 4.83 8.85
10 12.00 12.88 18.06
11 33.00 23.25 27.50
12 42.00 31.75 32.63
1999 1 40.00 33.50 30.13
2 19.00 26.75 21.63
3 6.00 16.50 11.60
4 1.00 6.70 4.41
5 0.80 2.13 1.53
6 0.70 0.93 0.99
7 1.20 1.05 2.20
8 1.50 3.35 5.26
9 10.00 7.18 12.03
10 16.00 16.88 22.31
11 40.00 27.75
12 45.00
季节指数计算表
月份季节变动和不规则变动(S·I)
调整前季节指数S' 调整后季节指数S 1997 1998 1999
1 ——136.94 132.78 134.86 183.01
2 ——84.52 87.86 86.19 116.97
3 51.55 55.75 51.72 53.01 71.93
4 20.51 22.50 22.66 21.89 29.71
5 19.51 23.08 52.4
6 31.68 42.99
6 125.00 100.00 70.89 98.63 133.84
7 48.48 63.37 54.55 55.47 75.27
8 12.06 14.71 28.50 18.42 25.00
9 54.24 67.80 83.16 68.40 92.82
10 63.34 66.44 71.71 67.16 91.14
11 121.21 120.00 ——120.61 163.67
12 127.20 128.74 ——127.97 173.65 合计——————884.28 1200.00 所以,调整系数
=1200%/884.28%=
1.357
调整系数乘以S',得到调整后的季节指数S,如表
第十章
12、某商业企业商品销售和价格资料如表所示
商品名称
计量单位
销售量
价格(元)
基期
报告期基期报告期甲件1200 1500 24 26 乙千克2400 2600 12 15 丙
台
560
600
86
98
根据上述资料计算(1)
三种商品拉氏销售量总指数
商品名称计量单位销售量
价格(元)销售额(元)基期q0 报告期q1 基期p0 报告期p1 p0q0 p1q1 p0q1 p1q0 甲件1200 1500 24 26 28800 39000 36000 31200 乙千克2400 2600 12 15 28800 39000 31200 36000 丙
台
560 600 86 98 48160 58800 51600 54880 合计
——
——
——
——
105760
136800
118800
122080
解:
%
33.112105760
1188000001p q p q k q
(2)
三种商品帕氏物价总指数
%
15.115118800
1368001
011q p q p k p
(3)
由于物价变动,该企业增加的商品销售额
18
1188001368001
01
1q p q p 由于价格增加了
15.15%,使销售额增加了
18000元。
13、某企业的总成本及单位成本的增长率与下降率资料如表所示
产品名称
总成本(万元)
单位成本提高(+)或降低(-)(%)
基期
报告期甲70 84 +5 乙24 38 -6 丙
12
15
-3
对该企业三种产品总成本的变化进行因素分析。
产品名称
单位成本变动指数
产量变动指数总成本变动指数基期
报告期(P1/P0) 基期报告期(Q1/Q0) 基期报告期(P1/P0) P0Q1 P1Q0 甲100 105 100 114.29 10000 12000 11428.57 10500.00 乙100 94 100 168.44 10000 15833.33 16843.97 9400.00 丙
100
97
100
128.87
10000
12500
12886.60
9700.00
合计30000.00 40333.33 41159.14 29600.00
产品名称
单位成本变动指数
产量变动指数总成本(万元)基期
报告期(P1/P0) 基期报告期(Q1/Q0) p0q0 p1q1 p0q1 p1q0 甲 1 1.05 1 1.1429 70 84 96.04 1.05 乙 1 0.94 1 1.6844 24 38 32.93 0.94 丙 1
0.97
1
1.2887
12 15 16.46 0.97 合计
106.00
137.00
145.43
2.96
总成本变动指数= 1.344 总成本变动的绝对额= 31.000 产量变动影响程度= 1.372 产量变动影响绝对额= 39.43 单位成本变动影响程度= 0.980 单位成本变动影响绝对额=
-8.43 影响因素综合分析
1.344=
1.344 = 1.372*0.980 即
31
=
-8.43+39.43。