统计学贾俊平课后习题答案完整版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学贾俊平课后习题
答案
HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】
附录:教材各章习题答案
第1章统计与统计数据
1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)
分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家
庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者
的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示
2.1(1)属于顺序数据。
(2)频数分布表如下
(4)帕累托图(略)。
2.2(1)频数分布表如下
2.3频数分布表如下
2.5(1)排序略。
(2)频数分布表如下
2.6
(3)食品重量的分布基本上是对称的。
2.7
2.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10
A 班分散,
且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量
3.1
(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2
(1)
19
0=M ;
23
=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
(2)Q L =;Q U =。
(3)17.21=s (万元)。
3.5 甲企业平均成本=(元),乙企业平均成本=(元);原因:尽管两
个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3.6
(1)x =(万元);48.116=s (万元)。
(2)203.0=SK ;688.0-=K 。
3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相
同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
3.8
(1)女生的体重差异大,因为女生其中的离散系数为大于男生体重的离散系数。
(2) 男生:x =(磅),27.2=s (磅); 女生:x =(磅),27.2=s (磅); (3)68%;
(4)95%。
3.9
通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中该应
试者比平均分数高
出1个标准差,而在B 项测试中只高出平均分数个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。
3.10 通过标准化值来判断,各天的标准化值如下表
日期 周一 周二 周三 周四 周五 周六 周日
标准化值Z 3 0
周一和周六两天失去了控制。
3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:024.01.1722
.4==s v ;
幼儿组身高的离散系数:032.03
.713
.2==s v ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
3.12
3.13 第4章 抽样与参数估计
4.1 (1)200。
(2)5。
(3)正态分布。
(4))1100(2-χ。
4.2 (1)32。
(2)。
4.3 。
4.4 (1))2,17(~225N x 。
(2))1,17(~100N x 。
4.5 (1)。
(2),,。
4.6 (1)。
(2) 。
(3)正态分布。
4.7 (1),,,016。
(2)当样本量增大时,样本比例的标准差越来越小。
4.8 (1)14.2=x σ;(2)E =;(3)(,)。
4.9 (87819,121301)。
4.10 (1)81±;(2)81±;(3)81±。
4.11 (1)(,);(2)(,);(3)(,)
4.12 (1)(8687,9113);(2)(8734,9066);(3)(8761,
9039);(4)(8682,9118)。
4.13 (,);,;,。
4.14 (,)。
4.15 (,)。
4.16 (1)(,);(2)中心极限定理。
4.17 (1)(,);(2)(,)。
4.18 (,)。
4.19 (,)。
4.20 (1)(,);(2)(,);(3)(,)。
4.21 (%,%);(%,)。
4.22 167。
4.23 (1)2522;(2)601;(3)268。
4.24 (1)(%,%);(2)36。
4.25 (1)(,);(2)(,);(3)(,)。
4.26 (1)(,);(2)(,);(3)第一种排队方式更好。
4.27 48。
4.28 139。
第5章 假设检验
5.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前
提高了”,所以原假设与备择假设应为:1035:0≤μH ,1035:1>μH 。
5.2 π=“某一品种的小鸡因为同类相残而导致的死亡率”,04.0:0≥πH ,
04.0:1<πH 。
5.3 65:0=μH ,65:1≠μH 。
5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60
克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
5.5 (1)检验统计量n
s x z /μ-=
,在大样本情形下近似服从标准正态分布;
(2)如果05.0z z >,就拒绝0H ;
(3)检验统计量z =>,所以应该拒绝0H 。
5.6 z =,拒绝0H 。
5.7 66.1=t ,不拒绝0H 。
5.8 39.2-=z ,拒绝0H 。
5.9 04.1=t ,不拒绝0H
5.10 44.2=z ,拒绝0H 。
5.11 z =,不拒绝0H 。
5.12 z =,拒绝0H 。
5.13 2χ=,拒绝0H 。
5.14 42.2=F ,拒绝0H 。
第6章 方差分析
6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假
设。
6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。
6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。
6.4 6823.3755
7.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。
6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。
85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设; 85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设; 85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。
6.6
554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假
设。
第7章 相关与回归分析
7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)920232.0=r 。
(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显着。
7.2 (1)散点图(略)。
(2)8621.0=r 。
7.3 (1)0
ˆβ表示当0=x 时y 的期望值。
(2)1
ˆβ表示x 每变动一个单位y 平均下降个单位。
(3)7)(=y E 。
7.4 (1)%902=R 。
(2)1=e s 。
7.5 (1)散点图(略)。
(2)9489.0=r 。
(3)x y 00358.01181.0ˆ+=。
回归系数00358.0ˆ1
=β表示运送距离每增加1公里,运送时间平均增加天。
7.6 (1) 散点图(略)。
二者之间为高度的正线性相关关系。
(2)998128.0=r ,二者之间为高度的正线性相关关系。
(3)估计的回归方程为:x y 308683.06928.734ˆ+=。
回归系数308683.0ˆ1
=β表示人均GDP 每增加1元,人均消费水平平均增加元。
(4)判定系数996259.02=R 。
表明在人均消费水平的变差中,有%是由人均
GDP 决定的。
(5)检验统计量61.6692.1331=>=αF F ,拒绝原假设,线性关系显着。
(6)1078.22785000308683.06928.734ˆ5000=⨯+=y
(元)。
(7)置信区间:[,];预测区间:[,]。
7.7 (1) 散点图(略),二者之间为负的线性相关关系。
(2)估计的回归方程为:x y 7.41892.430ˆ-=。
回归系数7.4ˆ1
-=β表示航班正点率每增加1%,顾客投诉次数平均下降次。
(3)检验统计量3060.2959.42=>=αt t (P-Value=<05.0=α),拒绝原假
设,回归系数显着。
(4)1892.54807.41892.430ˆ80=⨯-=y
(次)。
(5)置信区间:(,);预测区间:(,)。
7.8 Excel 输出的结果如下(解释与分析请读者自己完成)
Multiple R R Square Adjusted R Square 标准误差 观测值 20 方差分析 df SS MS F Significance F 回归分析 1 残差 18 总计 19
Coefficients 标准误差
t Stat
P-value
Lower 95%
Upper 95%
Intercept X Variable 1
7.9
(2)%60.868660.067
.16428662====SST R 。
表明汽车销售量的变差中
有%是由于广告费用的变动引起的。
(3)9306.08660.02===R r 。
(4)x y 420211.16891.363ˆ+=。
回归系数420211.1ˆ1
=β表示广告费用每增加一个单位,销售量平均增加个单位。
(5)Significance F =<05.0=α,线性关系显着。
7.10 x y
3029.26254.13ˆ+=;%74.932=R ;8092.3=e s 。
7.11 (1)27。
(2)。
(3)拒绝0H 。
(4)7746.0-=r 。
(5)拒绝0H 。
7.12 (1)05.18)(95.15≤≤y E 。
(2)349.19651.140≤≤y 。
7.13 x y
24.1529.46ˆ+-=;045.685)(555.44140≤≤y E 。
7.14 21928.10497.003.25ˆx x y
+-=;预测。
7.15 (略)。
7.16 (1)显着。
(2)显着。
(3)显着。
7.17 (1)16039.16377.88ˆx y
+=。
(2)213010.12902.22301.83ˆx x y
++=。
(3)不相同。
方程(1)中的回归系数6039.1ˆ1=β表示电视广告费用每增加1万元,月销售额平均增加万元;方程(1)中的回归系数2902.2ˆ1
=β表示在
报纸广告费用不变的条件下,电视广告费用每增加1万元,月销售额平均增加万元。
(4)%91.912=R ;%66.882=a
R 。
(5)1β的P-Value=,2β的P-Value=,均小于05.0=α,两个回归系数均显着。
7.18 (1)216717.3273865.225910.0ˆx x y
++-= (2)回归系数3865.22ˆ1
=β表示降雨量每增加1毫mm ,小麦收获量平均增加hm 2;回归系数6717.327ˆ2
=β表示温度每增加1C 0,小麦收获量平均增加mh 2。
(3)可能存在。
7.19 (1)3211350.08210.08147.07005.148ˆx x x y
+++=。
(2)%75.892=R ;%83.872=a
R 。
(3)Significance F =<05.0=α,线性关系显着。
(4)1β的P-Value=>05.0=α,不显着;2β的P-Value=<05.0=α,显着;3β的P-Value=>05.0=α,不显着。
第8章 时间序列分析和预测
8.1 (1)时间序列图(略)。
(2)%。
(3)(亿元)。
8.2 (1)时间序列图(略)。
(2)(公斤/公顷)。
(3)3.0=α时的预测值:18.13802001=F ,误差均方=291455; 5.0=α时的预测值:23.14072001=F ,误差均方=239123。
5.0=α更合适。
8.3 (1)3期移动平均预测值=(万元)。
(2)3.0=α时的预测值:95.56719=F ,误差均方=; 4.0=α时的预测值:
06.59119=F ,误差均方=;5.0=α时的预测值:54.60619=F ,误差均方=50236。
5.0=α更合适
(3)趋势方程t Y t
9288.2173.239ˆ+=。
估计标准误差6628.31=Y s 。
8.4 (1)趋势图(略)。
(2)趋势方程t t
Y 16077.178.145ˆ⨯=。
2001年预测值=(亿元)。
8.5 (1)趋势图(略)。
(2)线性趋势方程t Y
9495.135202.69ˆ+=,2000年预测值=(万吨)。
8.6 线性趋势:t Y
6137.01613.374ˆ-=;二次曲线:20337.08272.16442.381ˆt t Y
+-=;三次曲线:320036.01601.00030.15617.372ˆt t t Y
+-+=。
8.7 (1)原煤产量趋势图(略)。
(2)趋势方程20309.09674.05824.4ˆt t Y t -+=,预测值28.11ˆ2001
=Y (亿吨)。
8.8 (1)图形(略)。
(2)移动平均法或指数平滑法。
(3)移动平均预测=(万元);指数平滑法预测=(万元)( 4.0=α)。
8.9 (1)略。
计算趋势:分离季节因素后的趋势方程为:t Y t
7064.16392.2043ˆ+=。
图形(略)
周期波动图(略)。
8.11 各月季节指数如下
1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月
季节变动图(略)。
计算趋势:分离季节因素后的趋势方程为:t Y t
42449.0159.119ˆ+=。
图形(略)。
周期波动图(略)。
随机波动图(略)。
第9章 指数
9.1 (1)%80.110=v 。
(2)%46.122=p I 。
(3)%48.90=q I 。
(4)13920
元=26190元-12270元。
9.2 (1)%。
(2)%。
(3)%。
(4)万元=万元+万元。
9.3 (1)%;8016元。
(2)%;124864元。
(3)%;132880元。
9.4 (1)单位成本增长%。
(2)%11.111=p I ;%91.90=q I 。
9.5 结果如下表:
年份
缩减后的人均GDP 1990 1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
9.6 %52.98=p I ,下跌%。