应用统计分析复习要点和答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《应用统计学》复习要点
(要求:每人携带具有开方功能的计算器)
一、名词解释
(重复啦)
二、计算题
1. 在某地区随机抽取
计算120。解:
2.某银行为缩短顾客到银行办理业务等待的时间,准备了两种排队方式进行试验。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5.5
6.6 6.7
6.8
7.1 7.3
7.4 7.8 7.8
(1)计算第二种排队时间的平均数和标准差。
(2)比较两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
解:
3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据如下:
3.3 3.1 6.2 5.8 2.3
4.1
4.4 2.0
5.4 2.6
6.4 1.8
2.1 1.9 1.2 5.1 4.3 4.2
4.7 1.4 1.2 2.9 3.5 2.4
5.4 3.6 4.5 0.8 3.2 1.5
3.5 0.5 5.7 3.6 2.3 2.5
z(0.01)统计量值分别为1.65、1.96和2.58)
解:
4. 利用下面的信息,构建总体均值μ的置信区间。
(1)总体服从正态分布,且已知σ=500,n=15,=8900,置信水平为95%。(注:z统计量值为1.96)
(2)总体不服从正态分布,且已知σ=500,n=35,=8900,置信水平为95%。(注:z统计量值为1.96)
(3)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为90%。(注:z统计量值为1.65)
(4)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为99%。(注:z统计量值为2.58)
解:
5.对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。在α=0.05的显著性水平下,检验该生产商的说法是否属实?(注:z统计量值为1.96)
解:
6.一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为
7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.7小时。取显著性水平α=0.01,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?(注:z统计量值为1.96)
解:
7.下面是7个地区2000年的人均国内生产总值GDP(Y)和人均消费水平(X)的统计数据(注:此题对应的t统计量值为2.57
地区人均GDP
(千元)Y
人均消费水
平(千元)X
Y-E(Y) X-E(X)
(Y-E(Y))
×(X-E(X))
(X-E(X))2 (Y-E(Y))2
北京22.460 7.326 10.212 2.810 28.699 7.899 104.276
辽宁11.226 4.490 -1.022 -0.026 0.026 0.001 1.045
上海34.547 11.546 22.299 7.030 156.769 49.427 497.226
江西 4.851 2.396 -7.397 -2.120 15.679 4.493 54.722
河南 5.444 2.208 -6.804 -2.308 15.702 5.325 46.300
贵州 2.662 1.608 -9.586 -2.908 27.873 8.454 91.900
陕西 4.549 2.035 -7.699 -2.481 19.099 6.153 59.281
合计∑85.739 31.609 263.847 81.751 854.751
(1
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性。(α=0.05)
(5)如果某地区的人均GDP为5千元,预测其人均消费水平。
(6)求人均GDP为5千元时,人均消费水平95%的置信区间和预测区间。
解:
8.随机抽取7家超市,得到其广告费支出(X)和销售额(Y)数据如下:
超市销售额
(万元)Y
广告费支出
(万元)X
Y-E(Y) X-E(X)
(Y-E(Y))
×(X-E(X))
(X-E(X))2 (Y-E(Y))2
A 19 1 -23 -7.143 164.286 51.020 529
B 32 2 -10 -6.143 61.429 37.735 100
C 44 4 2 -4.143 -8.286 17.163 4
D 40 6 -2 -2.143 4.286 4.592 4
E 52 10 10 1.857 18.571 3.449 100
F 53 14 11 5.857 64.429 34.306 121
G 54 20 12 11.857 142.286 140.592 144
合计∑294 57 447 288.857 1002
(1
(2)广告费用支出作自变量,销售额作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性。(α=0.05)
(5)如果某超市的广告费用支出为5万元,预测其销售额。
(6)求广告费用支出为5万元时,超市销售额95%的置信区间和预测区间。
Coefficients 标准误差t Stat P-value Lower 95% Upper 95% 下限 95% 上限95% Intercept 29.39911 4.807253 6.115573 0.001695 17.04167 41.75655 17.04167 41.75655 X Variable1 1.547478 0.463499 3.338688 0.020582 0.356016 2.738939 0.356016 2.738939