华南理工2020统计学原理平时作业答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020统计学作业题
一、计算题
1、为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,得样本均值为6.5小时,样本标准差为2.5小时。 (1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。 (2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,建立年龄在20岁以下的网络用户比例的置信区间?(注:96.1025.0=z ,645
.105.0=z )
解:(1)、已知N=225, 1-α=95%, Z α/2=1.96, -x =6.5,Ó=2.5 网络用户每天平均上网时间的95%的置信区间为: 33
.05.62255
.296.15.62/±=⨯±=±n s z x a =(6.17,6.83)
(2)、样本比例:P=90/225=0.4;年龄20岁以下的网络用户比例的置信区间为: 064
.04.0225)
4.01(4.096.14.0)1(2/±=-⨯±=-±n p p Z P a 即(33.6%,46.4%)
2、一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,制造商能否根据这些数据作出验证,产品同他所说的标准相符?(α = 0.05,t α(19)=1. 7291)
解:H0: m ≥ 40000 H1: m < 40000 a = 0.05 df = 20 - 1 = 19 临界值:
检验统计量:
894
.020500040000410000=-=-=
n
s x t μ
决策: 在a = 0.05的水平上不能拒绝H0
结论:有证据表明轮胎使用寿命显著地大于40000公里
3、拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?(已知:z α/2=1.96)
答:已知σ=2000,E=400,α=1-0.95=0.05,从而z α/2=1.96。因此,
。即应抽取97人作为样本。
4、某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。(已知:z α/2=1.96)
解:已知100n =,2 1.96
z α=,
65
65%100p =
= 2分
根据公式得:
2
65% 1.96p Z α±=± 4分
即65%±9.35%=(55.65%,74.35%),95%的置信水平下估计该城市下岗职工中女性所占比例的置信区间为55.65%~74.35%。
5、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100
克。现从
某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得样本均值为:
32.101=x 克,样本标准差为:634.1=s 克。假定食品包重服从正态分布,96
.1205.0=z ,
=
05.0z 1.64,05.0=α,要求:
(1) 确定该种食品平均重量95%的置信区间。
(2) 采用假设检验方法检验该批食品的重量是否符合标准要求?(写出检
验的具体步骤)。
解:(1)已知:50=n ,
96
.105.0=z 。
样本均值为:
32.101505066
1
==
=
∑=n
f M
x k
i i
i
克,
样本标准差为:
634.14988
.1301
)(1
2==
--=
∑=n f x M
s k
i i
i
克。
由于是大样本,所以食品平均重量95%的置信区间为:
453
.032.10150634
.196.132.1012±=⨯±=±n s z x α
即(100.867,101.773)。
(2)提出假设:100
:0=μH ,100:1≠μH
计算检验的统计量:712
.550634.110032.1010=-=-=n s x z μ
由于96.1712.5205.0=>=z z ,所以拒绝原假设,该批食品的重量不符合标准要求。
二、分析题
1、控制不良贷款的办法
一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据
用excel中“数据分析”工具中的“回归”分析得到以下结果。
SUMMARY OUTPUT
回归统计
Multiple R 0.843571
R Square 0.711613
Adjusted R Square 0.699074
标准误差 1.979948
观测值25
方差分析
df SS MS F
回归分析 1 222.486 222.486 56.75384
残差23 90.16442 3.920192
总计24 312.6504
Coefficients 标准误差t Stat P-value Intercept -0.82952 0.723043 -1.14726 0.263068
各项贷款余额(亿元)0.037895 0.00503 7.533515 1.18E-07 请利用以上结果:
1)写出回归直线方程。
解:写出回归直线方程。回归方程为:y=-0.8295+0.037895x
2)对回归方程进行拟合优度检验。
方法一:判定系数r2
判定系数的实际意义是:在不良贷款取值的变差中,有71.16%可以由不良贷款与贷款余额之间的线性关系来解释,或者说,在不良贷款取值的变动中,有71.16%是由贷款余额所决定的。也就是说,不良贷款取值的差异有2/3以上是由贷款余额决定的。可见不良贷款与贷款余额之间有较强的线性
3)对方程进行显著性检验(总体模型检验及回归系数检验)。
对方程进行显著性检验(总体模型线性关系检验及回归系数检验, =0.05
总体模型检验:
步骤一,提出假设:H0:b1=0H1:b1≠0步骤二,确定合适的统计量和抽样分布。因为对总体模型进行检验,所以用F检验。
2、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下: