应用统计分析复习要点和答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计分析复习要点和答案
《应用统计学》复习要点
(要求:每人携带具有开方功能的计算器)
一、名词解释
1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2.方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。
3.假设检验:是事先对总体参数或分布形式做出某种假设,然后利用样本信息来判断原假设是否成立。分为参数假设检验和非参数假设检验。一般采用逻辑上的反证法,依据统计上的小概率原理。
4.置信区间:是指由样本统计量所构成的总体参数的估计区间。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的成都。
5.置信水平:是指总体参数值落在样本统计值某一区内的概率。
6.抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。
7.方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素
方差分析和双因素方差分析。(重复啦)
8.相关分析:是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度是研究随机变量之间的相关关系的一种统计方法。
9.推断统计:是研究如何利用样本数据来推断总体特征的统计方法。包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。
二、计算题
1. 在某地区随机抽取
按利润额分组(万元)企业数(个)
300以下19
300~400 30
400~500 42
500~600 18
600以上11
合计120
计算120。
解:
2.某银行为缩短顾客到银行办理业务等待的时间,准备了两种排队方式进行试验。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5.5
6.6 6.7
6.8
7.1 7.3
7.4 7.8 7.8
(1)计算第二种排队时间的平均数和标准差。
(2)比较两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
解:
3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据如下:
3.3 3.1 6.2 5.8 2.3
4.1
4.4 2.0
5.4 2.6
6.4 1.8
2.1 1.9 1.2 5.1 4.3 4.2
4.7 1.4 1.2 2.9 3.5 2.4
5.4 3.6 4.5 0.8 3.2 1.5
3.5 0.5 5.7 3.6 2.3 2.5
和z(0.01)统计量值分别为1.65、1.96和2.58)
解:
4. 利用下面的信息,构建总体均值μ的置信区间。
(1)总体服从正态分布,且已知σ=500,n=15,=8900,置信水平为95%。(注:z统计量值为1.96)
(2)总体不服从正态分布,且已知σ=500,n=35,=8900,置信水平为95%。(注:z统计量值为1.96)
(3)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为90%。(注:z统计量值为1.65)
(4)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为99%。(注:z统计量值为2.58)
解:
5.对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。在α=0.05的显著性水平下,检验该生产商的说法是否属实?(注:z统计量值为1.96)
解:
6.一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为
7.25小时,标准差为2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.7小时。取显著性水平α=0.01,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?(注:z统计量值为1.96)
解:
7.下面是7个地区2000年的人均国内生产总值GDP(Y)和人均消费水平(X)的统计数据(注:此题对应的t统计量值为2.57
地区人均GDP
(千元)Y
人均消费水
平(千元)X
Y-E(Y) X-E(X)
(Y-E(Y))
×(X-E(X))
(X-E(X))2 (Y-E(Y))2
北京22.460 7.326 10.212 2.810 28.699 7.899 104.276
辽宁11.226 4.490 -1.022 -0.026 0.026 0.001 1.045
上海34.547 11.546 22.299 7.030 156.769 49.427 497.226
江西 4.851 2.396 -7.397 -2.120 15.679 4.493 54.722
河南 5.444 2.208 -6.804 -2.308 15.702 5.325 46.300
贵州 2.662 1.608 -9.586 -2.908 27.873 8.454 91.900
陕西 4.549 2.035 -7.699 -2.481 19.099 6.153 59.281
合计∑85.739 31.609 263.847 81.751 854.751
(1
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性。(α=0.05)
(5)如果某地区的人均GDP为5千元,预测其人均消费水平。
(6)求人均GDP为5千元时,人均消费水平95%的置信区间和预测区间。
解: