统计学习题1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章统计数据的描述
练习:
2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果
如下:
700 716 728 719 685 709 691 684 705 718
706 715 712 722 691 708 690 692 707 701
708 729 694 681 695 685 706 661 735 665
668 710 693 697 674 658 698 666 696 698
706 692 691 747 699 682 698 700 710 722
694 690 736 689 696 651 673 749 708 727
688 689 683 685 702 741 698 713 676 702
701 671 718 707 683 717 733 712 683 692
693 697 664 681 721 720 677 679 695 691
713 699 725 726 704 729 703 696 717 688
(1)利用计算机对上面的数据进行排序;
(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;
(3)绘制茎叶图,并与直方图作比较。
2.2某百货公司6月份各天的销售额数据如下(单位:万元):
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
(1)计算该百货公司日销售额的均值、中位数和四分位数;
(2)计算日销售额的标准差。
2.3在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元)企业数(个)
200~300 19
300~400 30
400~500 42
500~600 18
600以上11
合计120
计算120家企业利润额的均值和标准差。
答案
2.1 (1)排序略。
(2)频数分布表如下:
100只灯泡使用寿命非频数分布
按使用寿命分组(小时)灯泡个数(只)频率(%)
650~660 2 2
660~670 5 5
670~680 6 6
680~690 14 14
690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计
100
100
直方图(略)。
2.2L U (2) 17.21=s (万元)。
2.3 x =426.67(万元);48.116=s (万元)。
第3章 概率与概率分布
练习:
3.6某企业决策人考虑是否采用一种新的生产管理流程。
据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。
该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。
问该企业决策者会倾向于如何决策? 答案
3.6这是一个计算后验概率的问题。
设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。
P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:
6115
.050612.030951
.0)|()()|()()|()()|(===
A B P A P A B P A P A B P A P B A P +
决策者会倾向于采用新的生产管理流程。
第4章 抽样与抽样分布
练习:
4.1 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴ 给出x 的抽样分布(重复抽样)的均值和标准差
⑵ 描述x 的抽样分布的形状。
你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。
⑷ 计算标准正态z 统计量对应于23=x 的值。
4.4 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。
⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远?
⑶ 为了回答b 你必须要知道μ吗?请解释。
4.6 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。
1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。
假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。
又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。
⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。
特别说明x 服从怎样
的分布以及x 的均值和方差是什么?证明你的回答; ⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率
呢?在209美元和217美元之间的概率呢?
4.7 技术人员对奶粉装袋过程进行了质量检验。
每袋的平均重量标准为406=μ克、标准
差为1.10=σ克。
监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。
现考虑这36袋奶粉所组成样本的平均重量x 。
(1)描述x 的抽样分布,并给出x μ和x σ的值,以及概率分布的形状;
(3) 假设某一天技术人员观察到8.400=x ,这是否意味着装袋过程出
现问题了呢,为什么? 答案
4.1 ⑴ 20, 2; ⑵ 近似正态; ⑶ -2.25; ⑷ 1.50。
4.4 ⑴ 101, 99 ⑵ 1 ; ⑶ 不必。
4.6 ⑴ 正态分布, 213, 4.5918; ⑵ 0.5, 0.031, 0.938。
4.7 ⑴ 406, 1.68, 正态分布; ⑵ 0.001; ⑶是,因为小概率出现了。
第5章 参数估计
练习:
2.1 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少?
2.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客
组成了一个简单随机样本。
(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;
(3) 如果样本均值为120元,求总体均值95%的置信区间。
2.3 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽
取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
2.4 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视
机。
其中拥有该品牌电视机的家庭占23%。
求总体比率的置信区间,置信水平分别为90%和95%。
2.5 根据以往的生产数据,某种产品的废品率为2%。
如果要求95%的置信区间,若要求允
许误差不超过4%,应抽取多大的样本? 答案
5.1 (1)79.0=x σ;(2)E =1.55。
5.2 (1)14.2=x σ;(2)E =4.2;(3)(115.8,124.2)。
5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4 (18.11%,27.89%);(17.17%,22.835)。
5.5
48。
第6章 假设检验
练习:
6.1 某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。
研究人
员测得了100个关于新纤维的强度数据,发现其均值为6.35。
假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。
a) 选择检验统计量并说明其抽样分布是什么样的? b) 检验的拒绝规则是什么? c) 计算检验统计量的值,你的结论是什么?
6.2 一项调查显示,每天每个家庭看电视的平均时间为
7.25个小时,假定该调查中包括了
200个家庭,且样本标准差为平均每天2.5个小时。
据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平α=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?
6.3 一个著名的医生声称有75%的女性所穿鞋子过小,一个研究组织对356名女性进行了
研究,发现其中有313名妇女所穿鞋子的号码至少小一号。
取α=0.01,检验如下的假设:
75.0:0=πH 75.0:1≠πH 对这个医生的论断你有什么看法?
6.4 一个视频录像设备(VCR )的平均使用寿命为6年,标准差为0.75年,而抽选了由30
台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。
试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差。
并在α=0.05的显著性水平下做出结论。
答案
6.1 (1)检验统计量
n s x z /μ
-=
,在大样本情形下近似服从标准正态分布;
(2)如果05.0z z >,就拒绝0H ;
(3)检验统计量z =2.94>1.645,所以应该拒绝0H 。
6.2 z =3.11,拒绝0H 。
6.3 z =
7.48,拒绝0H 。
6.4
2χ=206.22,拒绝0H 。
第7章 方差分析与试验设计
练习:
7.1 从三个总体中各抽取容量不同的样本数据,得到如下资料。
检验3个总体的均值之间
是否有显著差异?(α=001.)
样本1 样本2 样本3 158 148 161 154 169
153 142 156 149
169 158 180
7.2 某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货,为
比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)
试分析三个企业生产的电池的平均寿命之间有无显著差异?(=005.)如果有差异,用LSD 方法检验哪些企业之间有差异? 答案
7.1 0215.86574.401.0=<=F F (或01.00409.0value =>=-αP ),不能拒绝原假设。
7.2 8853.30684.1705.0=>=F F (或05.00003.0value =<=-αP ),拒绝原假设。
85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设; 85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;
85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。
第8章 相关与回归分析
练习:
8.1 表中是道琼斯工业指数(DJIA )和标准普尔500种股票指数(S&P500)1988年至
计算两种指数收益率的相关系数,分析其相关程度,以0.05的显著性水平检验相关系数的显著性。
8.4美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street
(1)画出这些数据的散点图;
(2)根据散点图。
表明二变量之间存在什么关系?
(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程; (4)对估计的回归方程的斜率作出解释;
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
8.5 表中是1992年亚洲各国人均寿命(y )、按购买力平价计算的人均GDP (1x )、2x 3x
资料来源:联合国发展规划署《人的发展报告》
(1)用多元回归的方法分析各国人均寿命与人均GDP 、成人识字率、一岁儿童疫苗接种率的关系;
(2)对所建立的回归模型进行检验。
答案
8.1(1)利用Excel 计算结果可知,相关系数为 0.948138XY r =,说明相关程度较高。
(2)计算t 统计量
2.681739
8.436851
0.317859t =
=
=
=
给定显著性水平=0.05,查t 分布表得自由度n -2=10-2=8的临界值2t α为2.306,
显然t t α>,表明相关系数 r 在统计上是显著的。
8.4 (1)数据散点图如下:
(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。
(3)设投诉率为Y ,航班正点率为X
建立回归方程 12i i i Y X u ββ=++ 估计参数为 ^
6.01780.07i i Y X =-
(4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。
(5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为:
4187.08007.00178.6ˆ=⨯-=i Y (次/10万)
8.5 由Excel 回归输出的结果可以看出:
(1)回归结果为
^
23332.993090.0716190.1687270.179042i i i i Y X X X =+++
(2)由Excel 的计算结果已知:1234,,,ββββ对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值0.025(224) 2.101t -=,所以各个自变量都对Y 有明显影响。
由F=58.20479, 大于临界值0.05(41,224) 3.16F --=,说明模型在整体上是显著的。
第9章 时间序列分析
练习:
9.2 某地区社会商品零售额1988—1992年期间(1987年为基期)每年平均增长10%,1993—1997年期间每年平均增长8.2%,1998—2003年期间每年平均增长6.8%。
问2003年与1987年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997年社会商品零售额为30亿元,按此平均增长速度,2004年的社会商品零售额应为多少?
9.4 某公司近10年间股票的每股收益如下(单位:元):
0.64,0.73,0.94,1.14,1.33,1.53,1.67,1.68,2.10,2.50 (1)分别用移动平均法和趋势方程预测该公司下一年的收益;
(2)通过时间序列的数据和发展趋势判断,是否是该公司应选择的合适投资方向?
(2)拟合线性模型测定长期趋势; (3)预测2004年各季度鲜蛋销售量。
答案 9.1
(1)以1987年为基期,2003年与1987年相比该地区社会商品零售额共增长:
%86.2313186.213186.31%)8.61(%)2.81(%)101(5
55==-=-+⨯+⨯+ (2)年平均增长速度为
1%)8.61(%)2.81(%)101(15
555-+⨯+⨯+=0.0833=8.33%
(3) 2004年的社会商品零售额应为
509.52)0833.01(307=+⨯(亿元)
9.2
(1)用每股收益与年份序号回归得^
0.3650.193t Y t =+。
预测下一年(第11年)的每
股收益为488.211193.0365.0ˆ
11=⨯+=Y 元
(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。
是一个较为适合的投资方向。
(2)t T t ⨯+=63995
.09625.8 (3)趋势剔出法季节比例计算表(一)
上表中,其趋势拟合为直线方程t T t ⨯+=63995
.09625.8。
根据上表计算的季节比率,按照公式KL t t t S T Y -⋅=计算可得: 2004年第一季度预测值:
7723.21097301.1)1763995.09625.8(ˆˆˆ11717=⨯⨯+=⋅=S T Y
2004年第二季度预测值: 49725.23147237.1)1863995.09625.8(ˆˆˆ21818=⨯⨯+=⋅=S T Y 2004年第三季度预测值: 009.18852641.0)1963995.09625.8(ˆˆˆ3
1919=⨯⨯+=⋅=S T Y 2004年第四季度预测值:
6468.19902822.0)2063995.09625.8(ˆˆˆ42020=⨯⨯+=⋅=S T Y。