统计学第三版课后习题答案_高等教育出版社
统计学(第三版课后习题答案
![统计学(第三版课后习题答案](https://img.taocdn.com/s3/m/f910fd33647d27284b7351b1.png)
Hah 和网速是无形的1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.02.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组 天数(天)-25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 L U 。
(2)17.21 s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
《统计学》第三版习题答案
![《统计学》第三版习题答案](https://img.taocdn.com/s3/m/2db1635f5acfa1c7ab00cc1a.png)
《统计学》第4章习题参考答案与答疑答案与答疑加入时间:2008-10-21 17:53:07点击:10494.1 (1)M o=10(台);Me=10(台);Mean=9.6(台)(2)Q L=5.5 ;Q U=12(3)s=4.2(台)(4)左偏分布4.2 (1)M o=19(岁);M o=23(岁);Me=23(岁)(2)Q L=19; Q U=26.5(3)Mean=24(岁);s=6.65(岁)(4)SK=1.08;KU=0.77(5)样本数据的均值为24岁,但标准差较大,说明网民年龄之间差异较大.从偏态和峰度系数来看,网民年龄呈现右偏尖峰分布.4.3 (1)略;(2)Mean=7(分钟); s=0.714(分钟)(3)由于均值不同,采用V进行比较:V1=0.274,V2=0.102(4)选择第二种(Mean小,V2<V1)分类变量4.4 (1)Mean=274.1(万元);(2)略;(3)s=21.174.5 Mean甲=19.41(元);Mean乙=18.29(元);由于单位成本较低的产品在乙企业中占的比重比较大,拉低了总平均成本.4.6 Mean=426.67(万元);s=116.48(万元);SK=0.203;KU=-0.6884.7(1)MEAN大体相同;(2)S大体相同;(3)较大样本的研究人员机会更多.4.8(1)Vmale=0.08;Vfemale=0.1(2)Mean male=132(磅);s male=11(磅);Mean female=110(磅);s female=11(磅);(3)68%.(4)95%4.9 Z A=1 Z B=0.5,A项更理想一些.(思路:标准分数)4.10 周一和周六(思路:标准分数)4.11 (1)离散系数,由于数据水平高低不同;(2)V adult=0.024 ;V child=0.0354.12 略4.13 略《统计学》第5章习题参考答案与答疑答案与答疑加入时间:2008-10-30 9:15:45点击:7765.1 (1)Ω=[0,100](2)Ω=N(3)Ω=﹛10,11,12,13,14,....﹜5.2 P(A∩B)=0.305.3 P(B)=2/95.4 7/125.5 (1)P(AB)=0.56;(2)P(A∪B)=0.94;(3)P=0.385.6 P=0.725.7 P=2/35.8 P初中=5/11 ;P高中=28/555.9 P A=0.25 ;P B=0.115.10 P(x=0)=1/4;P(x=1)=1/2;P(x=2)=1/45.11(1)P(x=100)=0.001;P(x=10)=0.01;P(x=1)=0.2;P(x=0)=0.789;(2)E(X)=0.45.12 (1)θ=2;(2)E(X)=3/2;(3)D(X)=3/205.13 1/645.14 2/3e5.15 k=λ-1 或k=λ5.16 (1)0.7;(2)1/25.17 ≤3985.18 (1)0.93 (2)0.39。
统计学原理第三版课后习题答案
![统计学原理第三版课后习题答案](https://img.taocdn.com/s3/m/3f97932ebd64783e09122b39.png)
1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100~110 110~120 120~130 130~140 140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40 100.0 ————(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(3)茎叶图如下:65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 72.5 (1)属于数值型数据。
统计学第三版答案(20200920015332)
![统计学第三版答案(20200920015332)](https://img.taocdn.com/s3/m/1eac946176a20029bd642de5.png)
第1章统计和统计数据第2章指出下面的变量类型第3章(1) 年龄。
第4章(2) 性别。
第5章(3) 汽车产量。
第6早(4) 员工对企业某项改革措施的态度(赞成、中立、反对)第7早(5) 购买商品时的支付方式(现金、信用卡、支票)。
第8章详细答案:第9章(1)数值变量。
第10章(2)分类变量。
第11章(3)数值变量。
第12章(4)顺序变量。
第13章(5)分类变量。
第14章一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他第15章们的消费支付方式是用信用卡。
第16章(1)这一研究的总体是什么?样本是什么?样本量是多少?第17章(2)月收入”是分类变量、顺序变量还是数值变量?第18章(3)消费支付方式”是分类变量、顺序变量还是数值变量?第19章详细答案:第20章(1 )总体是所有IT从业者”样本是所抽取的1000名IT从业者”样本量是1000。
/第21章(2)数值变量。
第22章(3)分类变量。
第23章一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是价格便宜第24章(1)这一研究的总体是什么?第25章(2)消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?第26章详细答案:第27章(1)总体是所有的网上购物者” \第28章(2)分类变量。
第29章某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
第30章(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?第31章(2)样本量是多少?第32章详细答案:第33章(1)分层抽样。
第34 章(2)100。
第2章用图表展示数据为评价家电行业售后服务的质量,随机抽取由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C•一般;D.较差;E.差。
调查结果如下:(1)用Excel制作一张频数分布表。
统计学第三版答案(1)
![统计学第三版答案(1)](https://img.taocdn.com/s3/m/a31b0a18c281e53a5802ff55.png)
统计学第三版答案 第二章2、1)、根据该行业管理局的原始资料整理排序如下:2)、根据数据资料确定分组组数: 组63.6301.06021.112lg 40lg 12lg lg 1≈=+=+=+=N k3)、确定各组组距:各组组距=(152-87)÷6=10.83为了整理方便,组距取为:10 4)、编制频数分布表和计算累计频数、频率:5)、按照企业的成绩规定进行分组:3、解:1)、根据百货公司的原始数据排序得:2)、确定分组的组数: 组63.6301.06021.112lg 40lg 12lg lg 1≈=+=+=+=N k3)、确定组距:组距=(49-25)÷6=4 4)、根据资料进行分组整理并编制频数表如下:5)、直方图如下:9、解该百货公司的日均销售额=308223=∑nx =274.1(万元)中位数为排序后第15项数值与16项数值的平均数(272+273)÷2=272.5(万元) 计算日销售额的标准差: 82.20307.13002)(2==-=∑nx x σ(万元)10、解:甲企业的平均成本=元)(41.193406600301500203000152100150030002100==++++乙企业的平均成本=(元)29.183426255301500201500153255150015003255==++++很显然,甲的平均单位成本高于乙企业,主要的原因是各个产品的生产比重不同,甲企业的产量较集中在成本较高产品B ,而乙企业的产量较集中在单位成本比较低的A 产品上,这是两个企业产生平均成本差异的主要原因。
11、该地区的企业利润的平均数==12051200426.67(万元)标准差48.116=s (万元)。
13、成人组的平均身高=(166+169+172+177+180+170+172+174+168+173)÷10=172.1(厘米)幼儿组的平均身高=(68+69+68+70+71+73+72+73+74+75)÷10=71.3(厘米)成人组身高的标准差=99.3109.158=(厘米)幼儿身高的标准差=37.2101.56=(厘米)成人组的身高标准差系数=3.99÷172.1=2.32%幼儿组的身高标准差系数=2.37÷71.3=3.32% 显然,幼儿的身高差异大于成年组。
统计学第三版答案
![统计学第三版答案](https://img.taocdn.com/s3/m/2ac0a5be960590c69ec376f5.png)
第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
统计学第三版书后答案第二章
![统计学第三版书后答案第二章](https://img.taocdn.com/s3/m/c9ccf83b7275a417866fb84ae45c3b3566ecdd41.png)
第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下单位万元257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 1计算该百货公司日销售额的均值、中位数和四分位数2计算日销售额的标准差。
解1将全部30个数据输入Excel表中同列点击列标得到30个数据的总和为8223 于是得该百货公司日销售额的均值见Excel练习题2.9 xxn822330274.1万元或点选单元格后点击“自动求和”→“平均值”在函数EVERAGE 的空格中输入“A1A30”回车得到均值也为274.1。
在Excel表中将30个数据重新排序则中位数位于30个数据的中间位置即靠中的第15、第16两个数272和273的平均数Me2722732272.5万元由于中位数位于第15个数靠上半位的位置上所以前四分位数位于第1第15个数据的中间位置第8位靠上四分之一的位置上由重新排序后的Excel 表中第8位是261第15位是272从而QL2612732724261.25万元同理后四分位数位于第16第30个数据的中间位置第23位靠下四分之一的位置上由重新排序后的Excel表中第23位是291第16位是273从而QU2912732724290.75万元。
2未分组数据的标准差计算公式为s30211iixxn 利用上公式代入数据计算是个较为复杂的工作。
手工计算时须计算30个数据的离差平方并将其求和再代入公式计算其结果得s21.1742。
见Excel练习题2.9 我们可以利用Excel表直接计算标准差点选数据列A列的最末空格再点击菜单栏中“∑”符号右边的小三角“▼”选择“其它函数”→选择函数“STDEV”→“确定”在出现的函数参数窗口中的Number1右边的空栏中输入A1:A30→“确定”即在A列最末空格中出现数值21.17412即为这30个数据的标准差。
统计学第三版答案
![统计学第三版答案](https://img.taocdn.com/s3/m/9a3623005901020206409c12.png)
第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
统计学第三版答案
![统计学第三版答案](https://img.taocdn.com/s3/m/2ac0a5be960590c69ec376f5.png)
第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
《统计学》答案_第三版
![《统计学》答案_第三版](https://img.taocdn.com/s3/m/fbb01cf503d8ce2f01662335.png)
第2章 统计数据的描述-—练习题●2。
解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel 练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积.整理得到频数分布表如下:●13.因为女生的离散系数为V=s x =550=0。
1 男生体重的离散系数为 V=s x =560=0.08 对比可知女生的体重差异较大.(2) 男生:x =602.2公斤公斤=27.27(磅),s =2.25公斤公斤=2.27(磅);女生:x =2.250公斤公斤=22。
73(磅),s =2.25公斤公斤=2.27(磅);(3)68%; (4)95%。
14 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适.离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。
(2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4。
202,从而得:成年组身高的离散系数:024.01.1722.4==s v ; 又得幼儿组身高的平均数为71。
3,标准差为2.497,从而得:幼儿组身高的离散系数: 2.4970.03571.3s v ==; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
【VIP专享】统计学(第三版)课后答案 袁卫等主编
![【VIP专享】统计学(第三版)课后答案 袁卫等主编](https://img.taocdn.com/s3/m/3d590475fab069dc502201c3.png)
打分,形成匹配样本。 (4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述
思考题 1 描述次数分配表的编制过程 答:分二个步骤: (1) 按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合 并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间) 作为一个组。 统计分组应遵循“不重不漏”原则 (2) 将数据分配到各个组,统计各组的次数,编制次数分配表。
显著性水平通常是人们事先给出的一个值用于检验结果的可靠性度量但确定了显著性水平等于控制了犯第一错误的概率但犯第二类错误的概率却是不确定的因此作出拒绝原假设的结论其可靠性是确定的但作出不拒绝原假设的结论其可靠性是难以控制的
统计学 第一章 1. 什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数 据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在 于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存 在意义。
7 为什么要计算离散系数? 答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单 位的影响不能直接比较,由此需计算离散系数作为比较的指标。
练习题:
1. 频数分布表如下:
服务质量等级评价的频数分布
服务质量等级 家庭数(频率)
A
B
统计学课后答案(第3版)第9章相关与回归分析习题答案
![统计学课后答案(第3版)第9章相关与回归分析习题答案](https://img.taocdn.com/s3/m/ded8af1fe518964bcf847c88.png)
第九章 相关与回归分析习题答案一、单选1.C ;2.B ;3.C ;4.D ;5.A ;6.C ;7.B ;8.C ;9.A ;10.C 二、多选1.ACD ;2.AE ;3.AD ;4.ABCD ;5.ACD ;6.AB ;7.ABDE ;8.ACE ;9.AD ;10.ABE 三、计算分析题 1、解:(1)(2)建立线性回归方程xy ∧∧∧+=10ββ,根据最小二乘法得:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ)(由此可得∧1β=0.732,∧0β=-2.01,则回归方程是∧y =-2.01+0.732x(3)当受教育年数为15年时,其年薪的点估计值为:∧y =-2.01+0.732×15=8.97(万元)估计标准误差: 733.0538.0222===-=--=∑∧M S E n S S En y y S i iy )(置信区间为:∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=8.97±2.228×0.733×9167.120917.6151212)(-+=8.97±1.290预测区间为:∑=∧--++±ni i yx x x x nS t y 1202/)()(112α=8.97±2.228×0.733×9167.120917.61512112)(-++ =8.97±2.081 2、解:(1)建立线性回归方程xy ∧∧∧+=10ββ,根据最小二乘法得:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ)(由此可得0093.00=∧β,316.01=∧β,则回归方程是x y 316.00093.0+=∧(3)当GDP 达到16时,其货币供应量的点估计值为:∧y =0.0093+0.316×16=5.065亿元估计标准误差:Sy=22--∑∧n y y i i)(=2-n SSE=MSE =09294.0=0.305置信区间为:∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=5.065±2.228×0.305×21863.135711.11161212)(-+ 3、(1)利用EXCEL 的CORREL 函数计算相关系数r=0.9937.相关系数接近于1,表明农业总产值与农村购买力之间有较强的正线性相关关系。
高等教育出版社《统计学》第三版答案
![高等教育出版社《统计学》第三版答案](https://img.taocdn.com/s3/m/7d64c0452e3f5727a5e96259.png)
第1章绪论1什么是统计学怎样理解统计学与统计数据的关系2试举出日常生活或工作中统计数据及其规律性的例子。
3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此他们开始检查供货商的集装箱有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求1描述总体2描述研究变量3描述样本4描述推断。
答1总体最近的一个集装箱内的全部油漆2研究变量装满的油漆罐的质量3样本最近的一个集装箱内的50罐油漆4推断50罐油漆的质量应为4.536×50226.8 kg。
4“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分选择了1000名消费者进行匿名性质的品尝试验即在品尝试验中两个品牌不做外观标记请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求1描述总体2描述研究变量3描述样本4一描述推断。
答1总体市场上的“可口可乐”与“百事可乐” 2研究变量更好口味的品牌名称3样本1000名消费者品尝的两个品牌4推断两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1. 解1由于表2.21中的数据为服务质量的等级可以进行优劣等级比较但不能计算差异大小属于顺序数据。
2频数分布表如下服务质量等级评价的频数分布服务质量等级家庭数频数频率 A 14 14 B 21 21 C 32 32 D 18 18 E 15 15 合计100 100 3条形图的制作将上表包含总标题去掉合计栏复制到Excel表中点击图表向导→条形图→选择子图表类型→完成见Excel练习题2.1。
即得到如下的条形图02040ABCDE服务质量等级评价的频数分布频率服务质量等级评价的频数分布家庭数频数●2. 解1要求对销售收入的数据进行分组全部数据中最大的为152最小的为87知数据全距为1528765 为便于计算和分析确定将数据分为6组各组组距为10组限以整10划分为使数据的分布满足穷尽和互斥的要求注意到按上面的分组方式最小值87可能落在最小组之下最大值152可能落在最大组之上将最小组和最大组设计成开口形式按照“上限不在组内”的原则用划记法统计各组内数据的个数——企业数也可以用Excel 进行排序统计见Excel练习题2.2将结果填入表内得到频数分布表如下表中的左两列将各组企业数除以企业总数40得到各组频率填入表中第三列在向上的数轴中标出频数的分布由下至上逐组计算企业数的向上累积及频率的向上累积由上至下逐组计算企业数的向下累积及频率的向下累积。
统计学第三版课后答案
![统计学第三版课后答案](https://img.taocdn.com/s3/m/d2135603e87101f69e31955e.png)
统计学第三版答案第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
《统计学》高等教育出版社第三版课后习题答案
![《统计学》高等教育出版社第三版课后习题答案](https://img.taocdn.com/s3/m/e902d59bdaef5ef7ba0d3cfc.png)
第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
统计学课后习题答案(统计学第三版_高等_袁卫、庞皓、曾五一、贾俊平)
![统计学课后习题答案(统计学第三版_高等_袁卫、庞皓、曾五一、贾俊平)](https://img.taocdn.com/s3/m/5c6d5e14fc4ffe473368ab17.png)
第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
统计学原理第三版答案 (4)
![统计学原理第三版答案 (4)](https://img.taocdn.com/s3/m/26d95b610622192e453610661ed9ad51f11d5445.png)
统计学原理第三版答案目录•引言•第一章简介•第二章数据收集和总结•第三章概率•第四章离散概率分布•第五章连续概率分布•第六章抽样分布•第七章点估计•第八章区间估计•第九章假设检验•第十章方差分析•第十一章简单线性回归•第十二章多元回归引言统计学原理是统计学的入门课程,本文档为《统计学原理第三版》的答案汇总。
通过学习《统计学原理第三版》并掌握其答案,你将对统计学的基本概念、技术和方法有更深入的了解,并能够独立进行统计分析。
第一章简介本章介绍了统计学的基本概念和重要性,包括统计学的定义、统计学在科学研究和实践中的作用以及统计学的应用领域。
此外,本章还介绍了统计学的基本术语和符号,并对统计学的整体结构进行了概述。
第二章数据收集和总结本章讨论了数据的收集和总结方法。
首先介绍了如何设计和进行统计调查,包括抽样方法、问卷设计和数据收集工具的选择。
然后介绍了数据的总结和展示方法,包括统计指标的计算、频率分布表的制作和图表的绘制。
第三章概率本章介绍了概率的基本概念和性质,并探讨了概率的计算方法。
我们将学习如何计算事件的概率、事件的互斥和独立性以及多个事件的联合概率。
此外,本章还介绍了概率分布和期望值的概念,并讨论了正态分布的特性。
第四章离散概率分布本章介绍了离散概率分布的概念和常见的离散概率分布,包括伯努利分布、二项分布和泊松分布。
我们将学习如何计算这些分布的期望值和方差,并讨论它们的应用场景。
第五章连续概率分布本章介绍了连续概率分布的概念和常见的连续概率分布,包括均匀分布、正态分布和指数分布。
我们将学习如何计算这些分布的期望值和方差,并讨论它们的应用场景。
第六章抽样分布本章介绍了抽样分布的概念和重要性。
我们将学习如何计算样本均值和样本方差的抽样分布,并讨论中心极限定理的应用。
此外,本章还介绍了统计推断的基本概念,包括点估计和区间估计。
第七章点估计本章介绍了点估计的基本概念和方法。
我们将学习如何使用样本数据估计总体参数,并讨论点估计的性质和准确性评价方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100(3)条形图(略)2.2 (1)频数分布表如下:按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (A班分散,且平均成绩较A班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
2.11 x =426.67(万元);48.116=s (万元)。
2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2) 男生:x =27.27(磅),27.2=s (磅);女生:x =22.73(磅),27.2=s (磅);(3)68%;(4)95%。
2.14 (1)离散系数,因为它消除了不同组数据水平高地的影响。
(2)成年组身高的离散系数:024.01.1722.4==s v ; 幼儿组身高的离散系数:032.03.713.2==s v ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
2.152.162.17 (略)。
第3章 概率与概率分布3.1设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/23.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A )的概率()P A 。
考虑逆事件A =“任取一个零件为正品”,表示通过三道工序都合格。
据题意,有:()(10.2)(10.1)(10.1)0.648P A =---=于是 ()1()10.6480.352P A P A =-=-=3.3设A 表示“合格”,B 表示“优秀”。
由于B =AB ,于是)|()()(A B P A P B P ==0.8×0.15=0.123.4 设A =第1发命中。
B =命中碟靶。
求命中概率是一个全概率的计算问题。
再利用对立事件的概率即可求得脱靶的概率。
)|()()|()()(A B P A P A B P A P B P +==0.8×1+0.2×0.5=0.9脱靶的概率=1-0.9=0.1或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.13.5 设A =活到55岁,B =活到70岁。
所求概率为:()()0.63(|)0.75()()0.84P AB P B P B A P A P A ==== 3.6这是一个计算后验概率的问题。
设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。
P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:6115.050612.030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。
3.7 令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。
由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:(1))|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++==0.25×0.04+0.30×0.05+0.45×0.03=0.0385(2)3506.00385.00135.00.030.450.050.300.040.2503.045.0)|(3==++=⨯⨯⨯⨯B A P3.8据题意,在每个路口遇到红灯的概率是p =24/(24+36)=0.4。
设途中遇到红灯的次数=X ,因此,X ~B(3,0.4)。
其概率分布如下表:(次)3.9 设被保险人死亡数=X ,X ~B (20000,0.0005)。
(1)收入=20000×50(元)=100万元。
要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。
所求概率为:P(X ≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。
所求概率为:P(X >20)=1-P(X ≤20)=1-0.99842=0.00158(3)支付保险金额的均值=50000×E (X )=50000×20000×0.0005(元)=50(万元)支付保险金额的标准差=50000×σ(X )=50000×(20000×0.0005×0.9995)1/2=158074(元)3.10 (1)可以。
当n 很大而p 很小时,二项分布可以利用泊松分布来近似计算。
本例中,λ= np =20000×0.0005=10,即有X ~P (10)。
计算结果与二项分布所得结果几乎完全一致。
(2)也可以。
尽管p 很小,但由于n 非常大,np 和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995,即有X ~N (10,9.995)。
相应的概率为:P (X ≤10.5)=0.51995,P(X ≤20.5)=0.853262。
可见误差比较大(这是由于P 太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p =0.0005,假如n =5000,则np =2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。
此时宜用泊松分布去近似。
3.11(1))6667.1()30200150()150(-<-<=<Z P Z P X P ==0.04779 合格率为1-0.04779=0.95221或95.221%。
(2) 设所求值为K ,满足电池寿命在200±K 小时范围内的概率不小于0.9,即有:|200|(|200|){||}0.93030X K P X K P Z --<=<≥= 即:{}0.9530K P Z <≥,K /30≥1.64485,故K ≥49.3456。
3.12设X =同一时刻需用咨询服务的商品种数,由题意有X ~B(6,0.2)(1)X 的最可能值为:X 0=[(n+1)p]=[7×0.2]=1 (取整数)(2)∑=--=≤-=>20668.02.01)2(1)2(k k k k C X P X P =1-0.9011=0.0989第4章 抽样与抽样分布4.1 a. 20, 2 b. 近似正态 c. -2.25 d. 1.504.2 a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.00134.3 a. 0.8944 b. 0.0228 c. 0.1292 d. 0.96994.4 a. 101, 99 b. 1 c. 不必4.5 趋向正态4.6. a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.9384.7. a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了4.8. a. 增加 b. 减少4.9. a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.064.10 a. 0.015 b. 0.0026 c. 0.15874.11. a. (0.012, 0.028) b. 0.6553, 0.72784.12. a. 0.05 b. 1 c. 0.000625第5章 参数估计5.1 (1)79.0=x σ。
(2)E =1.55。
5.2 (1)14.2=x σ。
(2)E =4.2。
(3)(115.8,124.2)。
5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4 (7.1,12.9)。
5.5 (7.18,11.57)。
5.6 (18.11%,27.89%);(17.17%,22.835)。
5.7 (1)(51.37%,76.63%);(2)36。