统计学课后习题答案(Chap1.2)
统计学教材课后习题详细答案

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)整理by__kiss-ahuang第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
大学《统计学》课后作业及答案

1.1什么是统计学?统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。
这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。
显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。
增加定义:是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。
统计学是收集、分析、表述和解释数据的科学1.2解释描述统计和推断统计描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。
内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。
在这一过程中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的推断。
统计学课后习题答案

第四章 统计描述某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%.试分别计算产量、成本、劳动生产率的计划完成程度. 解产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%.成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%.劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%.某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间. 解本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%.(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划. 我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中;(2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几 解(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%.某乡三个村2000年小麦播种面积与亩产量资料如下表:要求:(1)填上表中所缺数字;(2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量.解(1)(2))(75.72840013065015082012070011斤=⨯+⨯+⨯==∑∑==k i iki iiff xx(3)两种不同品种的玉米分别在五块地上试种,产量资料如下:已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些解田块总面积总产量平均亩产量=即: 由于是总体数据,所以计算总体均值: 计算表格乙品种下面分别求两块田地亩产量的标准差:要比较两种不同玉米的亩产量的代表性,需要计算离散系数:<甲σv 乙σv ,∴甲品种的亩产量更稳定一些.两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下: 甲企业乙企业试比较两个企业哪个企业的产品平均单位成本低,为什么解∴乙企业的产品平均单位成本更低.某粮食储备库收购稻米的价格、数量及收购额资料如下:要求:(1)按加权算术平均数公式计算稻米的平均收购价格;(2)按加权调和平均数公式计算稻米的平均收购价格.解(1))(02.19000915011元≈==∑∑==k i iki iiff xx (2))(02.190009150400030002000360031502400m H 元≈=++++==∑∑xm x已知我国1995年—1999年末总人口及人口增长率资料:试计算该期间我国人口平均增长率. 解计算过程如下:按照平均增长率的公式可知:1-平均发展速度平均增长率=所以,1995年—1999年期间我国人口平均增长率=96.91-1204861253604≈‰某单位职工按月工资额分组资料如下: 根据资料回答问题并计算: (1)它是一个什么数列(2)计算工资额的众数和中位数;(3)分别用职工人数和人数所占比重计算平均工资.结果一样吗(4)分别计算工资的平均差和标准差. 解(1)是等距分组数列 (2)d f f f f f f L M m m m m m m ⨯-+--+≈+--)()(1110下限公式:即:59.54821000)30134()37134(371345000)()(1110≈⨯-+--+=⨯-+--+≈+--df f f f f f L M m m m m m m(注:用上限公式算出的结果与上述结果相同) (注:用上限公式算出的结果与上述结果相同) (3))(22.5343236107500306500134550037450025350011元≈⨯+⨯+⨯+⨯+⨯==∑∑==k i iki iiff xx (元)2.53434.24%7500 71%.12650078%.56550068%.15450059%.103500x 1111≈⨯+⨯+⨯+⨯+⨯=⋅==∑∑∑∑====ki ki iii k i iki iiff x ff x两者结果一样.(忽略小数点位数的保留对结果造成的影响)(4)平均差 92.65411≈-=∑∑==ki iki iidff x xM标准差 33.923)(12≈-=∑=Nf X XKi i iσ某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:要求:(1)分别计算这两个商场售货员的人均销售额; (2)通过计算说明哪个商场人均销售额的代表性大解(1) 423001260011===∑∑==k i iki iiff xX 甲(2)05.1030030300)(12≈=-=∑=Nf X XKi i i甲甲σ >甲σv 乙σv ,∴乙商场销售额的代表性大.第五章 统计抽样袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号X 的分布律及其分布函数并画出其图形.解先求X 的分布律:由题知,X 的可能取值为3,4,5,且2345{5}/6/10P X C C ===,∴X 的分布律为:⎪⎪⎭⎫ ⎝⎛10/610/310/1543, 由(){}i i ix xF x P X x p ≤=≤=∑得:设X 的密度函数为求: (1)常数c ;(2)X 的分布函数()F x ; (3){13}P X <≤. 解(1)24241()0(32)018f x dx dx c x dx dx c +∞+∞-∞-∞==+++=⎰⎰⎰⎰(2)当2x ≤时,()00xF x dt -∞==⎰;当24x <<时,22211()()0(32)(310)1818xxF x f t dt dt t dt x x -∞-∞==++=+-⎰⎰⎰当4x ≥时,24241()()0(32)0118xx F x f t dt dt t dt dt -∞-∞==+++=⎰⎰⎰⎰.故分布函数 (3)21{13}=(3)(1)(33310)04/918P X F F <≤-=+⨯--= 随机变量,X Y 相互独立,又(2)XP ,1(8,)4YB ,试求(2)E X Y -和(2)D X Y -.解(2)()2()2222E X Y E X E Y -=-=-⨯=-一本书排版后一校时出现错误处数X 服从正态分布(200,400)N , 求: (1)出现错误处数不超过230的概率;(2)出现错误处数在190~210的概率. 解(200,400)X N(1)200230200(230)()2020X P X P --∴≤=≤ (2) 190200200210200(190210)()202020X P X P ---∴≤≤=≤≤某地区职工家庭的人均年收入平均为12000元,标准差为2000元.若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元的可能性有多大 解对总体而言,2(12000,2000)XN∴样本均值22000(12000,)25xN某商场推销一种洗发水.据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性.如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大解总体比例 3.6=36%10π=万万(1)(,)p N nπππ-∴即2(0.36,0.048)pN第八章 相关分析和回归分析某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下.对以上访问量和营业额数据作相关分析.解相关分析(1)画访问量和营业额数据的散点图,如下所示从图上可以看出,访问量和营业额数据是简单线性正的不完全相关. (2)计算相关系数计算访问量和营业额的简单线性相关系数为,大于,说明访问量和营业额之间存在较高的线性关系.某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:∑=-6546)(2x x i,∑=-5641)(2y y i375=x ,498=y ,6054))((=--∑y y x x i i(1)计算相关系数,并初步判断x 与y 之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;(4)计算模型可决系数,并用其说明模型的拟合效果. 解最小二乘法的计算(一元)(1)计算相关系数,并初步判断x 与y 之间的关系;计算x 与y 相关系数为r=,说明两者的简单线性相关程度非常高,因此可以初步判断x 与y 呈现线性关系.(2)用最小二乘法估计模型回归系数,并写出模型结果;记模型为:i i x y 10ˆˆˆββ+=,将以上结果代入最小二乘法的计算公式,得到=1ˆβ,=0ˆβ. 因此,产品销售数量为y 对广告费投入为x 的模型为i i x y92484.01852.151ˆ+= (3)说明所计算的回归系数的经济意义;=1ˆβ表示当广告费投入每增加1个单位,产品销售数量会增加个单位. (4)计算模型可决系数,并用其说明模型的拟合效果.由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变量简单线性相关系数的平方的关系,可得模型的可决系数R 2=(r)2=2=.可决系数接近1,说明模型拟合的非常好.第九章 统计指数某市场上四种蔬菜的销售资料如下:(1) 根据综合指数编制规则,将上表所缺空格填齐; (2) 用拉氏公式编制四种蔬菜的销量总指数和价格总指数; (3) 用帕氏公式编制四种蔬菜的销量总指数和价格总指数; (4) 建立适当的指数体系,对蔬菜销售额的变动进行因素分析.解 %p q p q L %pq pq L p q 11.1092282431227.1072282390220010001======∑∑∑∑)拉氏:(即 ()⎩⎨⎧+=⨯=元175********.10727.10712.115%%计算表明: 四种蔬菜的销量增长了 %,使销售额增加了 162元;四种蔬菜的价格上长了 %,使销售额增加了175元;两因素共同影响,使销售额增长了%, 销售额增加了337元. 结论:某厂三种产品的产量情况如下表:试分析出厂价格和产量的变动对总产值的影响. 解第一步:计算三个总产值:24200064000101100081350000=⨯+⨯+⨯=∑p q(万元);25080064800101020081500001=⨯+⨯+⨯=∑pq (万元);2637005480011102005.81500011=⨯+⨯+⨯=∑pq (万元);第二步:建立指标体系即⎪⎩⎪⎨⎧-+-=-⨯=)250800263700()242000250800(242000263700250800263700242000250800242000263700 第三步:分析结论.计算结果表明:由于出厂价上涨了%,使总产值增加了8800元;由于产量提高了%,使总产值增加了12900元;两因素共同作用,使总产值上升了%,增加了21700元.若给出题中四种蔬菜的资料如下:(1) 编制四种蔬菜的算术平均指数; (2) 编制四种蔬菜的调和平均指数;(3) 把它们与上题计算的拉氏指数和帕氏指数进行比较,看看有何种关系什么条件下才会有这种关系的呢 (4)解(1)(2) (3)算术平均指数的结果与拉氏指数相等——以基期的总值指标为权数. 调和平均指数的结果与帕氏指数相等——以报告期的总值指标为权数.某地区2005年农副产品收购总额为1 360亿元,2006年比上年的收购总额增长了12%,农副产品价格指数为105%;试考虑:2006年与2005年相比较(1) 农副产品收购总额增长了百分之几农民共增加多少收入 (2)(3) 农副产品收购量增加了百分之几农民增加了多少收入 (4)(5) 由于农副产品收购价格提高了5%,农民又增加了多少收入 (6) 验证以上三者之间有何等关系解已知:农民交售农副产品增加收入亿元, 与去年相比增长幅度为12%; 农副产品收购数量增长 %, 农民增加收入 亿元; 农副产品收购价格上涨 %, 农民增加收入 亿元.显然,有:⎩⎨⎧+=⨯=(亿元)5.727.902.16300.10567.10600.112%%%可见,分析结论是协调一致的.某企业生产的三种产品的有关资料如下:(1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算产品产量总指数及由于产量增长而增加的总成本;(3)计算单位成本总指数及由于单位成本变动而增减的总成本.解建立指数体系:结论:计算结果表明:由于产量总指数增加了37%(=%-1),而使总成本增加了37元,由于单位成本总指数下降了%(=%-1),使总成本减少了元.两个因素共同影响使总成本上升了%,增加了元.9.8某商场的销售资料如下:(1)根据上表资料计算相关指标填入上表(见绿色区域数字);(2)计算商品销售量总指数及由于销量变化而增减的销售额;(3)计算商品价格总指数及由于价格变动而增减的销售额.解建立指数体系:计算结果表明:由于商品销量总指数下降了%(=%),而使销售额减少了万元,由于商品价格总指数下降了%(=%),使销售额减少了万元.两个因素共同影响使销售总额下降了%(=%),减少了54万元.某乡力图通过推广良种和改善田间耕作管理来提高粮食生产水平,有关生产情况如下表所示:(1) 该乡粮食平均亩产提高了百分之几由此增产粮食多少吨 (2)(3) 改善田间耕作管理使平均亩产提高多少增产粮食多少吨 (4)(5) 推广良种使平均亩产提高多少增产粮食多少吨 (6)解计算的相关数据(∑∑∑110100110100x f x f x f x f x f x f )见上表中绿色区域数字;从而有:建立指数体系: ⎪⎩⎪⎨⎧-+=-⨯=)()-(10011001假假假假x x x x x x x x x x x x 即 ()()⎪⎩⎪⎨⎧-+-=-⨯=000 657 48000 737 49000 478 46000 657 48000 478 46000 737 4948.40548.417 32.38748.40532.38748.417 即 ()⎩⎨⎧+=⨯=公斤 000 080 1000 179 2000 259 3 %22.102 %69.104%01.107分析结论: 计算结果表明(1)该乡粮食平均亩产提高了%(=%-1),由此增产粮食3 259吨; (2)由于改善田间管理,使平均亩产提高了%,粮食增产2 179吨; (3)由于推广优良品种,使平均亩产提高了%,粮食增产1 080吨.第十章 时间序列分析某公司2009年末有职工250人,10月上旬的人数变动情况是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年职工应征入伍,同日又有3名职工辞职离岗,9日招聘7名销售人员上岗.试计算该公司10月上旬的平均在岗人数. 解)(25610256010518252516524750212232)7334262(1)334262(2)4262(2)12250(3250人==++++=++++⨯+---+⨯---+⨯-+⨯++⨯==∑∑iii fxf x 答:该公司10月上旬的平均在岗人数为256人. 某银行2009年部分月份的现金库存额资料如下:要求:(1)该时间序列属于哪一种时间序列.(2)分别计算该银行该年第一、二季度和上半年的平均现金库存额. 解(1) 该时间序列属于动态时点时间序列; (2) 第一季度平均现金库存额:)(4803144032520450480250014224321万元==+++=-+++=x x x x x ; 第二季度平均现金库存额:)(5673170032580600550252014227324万元==+++=-+++=x x x x x ; 上半年平均现金库存额:)(52363140625806005505204504802500172 (2)721万元==++++++=-+++=x x x x 某企业08年上半年的产量和单位成本资料如下:试计算该企业08年上半年的产品平均单位成本.解答:该企业08年上半年的产品平均单位成本为元. 某企业有关资料如下,计算该企业一季度人均月销售额.解 该企业一季度月平均销售额:)(33.12331201501003321万元=++=++=a a a a ;该企业一季度月平均职工人数:)(1133211611012021003224321人=+++=+++=b b b b b ; 该企业一季度人均月销售额:)/(091.111333.123人万元===ba c .某市2001~2005年的地区生产总值如下表:(1) 按平均发展速度估计2002~2004年的地区生产总值. (2) 按此5年的平均发展速度预测2008年和2010年的GDP.解(1)2002~2006年泉州市地区生产总值的平均发展速度为:%12.11399316264==v ; 按平均发展速度估计2002~2004年的地区生产总值分别为:11437%)12.113(9931270%)12.113(9931123%12.11399332=⨯=⨯=⨯(将计算结果填入上表绿色区域内);(2)按此5年的平均发展速度预测2008年和2010年的GDP 分别为:2008年地区GDP 预测值)(23541312.116263亿元=⨯=; 2010年地区GDP 预测值)(7.30111312.116265亿元=⨯=.我国某地区2001年~ 2006年税收总额如下:试计算:(1)环比发展速度和定基发展速度; (2)环比增长速度和定基增长速度; (3)增长1%绝对值;(4)用水平法计算平均增长速度;(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入.解(1)~(3)相关计算结果填入下表(见绿色区域数字):(4) 用水平法计算平均发展速度和平均增长速度:平均发展速度%44.1161644.11404.22821603855====v ; 则平均增长速度%44.161%44.1161=-=-=v ;。
统计学)第五版课后习题答案(部分)_人大出版社

解:H0:μ1=μ2=μ3H1:μ1,μ2,μ3不全相等从方差分析表可以看到,由于F=11.75573>F0.052,15=3.68232,所以拒绝原假设H0,表明μ1,μ2,μ3之间的差异是显著的,即管理者的层次不同会导致评分的显著差异。
解:首先对两个因素分别提出如下假设:行因素(品牌)H0:μ1=μ2=μ3=μ4=μ5H1:μ1,μ2,μ3,μ4,μ5不全相等列因素(施肥方案)H0:μ1=μ2=μ3=μ4H1:μ1,μ2,μ3,μ4不全相等从方差分析表可以看到,由于F R=7.239716>F0.05=3.259167,所以拒绝原假设H0,表明μ1,μ2,μ3,μ4,μ5之间的差异是显著的,即种子的不同品种对收获量的影响显著。
由于F C=6.0605>F0.05=3.259167,所以拒绝原假设H0,表明μ1,μ2,μ3,μ4之间的差异是显著的,即不同的施肥方案对收获量的影响显著。
10.12解:首先对两个因素分别提出如下假设:行因素(广告方案)H0:μ1=μ2=μ3H1:μ1,μ2,μ3不全相等列因素(广告媒体)H0:μ1=μ2H1:μ1,μ2不全相等其次,对两个因素的交互作用提出如下假设:H0:广告方案和广告媒体的交互作用对销售量的影响不显著H1:广告方案和广告媒体的交互作用对销售量的影响显著从方差分析表可以看到,由于F R=10.75>F0.05=5.14325,所以拒绝原假设H0,表明μ1,μ2,μ3之间的差异是显著的,即广告方案对销售量的影响显著。
由于F C=3>F0.05=5.98738,所以不拒绝原假设H0,表明μ1,μ2之间的差异是不显著的,即广告媒体对销售量的影响不显著。
从方差分析表可以看到,由于P−value=0.25193>ð=0.05所以不拒绝原假设H0,即广告方案和广告媒体的交互作用对销售量的影响不显著。
《统计学》教材课后习题答案

0.00
92.24
368.80
829.69
1175.5
589.80
0.51
32.65
114.80
246.94
661.22
合计
350
800
20300
94250
42700
800.03
2580.48
2821.43
(1)设 表示企业总产值, 表示固定资产价值,则有:
(2)
(3)当 时, (万元)
(4)根据已知数据计算可得:
全距:24 - 20 = 4
表3-2某企业30名工人在一个工作间内生产的零件数量次数分布表
按零件数分组(件)
工人数(人)
比重(%)
20
21
22
23
24
3
7
10
6
4
10.0
23.3
33.3
20.0
13.4
合计
30
100.0
3、把题中数值按大小顺序排序:
49 54 57 57 60 61 64 65 67 68 70 71 72 72 72 73 75 75 76 7678 79 81 81 81 82 83 84 85 8686 87 87 87 89 89 89 90 95 97
(4)
含义:在单位成本取值的总体误差中,有82.81%可以由单位成本与产量之间的线性关系来解释,可见回归直线的拟合程度较高。
2、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:(x代表人均收入,y代表销售额):
=9, =546, =260, =34362, =16918
要求:
《统计学》课后习题答案
统计学课后习题答案

第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
统计学课后习题答案(全章节)(精品).docx

第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
统计学课后答案

第一章1.举出你所知道的统计应用的例子。
答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。
2. 解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。
答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。
定性数据的例子:例如考察某幼儿园10个人的性别,定义1=男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1. ;定量数据的例子:考察某幼儿园10个人的身高,则此变量取值区间为(0,200)(单位:cm)3. 解释样本和总体的区别。
答:总体是根据一定目的和要求所确定的研究事物的全体。
为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。
样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。
4. 解释离散型变量和连续型变量的区别,并各举一例。
离散型变量是指其数值只能用自然数或整数单位计算。
例如:某企业里职工的人数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。
例如:生产零件的规格尺寸。
5.阐述四种主要的收集数据方法的区别。
答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。
6.举出一些观测数据和实验数据的例子。
·答:(1)观测数据:证券分析人员可能会记录某即将收购的公司在被收购的前一天的股市收盘价,并与宣布被收购的当天的收盘价比较。
统计学课后习题参考答案(可编辑修改word版)

思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3.目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;② 建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
《统计学》课后答案(第二版_贾俊平版)

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要容和学习要点如下表所示。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章各节的主要容和学习要二、主要术语24. 频数:落在某一特定类别(或组)中的数据个数。
免费《统计学》课后答案

统计学费宇石磊(主编)第2章练习题参考答案2.1解:(1)首先将顾客态度分别用代码1、2、3表示,然后在数据文件的Varible View窗口Values栏定义变量值标签:1代表“喜欢并愿意购买”;2代表“不喜欢”,3代表“喜欢并愿意购买”。
操作步骤:依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。
输出结果如表2.1所示:(2)根据表2.1频数分布表资料建立的数据文件为绘制条形图操作步骤:依次点击File→点击open→点击Data→打开数据文件,选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable(纵轴),将“态度分类”选入Category Axis (横轴)→点击OK。
输出结果如图2.1所示:图2.1 30名顾客满意程度分布条形图绘制饼图操作步骤:依次点击File→点击open→点击Data→打开数据文件ofindividual cases→点击Define→将“人数”选入Slices Represent栏,将“态度分类”选入Variable栏→点击OK。
输出结果如图2.2所示:2.2解:首先列计算表如表2.2所示:表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表(1)均值151872072.67120iii ii xf x f=====∑∑(分) 表2.2中,分布次数最多的组是“40~50”组,这就是众数所在组;2N=60,中位数大约在第60位,可确定中位数也在“40~50”组。
众数10124230701073.333018M L i ∆-=+⨯=+⨯=∆+∆-+-(分)(42)(42)中位数11204922701072.6242m e m N S M L i f ---=+⨯=+⨯=(分) (2)首先计算标准差:11.65s ==(分)31133()/38389.64/1200.202311.65kki ii i x x f f SK s ==-===∑∑由计算结果可看出,偏态系数为正值,但与零的差距不大,说明120名大学生英语成绩为轻微右偏分布,成绩较低的同学占有一定的比例,但偏斜程度不大。
统计学原理课后答案

统计学原理课后答案1. 平均数和样本均值的概念及计算方法- 平均数是一组数据的总和除以数据的个数,用于描述数据的集中趋势。
- 样本均值是从总体中选择的一部分样本数据的平均数,用于估计总体的平均值。
- 计算平均数的方法是将所有数据求和,然后除以数据的个数。
- 计算样本均值的方法是将样本数据求和,然后除以样本的个数。
- 平均数和样本均值的计算公式为:平均数 = 总和 / 数据个数,样本均值 = 样本总和 / 样本个数。
2. 中位数和样本中位数的概念及计算方法- 中位数是一组数据中位于中间位置的数值,用于描述数据的中间值。
- 样本中位数是从总体中选择的一部分样本数据中位于中间位置的数值,用于估计总体的中位数。
- 计算中位数的方法是将数据按照大小排序,然后找到中间位置的数值。
- 若数据个数为奇数,则中位数为排序后的中间位置的数值。
- 若数据个数为偶数,则中位数为排序后的中间两个数值的平均值。
- 计算样本中位数时,首先将样本数据排序,然后按照上述方法计算。
3. 众数和样本众数的概念及计算方法- 众数是一组数据中出现频率最高的数值,用于描述数据的主要趋势。
- 样本众数是从总体中选择的一部分样本数据中出现频率最高的数值,用于估计总体的众数。
- 计算众数的方法是统计每个数值出现的次数,然后找到出现次数最多的数值。
- 计算样本众数时,首先统计样本数据中每个数值的出现次数,然后按照上述方法计算。
4. 方差和样本方差的概念及计算方法- 方差是一组数据与其平均数之间差异的平方的平均值,用于描述数据的离散程度。
- 样本方差是从总体中选择的一部分样本数据与其样本均值之间差异的平方的平均值,用于估计总体的方差。
- 计算方差的方法是将每个数据与平均数之间的差异平方后求和,然后除以数据的个数。
- 计算样本方差的方法是将每个样本数据与样本均值之间的差异平方后求和,然后除以样本的个数。
5. 标准差和样本标准差的概念及计算方法- 标准差是方差的平方根,用于描述数据的离散程度。
《统计学》课后习题答案

《统计学》习题参考答案湖南商学院统计系第1章总论1.统计的三种涵义是:统计工作、统计资料和统计学.2.统计工作必须涉及:为谁统计、由谁统计、统计什么和如何统计等基本问题.3.统计工作具有:信息职能、咨询职能和监督职能,其中最基本的职能是信息职能.4.统计资料按计量方法不同,分为计点资料和计量资料;按资料是否直接取得,分为原始资料和次级资料;按统计资料的时间属性不同,分为静态资料和动态资料;按统计资料所涵盖的范围不同,分为全面资料和抽样资料. .统计资料具有时间、空间和数据三个要素。
5.统计学是研究现象总体的数量表现和规律性的方法论科学。
按照发展阶段和侧重点不同,可分为描述.统计学和推断统计学;按照理论与实践应用的关系,可分为理论统计学和应用统计学。
6.简述统计研究最基本的研究方法有哪些? 统计的研究过程主要包括哪些步骤?统计研究最基本的研究方法有大量观察法、统计分组法、综合指标法、归纳推断法,统计的研究过程主要包括统计设计、统计调查、统计整理、统计分析等步骤。
第2章统计计量1.四种具体的计量水准分别是列名水准、顺序水准、间隔水准、比例水准;其中属性水准包括列名水准和顺序水准,数量水准包括间隔水准和比例水准.2. 统计指标按反映的总体内容与性质不同,可分为数量指标与质量指标两大类.3.数量指标由于计量单位不同,可分为实物指标和价值指标, 按反映的计量时间特点不同,分为流量指标和存量指标(或时期指标和时点指标), 所反映的总体内容不同可分为总体单位总量和总体标志总量,总体标志总量/总体单位总量为平均指标。
4.质量指标按表现形式不同可分为平均指标和相对指标。
5..统计指标设计一般应遵循哪些准则?统计指标设计一般应遵循的原则主要有(1)统计指标的名称、涵义要有理论依据。
(2)统计指标必须有明确的计算口径。
(3)统计指标要有科学的计算方法。
(4)统计指标要有统一的计量单位。
6.建立统计指标体系应遵循哪些原则?建立统计指标体系应遵循的原则主要有1.必须明确建立统计指标体系的目的,2.必须明确基本统计指标和分类指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章绪论1.什么是统计学怎样理解统计学与统计数据的关系2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C3232D1818E1515合计100100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。
即得到如下的条形图:●2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题,将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。
整理得到频数分布表如下:40个企业按产品销售收入分组表(2)按题目要求分组并进行统计,得到分组表如下:某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11 11 9 9合计40● 3.某百货公司连续40天的商品销售额如下(单位:万元):41252947383430384340463645373736454333443528463430374426384442363737493942323635根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题并填入表内,得到频数分布表如下表中的左两列;将各组天数除以总天数40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~504 6 15 9 6直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题●4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。
(见Excel练习题(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~66022660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:将直方图与茎叶图对比,可见两图十分相似。
●5.下面是北方某城市1~2月份各天气温的记录数据:-32-4-7-11-1789-6-7-14-18-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5(1)指出上面的数据属于什么类型;(2)对上面的数据进行适当的分组;(3)绘制直方图,说明该城市气温分布的特点。
解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。
(2)分组如下:由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;北方某城市1~2月份各天气温分组天数(天)-25~-208-20~-158-15~-1010-10~-514-5~0140~545~107合计65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题●6年龄18~1921~2122~2425~2930~3435~3940~4445~59%(1)对这个年龄分布作直方图;(2)从直方图分析成人自学考试人员年龄分布的特点。
解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。
即得到如下的直方图:(见Excel练习题(2)年龄分布的特点:自学考试人员年龄的分布为右偏。
7.下面是A、B两个班学生的数学考试成绩数据:A班:44575960616162636365 66666769707071727373 73747474757575757576 76777777787879808082 85858686909292929396 B班:35394044444851525254 55565657575758596061 61626364666868707071 71737474798182838384 85909191949596100100100(1)将两个班的考试成绩用一个公共的茎制成茎叶图;(2)比较两个班考试成绩分布的特点。
A班树茎B班数据个数树叶树叶数据个数035921440448429751211110609233332100700113449876655200812334566632220901145660100003(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。