统计学第三章练习题含答案
统计学第三章课后作业参考答案
统计学第三章课后作业参考答案1、统计整理在统计研究中的地位如何?答:统计整理在统计研究中的地位:统计整理实现了从个别单位标志值向说明总体数量特征的指标过度,是人们对社会经济现象从感性认识上升到理性认识的过度阶段,为统计分析提供基础,因而,它在统计研究中起了承前启后的作用。
2、什么是统计分组?为会么说统计分组的关键在于分组标志的选择?答:1)统计分组是根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又有联系的几个部分。
2)因为分组标志作为现象总体划分为各处不同性质的给的标准或根据,选择得正确与否,关系到能否正确地反映总体的性质特征、实现统计研究的目的的任务。
分组标志一经选取定,必然突出了现象总体在此标志下的性质差异,而掩盖了总体在其它标志下差异。
缺乏科学根据的分组不但无法显示现象的根本特征,甚至会把不同性质的事物混淆在一起,歪曲了社会经济的实际情况。
所以统计分组的关键在于分组的标志选取择。
3、统计分组可以进行哪些分类?答:统计分组可以进行以下分类1)按其任务和作用的不同分为:类型分组、结构分组、分析分组2)按分组标志的多少分为:简单分组、复合分组3)按分组标志性质分为:品质分组、变量分组5单项式分组和组距式分组分别在什么条件下运用?答:单项式分组运用条件:变量值变动范围小的离散变量可采取单项式分组组距式分组运用条件:变量值变动很大、变量值的项数又多的离散变量和连续变量可采取组距式分组8、什么是统计分布?它包括哪两个要素?答:1)在分组的基础上把总体的所有单位按组归并排列,形成总体中各个单位在各组分布,称为统计分布,是统计整理结果的重要表现形式。
2)统计分布的要素:一、是总体按某一标志分的组,二、是各组所占有的单位数——次数10、频数和频率在分配数列中的作用如何?答:频数和频率的大小表示相应的标志值对总体的作用程度,即频数或频率越大则该组标志值对全体标志水平所起作用越大,反之,频数或频率越小则该组标志值对全体标志水平所起作用越小11、社会经济现象次数分布有哪些主要类型?分布特征?答:1) 社会经济现象次数分布有以下四种主要类型:钟型、U 型 、J 型、洛伦茨分布 2)分布特征如下:钟型分布:正态分布,两头小,中间大U 型分布:两头大,中间小J 型分布:次数随变量值增大而增多;倒J 型分布:次数随变量值增大而减少 洛伦茨分布:各组标志比重随着各组单位数比重(频率)增加而增加;17、有27个工人看管机器台数如下:5 4 2 4 3 4 3 4 4 2 4 3 4 3 26 4 4 2 2 3 4 5 3 2 4 3 试编制分配数列18、某车间同工种40名工人完成个人生产定额百分数如下 :97 88 123 115 119 158 112 146 117 108 105 110 107 137 120 136 125 127 142 118 103 87115 114 117 124 129 138 100 103 92 95 113 126 107 108 105 119 127 104根据上述资料,试编制分配数列错例:下面解法几个地方错?19、1993年某出口创汇大户出口实绩(万美元)列举如下:1011 1052 865 721 2032 1218 1046 721 546 623 2495 1015 1113 1104 1084 707 878 678 2564 620 575 943 828 2035 2375 4342 751 505 798 728 1103 1285 2856 3200 518第九章时间序列分析一、单项选择题二、多项选择题三、判断题四、填空题1、时间序列 指标数值2、总量指标时间数列 相对指标时间数列 平均指标时间数列 总量指标时间数列3、简单 na a ∑=间断 连续 间隔相等 间隔不等4、逐期 累计 报告期水平–基期水平 逐期 累计5、环比 定基基期水平报告期水平环比 定基 环比6、水平法 累计法 水平 nx x ∏=或nna a x 0= 累计 032a a x x x x n∑=++++7、26 26 8、79、)-(y y ˆ∑ = 0)-(y y ˆ∑2为最小 10、季节比率 1200% 400% 五、简答题(略) 六、计算题1、4月份平均库存 = 3053008370122505320⨯+⨯+⨯+⨯= 302(辆)2、第一季度平均人数917301024927217270302751026424258++++⨯+⨯+⨯+⨯+⨯=(人)3、第一季度平均库存额142434405408240012221-+++=-+++=n a a a a n = 410(万元) 同理,第二季度平均库存额1424184384262434-+++= 430(万元)上半年平均库存额1724184384264344054082400-++++++= 420(万元)或 2430410+= 420(万元)4、年平均增加的人数 =516291678172617931656++++= 1696.4(万人)5、某酿酒厂成品库1998年的平均库存量12111232121222---+++++++++=n n n n f f f f a a f a a f a a a=121124084122233533012330326+++⨯+++⨯++⨯+=124620= 385(箱)6、列计算表如下:该柴油机厂全年的平均计划完成程度指标为.346004.47747==∑∑b bc c = 138.0% 7、列计算表如下:该企业第一季度生产工人数占全部职工人数比重232003100320023000225602356249622250++++++==b a c = 77.2% 8、①填写表中空格:②第一季度平均职工人数 =3= 268. 33(人)③第一季度工业总产值 = + + = 83.475(万元) 第一季度平均每月工业总产值 =3475.83=27.825(万元) ④第一季度劳动生产率 =33.268834750=3110.91(元/人)第一季度平均月劳动生产率 =33.26891.3110=1036.97(元/人)或 =33.268278250=1036.97(元/人)9、煤产量动态指标计算表:第①、②与③的要求,计算结果直接在表中; ④平均增长量=552.2=(万吨) ⑤水平法计算的平均发展速度=554065.120.672.8== 107.06% 平均增长速度= 107.06%-100%=7.06% 10、以1991年为基期的总平均发展速度为 62306.105.103.1⨯⨯= 104.16% 11、每年应递增:535.2=118.64%以后3年中平均每年应递增:355.135.2=114.88% 12、计算并填入表中空缺数字如下:(阴影部分为原数据)平均增长量为:3266.39÷6 = 544.40(万台) 平均发展速度为:66556.3= 124.12% 平均增长速度为:124.12%-1=%13、设在80亿元的基础上,按8 %的速度递增,n 年后可达200亿元,即n80200= 108% → n 1 → n = 08.1log 5.2log按8 %的速度递增,约经过年该市的国民收入额可达到200亿元。
统计学第三章练习题(附答案)
统计学第三章练习题(附答案)一.单项选择题1.比较两组数据的离散程度最合适的统计量是( D )。
A.极差B.平均差C.标准差D.离散系数2.如果峰度系数k>3,表明该组数据是( A )。
A.尖峰分布B.扁平分布C.左偏分布D.右偏分布3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
上面的描述中,众数是( B )。
A.1200B.经济管理学院C.200D.理学院4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75 ,64,56,该班考试分数下四分位数和上四分位数分别是( A)。
A.64.5和78.5B.67.5和71.5C.64.5和71.5D.64.5和67.55.对于右偏分布,平均数、中位数和众数之间的关系是( A )。
A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。
A.方差B.极差C.标准差D.变异系数7.在离散程度的测度中,最容易受极端值影响的是( A )。
A.极差B.方差C.标准差D.平均差8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。
A.标准差不同B.方差不同C.数据个数不同D.计量单位不同9.总量指标按其反应的内容不同,可分为( C )。
A.总体指标和个体指标B.时期指标和时点指标C.总体单位总量指标和总体标识总量指标D.总体单位总量指标和标识单位指标10.反映同一总体在不同时间上的数量对比关系的是( C )。
A.计划完成成都相对指标B.比较相对指标C.动态相对指标D.比例相对指标11.2003年全国男性人口数为66556万人,2002年全国金融、保险业增加值为5948.9亿元,2003年全社会固定资产投资总额为55566.61亿元,2003年全国城乡居民人民币储蓄存款余额103617.7亿元。
统计学 第三章练习题答案及解析
3%1%2%5.1++453025453025++++统计学第三章出题优课后习题答案原多项选择第三题D 选项解释有误,现在已经重新更改。
一、单项选择题1. 某商场某月商品销售额为1200万元,月末商品库存额为400万元,这两个总量指标( )。
A. 是时期指标B. 前者是时期指标,后者是时点指标C. 是时点指标2. 国民总收入与国内生产总值之间相差一个( )。
A. 出口与进口的差额B. 固定资产折旧C. 来自国外的要素收入净额3. 有三批产品,废品率分别为1.5%、2%、1%,相应的废品数量为25件、30件、45件,则这三批产品平均废品率的计算式应为( )。
A. B.C. D.4. 下列各项中,超额完成计划的有( )。
A. 利润计划完成百分数103.5%B. 单位成本计划完成百分数103.5%C. 建筑预算成本计划完成百分数103.5%5. 某厂某种产品生产量1月刚好完成计划,2月超额完成2%,3月超额完成4%,则该厂该年一季度各月平均超额完成计划的计算方法是( )。
A. 2%+4%=6%B. (2%+4%)÷2=3%C. (2%+4%)÷3=2%453025%1%2%5.1++++3%1%2%5.1⨯⨯6. 甲、乙两组工人的平均日产量分别为18件和15件。
若甲乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量( )。
A. 上升B. 下降C. 不变D.可能上升,也可能下降7. 当各个变量值的频数相等时,该变量的()。
A. 众数不存在B. 众数等于均值C. 众数等于中位数8. 如果你的业务是提供足球运动鞋的号码,那么哪一种平均指标对你更有用?( )A. 算术平均数B. 几何平均数9. 某年年末某地区城市和乡村平均每人居住面积分别为30.3和33.5平方米,标准差分别12.8和13.1平方米,则居住面积的差异程度( )。
A. 城市大B. 乡村大10. 下列数列的平均数都是50,在平均数附近散布程度最小的数列是( )。
统计学原理第三章答案
9. 解:某工业系统所属企业产值平均计划完成程度表 按产值计划完成程度分组(%)各组企业数占总数的比重(系数)f 组中值XXf 95~100 0.12 97.5 11.7 100~105 0.56 102.5 57.4 105~110 0.24 107.5 25.8 110~115 0.08 112.5 9 合计1.00—103.9所以企业产值平均计划完成程度%9.10300.19.103===∑∑fXf X13. 解:某地区水稻收获量的平均值、标准差和平均差计算表(1)中位数的位置=30026002==∑f,由向上累计次数可知,中位数在275~375组距内,水稻收获量(千克/亩) 耕地面积(亩)f 组中值X向上累计次数X f X 2 X 2f fX X -150~175 18 162.5 18 292526406.25 475312.5 2085 175~200 32 187.5 50 6000 35156.25 1125000 2906.666667 200~225 53 212.5 103 11262.5 45156.25 2393281.25 3489.166667 225~250 69 237.5 172 16387.5 56406.25 3892031.25 2817.5 250~275 84 262.5 256 22050 68906.25 5788125 1330 275~300 133 287.5 389 38237.5 82656.25 10993281.25 1219.166667 300~325 119 312.5 508 37187.5 97656.25 11621093.75 4065.833333 325~350 56 337.5 564 18900 113906.25 6378750 3313.333333 350~375 22 362.5 586 7975 131406.25 2890937.5 1851.666667 375~425 10 412.5 596 4125 170156.25 1701562.5 1341.666667 425~500 4 487.5 600 1950 237656.25950625 836.6666667 合计 600 — —167000—4821000025256.66667由公式可得:亩千克/3.28325133256260027521=⨯-+=-+=-∑d f S fX M mm L e1Q 的位置15046004===∑f,由向上累计次数可知,1Q 在225~250组距内,亩千克/0.242691034600225411111=-+=-+=-∑f S fX Q Q L ;3Q 的位置4504600343=⨯==∑f ,由向上累计次数可知,2Q 在300~325组距内,亩千克/8.312119389460033004331333=-⨯+=-+=-∑f S fX Q Q L ;次数最多的是133,对应的组距为275~300,则众数就在275~300组距内,亩千克/5.29425)119133()84133(84133275211=⨯-+--+=∙∆+∆∆+=d X M L o 。
统计学贾俊平第三章课后答案
一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
统计学练习题及答案
第三章数据分布特征的描述1.下面是我国人口和国土面积资料:────────┬───────────────│根据第四人次人口普查调整数指标├──────┬────────│1982年│1990年────────┼──────┼────────人口总数│101654 │114333男│52352 │58904女│49302 │55429────────┴──────┴────────国土面积960万平方公里。
试计算所能计算的全部相对指标。
2.某企业2014年某产品单位成本520元,2015年计划规定在上年的基础上单位成本降低5%,实际降低6%,试确定2015年单位成本的计划数与实际数,并计算2015年单位成本比计划降低多少3.某市共有50万人,其市区人口占85%,郊区人口占15%,为了解该市居民的收入水平,在市区抽查了1500户居民,每人平均收入为1400元;在郊区抽查了1000户居民,每人年平均收入为1380元,若这两个抽样数字具有代表性,则计算该市居民年平均收入应采用哪一种形式的平均数方法进行计算4根据上表资料计算:(1)哪个班级统计学成绩好(2)哪个班级的成绩分布差异大哪个班级的成绩更稳定5.2014年8月份甲、乙两农贸市场资料如下:────┬──────┬─────────┬─────────品种│价格(元/斤)│甲市场成交额(万元)│乙市场成交量(万斤)────┼──────┼─────────┼─────────甲│││2乙│││1丙│││1────┼──────┼─────────┼─────────合计│──││4────┴──────┴─────────┴─────────试问哪一个市场农产品的平均价格较高并说明原因。
6.某车间有甲、乙两个生产组,甲组平均每个工人的日产量36件,标准差件。
乙组工人资料如下:要求:(1)计算乙组平均每个工人的日产量和标准差。
(2)比较甲、乙两个生产小组哪个组的平均日产量更有代表性比较哪组的产量更稳定比较哪组的产量差异大第四章抽样调查检验结果如下:1.某进出口公司出口茶叶,为检查其每包规格的重量,抽取样本100包,(1)确定每包平均重量的抽样平均误差和极限误差;(2)估计这批茶叶每包平均重量的范围,确定是否达到规格要求。
高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案
高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案一.判断题1.对于连续变量,根据“排除上限”的原则总结其组限。
对。
所谓“上组限不在内”的原则,是对连续变量分组采用重合组限时,习惯上规定一般只包括本组下限变量值的单位,而当个体的变量值恰为组的上限是时,不包括在本组。
2.统计资料的整理不仅是对原始资料的整理,而且还包括对次级资料的整理。
对。
3.确定组限时,最大组上限必须大于最大变量值,最小组下限必须小于最小变量值。
错,这意味着你也可以在封闭的小组中尝试。
4.对统计总体进行分组是由于总体各单位的“同质性”所决定的。
错,将原始数据按照某种标准化分成不同的组别。
5.对连续变量进行分组时,它们的分组极限可以用“不重叠”的形式表示。
对二.单项选择题a组的中值是550组的下限,B组的中值是550组的下限a.550b.650c.700d.750因为它是一个连续变量,所以变量的值是连续的。
由于最后一组的起始下限大于相邻组的中值,请注意这是一个递减变量序列。
一个组的最小值叫做下限。
所以这里的下限实际上是相邻群的上限。
因此,最后一组的下限=相邻组的上限,因此相邻组的上限也为600。
另一个相邻组的组中值为550,因此可以确定相邻组的组距离为100。
重新使用公式:无上限开放组的中值=下限+相邻组的组距离/2,最后一组的中值为650。
2.对一个总体选择三个标志做复合分组,按各个标志所分的组数分别为3、4、5,则所分的全部组数为(a)a、 60b。
12c。
30天。
六3.某小区居民人均月收入最高为5500元,最低为2500元,据此分为6组,形成等距数列,其组距应为(a)a、 500b。
600摄氏度。
550d。
6504.整理统计数据的主要环节是(c)a.编制统计报表b.审核汇总资料c.审核原始资料d.设计整理方案5.对于一年的收入变量序列,分组为10万元以下、10万-20万元、20万-30万元和30万元以上,则为(c)a、10万元应归入第一组b、20万元应归入第二组c、20万元应归入第三组d、30万元应归入第三组6.组号与组距的关系为(a)a.组数越多,组距越小b.级数越多,组距越大c.组数与组距无关d.组数越少,组距越小三.简答题1.简要说明统计排序的意义和内容统计整理,首先要搞清楚教材当中关于统计整理的内容,通常理解的统计整理包括制作次数分布、或者给出排秩、等级的结果,有些还可能包括对数据的类型的判别、编码和对原始数据的必要转换等.有些人认为描述统计也可以视为统计整理的内容,或者是汇总统计的内容.根据统计整理的内容再来回答其意义.主要是可以在正式的描述统计和推断统计之前,预先了解和掌握数据的大致状况,尤其是其分布和次数特征,以便根据数据的类型选择适当的统计方法(不论是描述统计还是推断统计,很重要的一点是依据数据的类型来选择统计法).有些时候,需要对数据进行必要的转换,也是为了便于后继的统计,如由量表原始数据转换成量表得分,原始数据转换成标准分数,或者转换成可统计的某种指标等.简而言之,数据整理就是服务于后续的统计过程,使原始测量数据满足统计方法的需要,为统计方法的选择提供依据。
统计学第三章练习题(附答案)
一.单项选择题1.比较两组数据的离散程度最合适的统计量是( D )。
A.极差B.平均差C.标准差D.离散系数2.如果峰度系数k>3,表明该组数据是(A )。
A.尖峰分布B.扁平分布C.左偏分布D.右偏分布3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
上面的描述中,众数是( B )。
B.经济管理学院D.理学院4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数下四分位数和上四分位数分别是(A)。
和和和和5.对于右偏分布,平均数、中位数和众数之间的关系是(A )。
A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。
A.方差B.极差C.标准差D.变异系数7.在离散程度的测度中,最容易受极端值影响的是(A )。
A.极差B.方差C.标准差D.平均差8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。
A.标准差不同B.方差不同C.数据个数不同D.计量单位不同9.总量指标按其反应的内容不同,可分为(C )。
A.总体指标和个体指标B.时期指标和时点指标C.总体单位总量指标和总体标识总量指标D.总体单位总量指标和标识单位指标10.反映同一总体在不同时间上的数量对比关系的是( C )。
A.计划完成成都相对指标B.比较相对指标C.动态相对指标D.比例相对指标年全国男性人口数为66556万人,2002年全国金融、保险业增加值为亿元,2003年全社会固定资产投资总额为亿元,2003年全国城乡居民人民币储蓄存款余额亿元。
统计学课后习题答案(全章节)(精品).docx
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
统计学第三章习题答案
统计学第三章习题答案1. 描述性统计量:在描述一组数据时,我们通常使用均值、中位数、众数、方差和标准差等统计量。
例如,如果一组数据为 {2, 4, 4, 4, 5, 5, 7, 9},其均值为 (2+4+4+4+5+5+7+9)/8 = 5,中位数为4.5(因为数据是偶数个,所以取中间两个数的平均值),众数为4(出现次数最多),方差为 (1/8) * [(2-5)^2 + ... + (9-5)^2] = 8.5,标准差为方差的平方根,即√8.5。
2. 频率分布表:将数据分组并计算每个组的频数或频率。
例如,如果数据是年龄分布,可以创建如下的频率分布表:| 年龄区间 | 频数 | 频率 || | - | - || 20-25 | 10 | 0.2 || 26-30 | 15 | 0.3 || ... | ... | ... |3. 直方图和箱线图:直方图用于显示数据的分布情况,箱线图则提供了数据的最小值、第一四分位数、中位数、第三四分位数和最大值的快速视图。
例如,对于上述年龄数据,可以绘制相应的直方图和箱线图来观察数据的分布和集中趋势。
4. 概率分布:在统计学中,我们经常使用正态分布来描述数据的分布。
正态分布的数学表达式为N(μ, σ^2),其中μ是均值,σ^2是方差。
例如,如果一个随机变量X服从正态分布N(50, 25),那么X的均值是50,方差是25。
5. 中心极限定理:无论原始数据的分布如何,当样本量足够大时,样本均值的分布将趋近于正态分布。
这个定理是推断统计的基础之一。
6. 假设检验:假设检验是统计推断的一部分,用于确定一个统计假设是否成立。
例如,如果我们要检验一个样本均值是否显著不同于总体均值,可以使用t检验。
具体步骤包括提出原假设和备择假设,选择适当的检验统计量,确定显著性水平,计算p值,并作出结论。
7. 置信区间:置信区间提供了一个范围,我们可以在这个范围内估计总体参数的值。
例如,如果我们有一个样本均值和样本标准差,我们可以计算95%置信区间来估计总体均值的范围。
统计学第三章习题答案
7:30
4
8:00
4
8:30
7
9:00
2
总计
20
(2)
第三章
7
第三章
7、 (1)、
(2)
8
第三章
8、 (1)
(2)
(3)
9
第三章
9、 (1)
接收 29 39 49 59 69 79 89
合计
(2)
频率% 10 16 12 16 20 12 4 100
累积 % 10.00 26.00 38.00 64.00 84.00 96.00 100.00 -
多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的
高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开
排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
Stem width: 10.00
Each leaf:
1 case(s)
5、
(1) VAR00003 Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 2.00 1.00 2.00 2.00
11 . 6 12 . 02 12 . 8 13 . 04 13 . 56
Frequency Stem & Leaf
2.00 6.00 8.00 11.00 9.00 7.00 4.00 2.00 1.00
6. 7. 8. 9. 10 . 11 . 12 . 13 . 14 .
89 233566 01123456 12224556788 002466678 2355899 4678 24 1
统计学原理第三章习题答案
第三章统计资料整理一.判断题部分1 :对统计资料进行分组的目的就是为了区分各组单位之间质的不一样。
(×)2:统计分组的重点问题是确立组距和组数。
(×)3:组中值是依据各组上限和下限计算的均匀值,因此它代表了每一组的均匀分派次数。
(× )3 :分派数列的本质是把整体单位总量依据整体所分的组进行分派。
(∨)4:次数分派数列中的次数,也称为频数。
频数的大小反应了它所对应的标记值在整体中所起的作用程度。
(∨ )5:某公司员工按文化程度分组形成的分派数列是一个单项式分派数列。
(×)6:连续型变量和失散型变量在进行组距式分组时,均可采纳相邻组组距重叠的方法确立组限。
(∨ )7:对资料进行组距式分组,是假设变量值在各组内部的散布是均匀的,因此这类分组会使资料的真切性遇到伤害。
(∨ )8:任何一个散布都一定知足:各组的频次大于零,各组的频数总和等于 1 或 100%。
(×)9:按数目标记分组形成的分派数列和按质量标记分组形成的分派数列,都可称为次数散布。
( ∨ )10:按数目标记分组的目的,就是要区分各组在数目上的差别。
(×)11:统计分组此后,掩饰了各组内部各单位的差别,而突出了各组之间单位的差别。
(∨ )12:分组此后,各组的频数越大,则组的标记值关于全体标记水平所起的作用也越大;而各组的频次越大,则组的标记值对全体标记水平所起的作用越小。
(×)二.单项选择题部分1:统计整理的重点在(B)。
A 、对换查资料进行审查B、对换查资料进行统计分组C 、对换查资料进行汇总D、编制统计表2:在组距分组时,关于连续型变量,相邻两组的组限(A)。
A、一定是重叠的B、一定是中断的C、能够是重叠的,也能够是中断的D、一定取整数3:以下分组中属于按质量标记分组的是(B)。
A 、学生按考试分数分组B、产品按品种分组C 、公司按计划达成程度分组D、家庭按年收入分组4 :有一个学生考试成绩为70分,在统计分组中,这个变量值应纳入(B)。
统计学贾俊平第三章课后答案
一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
统计学第三章课后答案
第三章习题 3.1(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表 服务等级 频率 累积 % A 14 0.14 B 21 0.35 C 32 0.67 D 18 0.85 E151合计100 (3)反映评价等级的条形图5101520253035ABCDE系列13.2(1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组 (万元) 企业数 (个) 频率 (%) 向上累积 向下累积 企业数 频率 企业数 频率 100以下 100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40100.0————在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。
(2) 某管理局下属40个企分组表按销售收入分组(万元) 企业数(个)频率(%)先进企业 良好企业 一般企业 落后企业 11 11 9 9 27.5 27.5 22.5 22.5 合计40100.03.3频数分布表如下某百货公司日商品销售额分组表按销售额分组/万元频数/天 频率/% 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40100.03.4茎叶图如下:茎 叶数据个数 1 8 8 9 3 2 0 1 1 3 3 6 8 8 8 9 9 9 12 3 1 3 5 6 9 5 4 1 2 3 6 6 7 6 512743.5(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组/小时灯泡个数/只频率/% 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~75033合计100 100(3)直方图(4)茎叶图如下茎叶65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 73.6(1)频数分布表如下按重量分组频率/包40~42 242~44 344~46 746~48 1648~50 1752~52 1052~54 2054~56 856~58 1058~60 460~62 3合计100(2)直方图:(3)食品重量的分布基本上是对称的。
统计学第五版第三章课后习题答案
3.5(1)
11
3.5(2)
12
3.5(3)
灯泡使用寿命大 都在690-700小 时,占所有测试 灯泡的26%, 18%在700-710 小时,在680730小时内的灯 泡占所有灯泡的 81%。
13
681-729
3.5(4) 茎叶图:
的映中茎 更的区叶 为状域图 直况为反 观比 映 详频 了 细数 灯 。分 泡
布小使 直时用 方内寿 图,命 反所的 映反集
14
3.6 (1)频数分布表:
15
(2)频数分布直方图:
(3)袋装食品每 袋重量大多分布在 45-55之间,其中 在45-50内的数量 最多,占37%,在 50-55内的食品占 34%,55-60的占 18%,40-45的占 8%,分布在60-65 内的所占比例最小, 占3%。
30
3.14 (1)国内生产总值线图:
31
(2)第一、二、三产业国内生产总值线图:
32
(3)2004年的国内生产总值及其构成数据 饼图:
我国国内生产总值从 1995年到2004年逐年 递增,其中第二产业增 速较快,其次是第三产 业,第一产业增速最慢。 我国2004年国内生产 总值第二产业所占比重 最大,达到53%,第 三产业其次,占32%; 第一产业所占比重最小, 只有15%。
33
3.15 箱线图:
34
如图所示:这几个城市中,相对湿度最低的 为长春,在40以下;相对湿度最高的为广 州,在85以上。平均相对湿度最高的为广 州,达到80以上;最低的为兰州,只有50。 平均相对湿度在60以下的城市有北京、长 春和兰州;在60到70之间的有郑州和西安; 平均相对湿度在70以上的城市有南京、武 汉、广州、成都和昆明。
《统计学概论》第三章课后练习题答案
《统计学概论》第三章课后练习题答案一、思考题1.什么是统计整理,统计整理的对象是什么?P612.什么是统计分组,它可以分为哪几种形式?P633.简述编制变量数列的一般步骤。
P70-754.统计表分为哪几种?P785.什么是统计分布,它包括哪两个要素?P686.单项式分组和组距公式分组分别在什么情况下运用?P667.如何正确选择分组标志?P658.为什么要进行统计分组?其主要作用是什么?P63(2009.01)二、判断题1.统计整理只能对统计调查所得到的原始资料进行加工整理。
(×)P61【解析】统计整理分为两情况:一种是对原始资料进行整理,另一种是对次级资料即已加工过的现成资料进行在整理。
2.对一个既定总体而言,合理的分组标志只有一个。
(×)P67【解析】复合分组就是对同一总体选择两个或两个以上标志进行的分组。
3.在异距数列中,计算次数密度主要是为了消除组距因素对次数分布的影响。
(√)P74 4.组中值是指各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。
(×)P72【解析】当组内标志值分布均匀时,组中值能代表各组的一般水平(平均水平),当组内标志值分布不均匀时,组中值不能代表各组的一般水平(平均水平)。
5.在变量数列中,组数等于全距除以组距。
(×)(2010.01)P71【解析】变量数列的分组可分为等距分组和异距分组,只有在等距分组的情况下,组数等于全距除以组距。
6.统计分组的关键问题是确定组数和组距。
(×)(2009.10)P65【解析】统计分组的关键问题是选择恰当的分组标志。
7.按数量标志分组的目的,就是要区分各组在数量上的差别。
(×)P66【解析】按数量标志分组的目的,并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
8.连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。
统计学第三章课后题及答案解析
第三章一、单项选择题1.统计整理的中心工作是()A.对原始资料进行审核 B.编制统计表C.统计汇总问题 D.汇总资料的再审核2.统计汇总要求资料具有()A.及时性 B.正确性C.全面性 D.系统性3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定()A.50在第一组,70在第四组 B.60在第二组,80在第五组C.70在第四组,80在第五组 D.80在第四组,50在第二组4.若数量标志的取值有限,且是为数不多的等差数值,宜编制()A.等距式分布数列 B.单项式分布数列C.开口式数列 D.异距式数列5.组距式分布数列多适用于()A.随机变量 B.确定型变量C.连续型变量 D.离散型变量6.向上累计次数表示截止到某一组为止()A.上限以下的累计次数 B.下限以上的累计次数C.各组分布的次数 D.各组分布的频率7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线 B.J型分布曲线C.右偏分布曲线 D.左偏分布曲线8.划分连续变量的组限时,相临组的组限一般要()A.交叉 B.不等C.重叠 D.间断二、多项选择题1.统计整理的基本内容主要包括()A.统计分组 B.逻辑检查C.数据录入 D.统计汇总E.制表打印2.影响组距数列分布的要素有()A.组类 B.组限C.组距 D.组中值E.组数据3.常见的频率分布类型主要有()A.钟型分布 B.χ型分布C.U型分布 D.J型分布E.F型分布4.根据分组标志不同,分组数列可以分为()A.组距数列 B.品质数列C.单项数列 D.变量数列E.开口数列5.下列变量一般是钟型分布的有()A.粮食平均产量的分布 B.零件公差的分布C.大学生身高的分布 D.商品市场价格的分布E.学生成绩的分布6.下列变量呈J型分布的有()A.投资额按利润率的分布 B.60岁以上人口按年龄分组的分布C.经济学中的供给曲线 D.不同年龄人口的死亡率分布E.经济学中的需求曲线三、填空题1.分布在各组的_______叫次数(频数)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一.单项选择题
1.比较两组数据的离散程度最合适的统计量是( D )。
A.极差
B.平均差
C.标准差
D.离散系数
2.如果峰度系数k>3,表明该组数据是( A )。
A.尖峰分布
B.扁平分布
C.左偏分布
D.右偏分布
3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
上面的描述中,众数是( B )。
A.1200
B.经济管理学院
C.200
D.理学院
4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数下四分位数和上四分位数分别是( A)。
A.64.5和78.5
B.67.5和71.5
C.64.5和71.5
D.64.5和67.5
5.对于右偏分布,平均数、中位数和众数之间的关系是( A )。
A.平均数>中位数>众数
B.中位数>平均数>众数
C.众数>中位数>平均数
D.众数>平均数>中位数
6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。
A.方差
B.极差
C.标准差
D.变异系数
7.在离散程度的测度中,最容易受极端值影响的是( A )。
A.极差
B.方差
C.标准差
D.平均差
8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。
A.标准差不同
B.方差不同
C.数据个数不同
D.计量单位不同
9.总量指标按其反应的内容不同,可分为( C )。
A.总体指标和个体指标
B.时期指标和时点指标
C.总体单位总量指标和总体标识总量指标
D.总体单位总量指标和标识单位指标
10.反映同一总体在不同时间上的数量对比关系的是( C )。
A.计划完成成都相对指标
B.比较相对指标
C.动态相对指标
D.比例相对指标
11.2003年全国男性人口数为66556万人,2002年全国金融、保险业增加值为5948.9亿元,2003年全社会固定资产投资总额为55566.61亿元,2003年全国城乡居民人民币储蓄存款余额103617.7亿元。
以上总量指标依次是()。
A.时期指标、时点指标、时点指标、时期指标
B.时期指标、时期指标、时点指标、时点指标
C.时点指标、时点指标、时期指标、时点指标
D.时点指标、时期指标、时点指标、时期指标
12.某企业产品第一批废品率为1%,第二批废品率为1.5%,第三批废品率为2%。
第一批产品数量占总数的25%,第二批产品数量占总数的30%,则该厂三批产品的平均废品率为( B )。
13.某工厂有三个流水连续作业车间,某月份车间制品合格率依次为0.95、0.9、0.85,该工厂产品的平均合格率为( C )。
A. B.
C. D.
二.多项选择题
1.下列关于众数的叙述,正确的是( ABD )。
也可以只选AD
A.一组数据可能存在多个众数
B.众数主要适用于分类数据
C一组数据的众数是唯一的 D.众数不受极端值的影响
2.下列叙述中正确的是( AB )。
A.如果计算每个数据与平均数的离差,则这些离差的和总是等于零。
B.在一组数据中,有75%的数小于上四分位数。
C.在一组数据中,有75%的数大于上四分位数。
D.平均数和中位数相等。
E.中位数大于平均数。
3.下列指标中属于总量指标的有( ABD )。
A.工资总额
B.钢材消耗量
C.商业网点密度
D.年度国内生产总值
E.流动资金周转天数
4.时期指标的特点是( ACE )。
A.不同时期的指标数值可以相加
B.不同时期的指标数值不能相加
C.某时期的指标数值与该期时间长短有关
D.某时期的指标数值与该期时间长短无关
E.更长时期的指标数值可通过连续相加得到
5.标志变异值可以(ABCD )
A.衡量平均数的代表性
B.反映社会经济活动的均衡性
C.表明生产过程的节奏性
D.说明变量分布的离散程度
6.均值是数据集中趋势的最主要的测度值,这是因为( BC )。
A.它不易受极端值的影响
B.它反映了数据分布的中心位置和数据必然性的特点
C.它有许多优良的数学性质
D.它比众数和中位数更具稳定性
三.判断分析题(判断正误,并简单说明理由)。
1.在分组数列中,各组的次数f有权衡各组变量值轻重的作用,某组的变量值越大,对平均数的影响就越大。
(错,对平均数的影响是f与变量值共同作用的结果。
)
2.若甲、乙、丙三个企业的产值计划完成程度分别为90%、100%和110%,则这三个企业平均的产值计划完成程度应为100%。
(错,应该和绝对指标相联系起来。
三个企业总的实际完成量/三个企业总的计划完成量)四.计算题。
1.某银行为缩短顾客到银行办理业务的等待时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列:另一种是顾客在三个业务窗口处队列三排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:
5.5
6.6 6.7 6.8
7.1 7.3 7.4 7.8 7.8
要求:
(1)画出第二种排队方式等待时间的茎叶图。
(2)计算第二种排队时间的平均数和标准差。
(均值=7,标准差=0.6733)
(3)比较两种排队方式等待时间的离散程度。
第一种排队方式离散系数=0.274 第二种排队方式离散系数=0.09618
表明第一种排队方式的离散程度大于第二种排队方式
(4)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
选第二种,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
表明,在很多次排队情况中,第二种排队方式的时间大部分情况小于第一种排队方式。
对一次排队而言,第二种排队方式的时间小于第一种排队方式的概率较大。
2.甲乙两个企业生产三种产品的单位成本和总成本资料如下:
要求:比较两个企业的总平均成本哪个高,并分析其原因。
原因:尽管两个企业的单位成本相同,以及产品C在甲乙企业的产量中所占比重基本一致,但单位成本较低的产品A在乙企业的产量中所占比重较大,因此拉低了乙企业的总平均成本。