《统计学》_第三章_统计整理(补充例题)
统计学第三章课后作业参考答案
统计学第三章课后作业参考答案1、统计整理在统计研究中的地位如何?答:统计整理在统计研究中的地位:统计整理实现了从个别单位标志值向说明总体数量特征的指标过度,是人们对社会经济现象从感性认识上升到理性认识的过度阶段,为统计分析提供基础,因而,它在统计研究中起了承前启后的作用。
2、什么是统计分组?为会么说统计分组的关键在于分组标志的选择?答:1)统计分组是根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又有联系的几个部分。
2)因为分组标志作为现象总体划分为各处不同性质的给的标准或根据,选择得正确与否,关系到能否正确地反映总体的性质特征、实现统计研究的目的的任务。
分组标志一经选取定,必然突出了现象总体在此标志下的性质差异,而掩盖了总体在其它标志下差异。
缺乏科学根据的分组不但无法显示现象的根本特征,甚至会把不同性质的事物混淆在一起,歪曲了社会经济的实际情况。
所以统计分组的关键在于分组的标志选取择。
3、统计分组可以进行哪些分类?答:统计分组可以进行以下分类1)按其任务和作用的不同分为:类型分组、结构分组、分析分组2)按分组标志的多少分为:简单分组、复合分组3)按分组标志性质分为:品质分组、变量分组5单项式分组和组距式分组分别在什么条件下运用?答:单项式分组运用条件:变量值变动范围小的离散变量可采取单项式分组组距式分组运用条件:变量值变动很大、变量值的项数又多的离散变量和连续变量可采取组距式分组8、什么是统计分布?它包括哪两个要素?答:1)在分组的基础上把总体的所有单位按组归并排列,形成总体中各个单位在各组分布,称为统计分布,是统计整理结果的重要表现形式。
2)统计分布的要素:一、是总体按某一标志分的组,二、是各组所占有的单位数——次数10、频数和频率在分配数列中的作用如何?答:频数和频率的大小表示相应的标志值对总体的作用程度,即频数或频率越大则该组标志值对全体标志水平所起作用越大,反之,频数或频率越小则该组标志值对全体标志水平所起作用越小11、社会经济现象次数分布有哪些主要类型?分布特征?答:1) 社会经济现象次数分布有以下四种主要类型:钟型、U 型 、J 型、洛伦茨分布 2)分布特征如下:钟型分布:正态分布,两头小,中间大U 型分布:两头大,中间小J 型分布:次数随变量值增大而增多;倒J 型分布:次数随变量值增大而减少 洛伦茨分布:各组标志比重随着各组单位数比重(频率)增加而增加;17、有27个工人看管机器台数如下:5 4 2 4 3 4 3 4 4 2 4 3 4 3 26 4 4 2 2 3 4 5 3 2 4 3 试编制分配数列18、某车间同工种40名工人完成个人生产定额百分数如下 :97 88 123 115 119 158 112 146 117 108 105 110 107 137 120 136 125 127 142 118 103 87115 114 117 124 129 138 100 103 92 95 113 126 107 108 105 119 127 104根据上述资料,试编制分配数列错例:下面解法几个地方错?19、1993年某出口创汇大户出口实绩(万美元)列举如下:1011 1052 865 721 2032 1218 1046 721 546 623 2495 1015 1113 1104 1084 707 878 678 2564 620 575 943 828 2035 2375 4342 751 505 798 728 1103 1285 2856 3200 518第九章时间序列分析一、单项选择题二、多项选择题三、判断题四、填空题1、时间序列 指标数值2、总量指标时间数列 相对指标时间数列 平均指标时间数列 总量指标时间数列3、简单 na a ∑=间断 连续 间隔相等 间隔不等4、逐期 累计 报告期水平–基期水平 逐期 累计5、环比 定基基期水平报告期水平环比 定基 环比6、水平法 累计法 水平 nx x ∏=或nna a x 0= 累计 032a a x x x x n∑=++++7、26 26 8、79、)-(y y ˆ∑ = 0)-(y y ˆ∑2为最小 10、季节比率 1200% 400% 五、简答题(略) 六、计算题1、4月份平均库存 = 3053008370122505320⨯+⨯+⨯+⨯= 302(辆)2、第一季度平均人数917301024927217270302751026424258++++⨯+⨯+⨯+⨯+⨯=(人)3、第一季度平均库存额142434405408240012221-+++=-+++=n a a a a n = 410(万元) 同理,第二季度平均库存额1424184384262434-+++= 430(万元)上半年平均库存额1724184384264344054082400-++++++= 420(万元)或 2430410+= 420(万元)4、年平均增加的人数 =516291678172617931656++++= 1696.4(万人)5、某酿酒厂成品库1998年的平均库存量12111232121222---+++++++++=n n n n f f f f a a f a a f a a a=121124084122233533012330326+++⨯+++⨯++⨯+=124620= 385(箱)6、列计算表如下:该柴油机厂全年的平均计划完成程度指标为.346004.47747==∑∑b bc c = 138.0% 7、列计算表如下:该企业第一季度生产工人数占全部职工人数比重232003100320023000225602356249622250++++++==b a c = 77.2% 8、①填写表中空格:②第一季度平均职工人数 =3= 268. 33(人)③第一季度工业总产值 = + + = 83.475(万元) 第一季度平均每月工业总产值 =3475.83=27.825(万元) ④第一季度劳动生产率 =33.268834750=3110.91(元/人)第一季度平均月劳动生产率 =33.26891.3110=1036.97(元/人)或 =33.268278250=1036.97(元/人)9、煤产量动态指标计算表:第①、②与③的要求,计算结果直接在表中; ④平均增长量=552.2=(万吨) ⑤水平法计算的平均发展速度=554065.120.672.8== 107.06% 平均增长速度= 107.06%-100%=7.06% 10、以1991年为基期的总平均发展速度为 62306.105.103.1⨯⨯= 104.16% 11、每年应递增:535.2=118.64%以后3年中平均每年应递增:355.135.2=114.88% 12、计算并填入表中空缺数字如下:(阴影部分为原数据)平均增长量为:3266.39÷6 = 544.40(万台) 平均发展速度为:66556.3= 124.12% 平均增长速度为:124.12%-1=%13、设在80亿元的基础上,按8 %的速度递增,n 年后可达200亿元,即n80200= 108% → n 1 → n = 08.1log 5.2log按8 %的速度递增,约经过年该市的国民收入额可达到200亿元。
统计学第三章练习题(附答案)
统计学第三章练习题(附答案).单项选择题B.平均差 D.离散系数2.如果峰度系数k >3,表明该组数据是(A )0A. 64.5 和 78.5 D.64.5 和 67.55.对于右偏分布,平均数、中位数和众数之间的关系是( A)o7.在离散程度的测度中,最容易受极端值影响的是( A)08.在⽐较两组数据的离散程度时,不能直接⽐较它们的标准差,因为两组数据的 (D )oA.标准差不同C 数据个数不同1.⽐较两组数据的离散程度最合适的统计量是(D )。
A.极差 C 标准差A.尖峰分布B 扁平分布C 左偏分布 D.右偏分布3.某⼤学经济管理学院有 1200 名学⽣,法学院有 800 名学⽣,医学院有 320 名学⽣,理学院有 200 名学⽣0上⾯的描述中,众数是(B)0A.1200B.经济管理学院C.200D 理学院4. 某班共有 25 名学⽣ , 期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56考试分数下四分位数和上四分位数分别是( A)0B.67.5 和 71.5C.64.5和 71.5A.平均数>中位数>众数B. 中位数>平均数>众数 C 众数〉中位数〉平均数D.众数〉平均数〉中位数6.某班学⽣的统计学平均成绩是70分,最⾼分是 96分,最低分是 62分,根据这些信息,可以计算的测度离散程度的指标是(B)0A ⽅差B 极差C 标准差 D.变异系数A.极差B ⽅差C 标准差D.平均差B.⽅差不同 D.计量单位不同9.总量指标按其反应的内容不同,可分为( C)0A.总体指标和个体指标B.时期指标和时点指标c 总体单位总量指标和总体标识总量指标 D.总体单位总量指标和标识单位指标10.反映同⼀总体在不同时间上的数量对⽐关系的是(D.⽐例相对指标11.2003年全国男性⼈⼝数为 66556万⼈,2002年全国⾦融、保险业增加值为 5948.9亿元,2003年全社会固定资产投资总额为 55566.61亿元,2003年全国城乡居民⼈民币储蓄存款余额103617.7亿元。
统计学练习(内)2013答案
第三章统计整理1、某生产车间20名工人日加工零件数(件)如下:30 26 42 41 36 44 40 37 43 35 31 36 49 42 32 25 30 46 29 34要求:根据以上资料分成如下几组:25-30,30-35,35-40,40-45,45-50,计算出各组的频数和频率,整理编制次数分布表。
解:40名工人加工零件数次数分配表为:第四章总量指标与相对指标4.1某空调厂2003年产量资料如表4—1所示。
的单位成本计划降低5.2%,实际降低6.4%。
试运用各类相对指标对该厂2003年的空调生产情况进行分析。
解:该厂空调总产量计划完成百分比为110%,其中窗式空调计划完成百分比为102.22%;柜式空调计划完成百分比为133.33%;空调生产单位成本计划完成百分比为98.73%。
2003年空调总产量66万台,其中窗式占69.70%,柜式占30.30%,窗式产量与柜式产量比为2.3:1;空调总产量与2002年相比增长了26.92%,其中窗式空调产量增长9.52%,柜式空调产量增长100%。
空调总产量已经达到国家重点企业产量的68.75%,其中窗式、柜式空调产量分别达到国家重点企业产量的69.7%与66.7%;资金利润率为18.02%.第5章 数据的分布特征的测度5.1 某百货公司6月份前6天的销售额数据(万元)如下: 276 297 257 252 238 310计算该百货公司这6天的日销售额的均值、中位数、众数、四分位数。
解:67.2716310238252257297276=+++++==∑nx x i(万元)排序:238 252 257 276 297 310不存在O U L M 25.300 Q 5.248Q 5.266===e M解:2000年甲种自行车的平均单位成本=210*0.4+230*0.45+250*0.15=225 (元/辆)5.3已知某集团下属各企业的生产资料如下:试计算该集团生产平均计划完成百分比 解:列表计算如下该集团生产平均计划完成百分比%57.103420435==∑∑=xm m X5.4 某电子产品某电子产品企业工人日产量资料如下表:试根据表中资料计算工人日产量的平均数、中位数和众数,并判断该分布数列的分布状64.84848660428001121332211===++++++=∑∑==ni ini iinnn f f xf f f f x f x f x f x x60=L 70=U 260=f1401=-f 1501=+f 10=i代入公式65.2173910)150260()140260(15026070)()(111=⨯-+---=⨯-+---=+-+i f f f f f f U M o651026020026607021=⨯--=⨯--=+∑i f S fU M mm e651026020026606021=⨯-+=⨯-+=-∑i f S fL M m m e5.5 一位投资者持有一种股票,2001-2004年的收益率分别为4.5%,2.1%,25.5%和1.9%。
统计学第3、4章知识点与习题(含答案)
第三章数据资料的统计描述:统计表和统计图第一节定性资料的统计描述知识点:1、统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
2、定性数据的频数、频率、百分数、累计频数、累积频率的概念及计算。
3、定性数据频数分布表示方法主要有条形图、扇形图。
第二节定量数据的统计描述知识点:1、定量数据频数分布表的编制:(1)整理原始资料;(2)确定变量数列的形式;(3)编制组距式变量数列。
应注意的问题:确定组距,确定组限。
考查的区间式分组数据按“上组限不在组内”的原则确定。
2、定量数据的频数、频率、百分数、累积频数、累计频率的概念及计算。
3、定量数据频数分布表示方法主要有直方图、折线图和曲线图三种。
第三节探索性数据分析——茎叶图知识点:1、基本茎叶图的理解及编制第四节相关表与相关图知识点:1、相关表,反映定性变量与定量变量之间的相关关系。
2、散点图,反映两个定量变量之间的相关关系。
根据散点图判断两个变量的相关关系。
第四章数据资料的统计描述:数值计算第一节集中趋势知识点:关于单值式分组和区间式分组数据的1、平均数的计算,包括算术平均数,几何平均数,调和平均数2、众数的计算3、中位数、四分位数的计算4、(补充知识点)平均数、众数、中位数三者之间的关系5、百分位数的计算6、截尾均值的计算第二节离散测度知识点:1、极差的计算2、关于单值式分组和区间式分组数据的四分位数差的计算3、关于单值式分组和区间式分组数据的方差、标准差的计算4、变异系数的计算5、(补充知识点)偏度、峰度的含义及计算第三节协方差与相关系数知识点:1、样本协方差的含义及计算2、相关系数的含义及计算第四节相对位置测度与奇异点知识点:1、数据的标准化处理2、奇异点的诊断:利用契比雪夫定理和经验规则第五节探索性分析——5点描述与箱线图知识点:1、5点描述法的理解2、箱线图的理解与运用第三章习题:一、填空题1、在对数据资料进行统计描述时,______反映了各个组中每一项目出现的次数,______反映了各个组中项目发生的比例。
统计学第三章(统计资料的整理与展示)
第三章统计数据的整理与显示一、单项选择题:1.将统计总体按某一标志进行分组后,其结果是()。
A.组内同质性,组间同质性B.组内差异性,组间差异性C.组内同质性,组间差异性D.组内差异性,组间同质性2.在组距数列中,当全距确定时,组距与组数的关系是()。
A.组距越大,组数越小B.组距越大,组数越大C.组距越小,组数越小D.组距与组数的关系不确定3.连续型量在确定组限时,相邻组的组限必须()。
A.间断B.重叠C.相等D.不等4.变量数列中,各组频率的合计数应该为()。
A.大于1B.等于1C.小于1D.不等于15.在异距数列中,要准确反映其分布状况,必须采用()。
A.向上累计B.向下累计C.频数D.频率密度6.计算向上累计次数或频数时,其计数表达的意义是()。
A.上限以下的累计次数或频数B.上限以上的累计次数或频数C.下限以下的累计次数或频数D.上限以上的累计次数或频数7.在统计表中,说明统计表名称的词语是()。
A.主词B.宾词C.总标题D.横行标题8.次数分布的特征是:两头小,中间大。
即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。
这种次数分布是()。
A.正态分布B.U形分布C.正J形分布D.反J形分布9.类似于直方图,与直方图比较,其构造更容易,且能显示变量的实际值,从而不会因数据分组将具体的数值信息丢失,这种图是()。
A.折线图B.曲线图C.茎叶图D.帕拉图10.填写统计表时,当某一位置不应该有数字,应用的符号是()。
A.0B.×C.…D.–二、多项选择题:1.在统计数据整理之前,要对统计数据进行审核。
审核的主要内容是()。
A.数据的准确性B.数据的及时性C.数据的系统性D.数据的完整性E.数据的客观性2.统计分组的作用是()。
A.划分社会经济现象的类型B.刻画总体具有的特征C.揭示社会经济现象的内部构成D.反映总体单位的分布情况E.分析社会经济现象之间的依存关系3.在组距数列中,组中值是()。
统计学例题-统计整理
-
-
29
例:单项式分组
育龄妇女生育子女存活数
按存活数分组(个)
0 1 2 3 4 5 合计
人数 f
7 24 35 20 10 4 100
2019/10/31
30
例:品质数列
按企业类型分组
国有企业 独资企业 合资企业 民营企业
合计
频数 f
24 35 20 10
89
2019/10/31
品质数列
31
例:组限的重叠(连续)排列
—
次数/频数
第三章 统计数据的整理
34
志值 D.总体各单位具有某一共同的品质标志或数量标志。
简单现象总体
车间名称
一车间 二车间 合计
产量(万件)
2011 f0 9 6
2012 f1 14 12
15
26
4
复杂现象总体
产品
A 产品 B 产品 C 产品 合计
产量
单位
f
吨
900
千件
160
立方米
500
-
-
5
简单现象总体(与前比较)
产 品 单位
认识统计总体:
3,调查某市的失业率,则调查对象是全市的:
A.就业人口, B.失业人口, C.总人口, D.经济活动人口(A+B)。
统计总体的同质性指:
A.总体各单位具有全部共同的品质标志或数量标志 B.总体各单位具有全部共同的品质标志属性或数量标
志值 C.总体各单位具有某一共同的品质标志属性或数量标
第三章 统计数据的整理
20
例 某企业电子元件耐用时数抽样资料
单位:小时
830 880 1 170 1 080 1 250 1 360 1 410 1170
统计学第三章
统计学第三章第三章统计整理一、单项选择题1、统计整理阶段最关键的问题是:A统计分组和统计汇总B统计指标和统计分析C统计分组和统计指标D统计分组和统计分析2、在统计整理工作阶段的统计整理:A主要对原始资料整理B只对原始资料整理C主要对次级资料整理D只对次级资料整理3、将统计总体按某一标志分组的结果表现为:A组内同质性,组间差异性B组内差异性,组间差异性C组内差异性,组间同质性D组内同质性,组间同质性4、统计分组的关键在于:A确定分组标志B确定组数C确定组距D确定分组组限5、按组距分组而编制的变量数列称为:A分配数列B组距数列C分组数列D分布数列6、划分连续型变量的组限时,相邻组的组限必须:A相等B不等C重叠D间断7、次数分配数列是指:A各组组别依次排成的数列B各组次数依次排成的数列C各组组别与次数(或频率)依次排列而成的数列D各组频率依次排成的数列8、在次数分布中,比率是指:A各组分布次数频率之比B各组分布次数与总次数之比C各组分布次数相互之比D各组的频率相互之比9、各组变量值在决定总体数量大小中所起的作用:A与次数或比率大小无关B与次数或比率大小有关C与次数大小有关,与比率大小无关D与次数大小无关,与比率大小有关10、商业企业按经济类型分组和商业企业按职工人数分组,这两个统计分组是:A按数量标志分组B前者按数量标志分组,后者按品质标志分组C按品质标志分组D前者按品质标志分组,后者按数量标志分组11、下面属于变量分配数列的资料有:A大学生按专业分配B电站按发电能力分配C商业企业按类型分配D企业按国民经济部门分配12、对同一总体选择两个或两个以上的标志进行简单分组是:A简单分组B平行分组体系C复合分组D复合分组体系13、变量数列中各组频率的总和应该:A小于1B等于1C大于1D不等于114、在等距数列中,组距的大小与组数多少成:A正比B等比C反比D不成比例15、要准确地反映异距数列的实际分布情况,必须采用:A次数B次数密度C频率D累计频率16、说明统计表名称的语句,在统计表中称为:A横行标题B主词C纵栏标题D总标题17、统计表中的横行标题是表示各组的名称,一般写在统计表的:A上方B下方C左方D右方18、统计表的主词是指:A各种指标所描述的研究对象B描述研究对象的指标C宾词的具体表现D总体单位标志的总称19、区分简单分组和复合分组的依据是:A分组对象的复杂程度B采用分组标志的多少不同C分组的数目多少不同D研究的总体变化如何20、把统计表区分为简单表和分组表的标志是:A分组标志的选定B分组的数目多少C看主词是否分组D总体是否相同21、统计表区分为调查表、汇总表(或整理表)和分析表,其划分依据是:A统计表的性质B统计表的作用C统计数列的性质D统计分组的情况22、反映事物属性、性质的标志分组称为:A数量标志分组B品质标志分组C主要标志分组D辅助标志分组23、统计资料整理的内容不包括:A对原始资料进行审核与检查B对原始指标进行综合汇总C将汇总的结果编制成统计表与分析表D对统计资料进行分析研究24、将某企业职工人数按年龄分为5组,这种分组属于:A简单分组B复合分组C平行分组D再分组25、分配数列中的次数是指:A用以分组的标志B分组的组数C分布在各组的单位数D分组的次数26、品质数列和变量数列的区别在于:A数列的质量B数列的组数C各组次数分布性质D分组标志的性质27、在全距一定的情况下,组距大小与组数多少:A成反比B成正比C无比例关系D有时成正比,有时成反比28、组距数列中的上限一般是指:A本组变量的最大值B本组变量的最小值C总体内变量的最大值D总体内变量的最小值29、有各组上限和下限进行平均,其结果是:A组距B组数C组限D组中值30、某大学学生分别按年龄和年级分组,形成的是:A平行分组体系B复合分组体系C平行与复合二者兼而有之D不成体系二、填空题1、______是统计工作的第三阶段,既是______的继续,又是______的前提。
统计学原理第三章(统计资料整理)习题答案
第三章统计资料整理一.填空题部分(将正确答案的序号填在括号内,共12小题,每小题2分,共24分)1:统计整理实现了个别单位的()向说明总体数量特征的()过渡。
答案:标志值指标值2:分析分组的分组标志称为(),与其对应的标志称为()。
答案:原因标志结果标志3:统计分组按分组标志的多少不同,可分为()和()两种。
答案:品质分组变量分组4:社会劳动力资源按学历程度不同分组,属于(),按劳动生产率水平分组属于()。
答案:品质分组变量分组5:统计分组按分组标志的多少不同,可分为()和()两种。
答案:简单分组复合分组6:离散变量分组中,变量值变动幅度比较小时,应采取(),如变量值变动很大,项数很多时则采取()。
答案:单项式分组组距式分组7:统计分布主要包括()和()两个要素。
答案:统计分组各组单位数8:根据分组标志的不同,分配数列可分为()和()。
答案:品质分配数列变量数列9:变量数列中各组标志值出现的次数称(),各组单位数占单位总数的比重称()。
答案:頻数頻率10:累计()和累计()可以更简便地概括总体各单位的分布特征。
答案:頻数頻率11:任何一个统计分布都必须满足()和()两个条件。
答案:各组頻率大于零各组頻率之和等于1(或100%)12:统计表中宾词配置可有()和()两种。
答案:平行配置层叠配置二.单项选择题部分(将正确答案的序号填在括号内,共10小题,每小题2分,共40分)1:统计整理的关键在( B )。
A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表2:在组距分组时,对于连续型变量,相邻两组的组限( A )。
A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数3:下列分组中属于按品质标志分组的是( B )。
A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。
高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案
高等职业教育“十一五”规划教材《统计学》第三章课后习题及答案一.判断题1.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。
对。
所谓“上组限不在内”的原则,是对连续变量分组采用重合组限时,习惯上规定一般只包括本组下限变量值的单位,而当个体的变量值恰为组的上限是时,不包括在本组。
2.统计资料的整理不仅是对原始资料的整理,而且还包括对次级资料的整理。
对。
3.在确定组限时,最大组上限必须大于最大变量值,最小组下限必须小于最小变量值。
错,等于也可在闭口组中试用。
4.对统计总体进行分组是由于总体各单位的“同质性”所决定的。
错,将原始数据按照某种标准化分成不同的组别。
5.连续型变量在进行分组时,其组限可以采取“不重叠”式表示。
对。
二.单项选择题1.某连续型变量的组距数列,其末组为开口凯旋而归,下限为600,其邻组的组中值为550,则末组的组中值为(B)A.550B.650C.700D. 750由于是连续型变量,变量值之间是连续的。
又因为末组的开口下限比邻组中值要大,注意它是一个递减变量数列。
而一个组的最小值,称为下限。
所以这里的下限,实际才是邻组的上限。
所以末组的下限=邻组的上限,因此邻组的上限也是600。
又有邻组的组中值是550,所以可以确定邻组的组距为100。
再利用公式:缺上限开口组组中值=下限+邻组组距/2可得末组组中值为650。
2.对一个总体选择三个标志做复合分组,按各个标志所分的组数分别为3、4、5,则所分的全部组数为(A)A.60B.12C.30D.63.某小区居民人均月收入最高为5500元,最低为2500元,据此分为6组,形成等距数列,其组距应为(A)A.500B.600C.550D.6504.统计资料整理的首要环节是(C)A.编制统计报表B.审核汇总资料C.审核原始资料D.设计整理方案5.某年收入变量数列,其分组依次为10万元以下,10-20万元,20-30万元,30万元以上,则有(C)A、10万元应归入第一组B、20万元应归入第二组C、20万元应归入第三组 D、30万元应归入第三组6.组数与组距的关系是(A)A.组数越多,组距越小B.级数越多,组距越大C.组数与组距无关D.组数越少,组距越小三.简答题1.简述统计整理的意义及内容统计整理,首先要搞清楚教材当中关于统计整理的内容,通常理解的统计整理包括制作次数分布、或者给出排秩、等级的结果,有些还可能包括对数据的类型的判别、编码和对原始数据的必要转换等.有些人认为描述统计也可以视为统计整理的内容,或者是汇总统计的内容.根据统计整理的内容再来回答其意义.主要是可以在正式的描述统计和推断统计之前,预先了解和掌握数据的大致状况,尤其是其分布和次数特征,以便根据数据的类型选择适当的统计方法(不论是描述统计还是推断统计,很重要的一点是依据数据的类型来选择统计法).有些时候,需要对数据进行必要的转换,也是为了便于后继的统计,如由量表原始数据转换成量表得分,原始数据转换成标准分数,或者转换成可统计的某种指标等.总之,数据整理是为了服务于后继的统计过程,使得原始测量数据符合统计方法的需要,同时,也是为统计方法的选择提供依据.2.简述数据的类型及整理方法(1)分类数据把数据按照一定的标志进行分类,形成各且单位数在各组的分布,并用表格形式表现出来,称为频数分布,落在某一特定类型(或组)中的数据个数,称为频数,也称次数。
统计学·统计整理3期末必刷题
第三章:统计整理一、填空题1、统计整理的中心内容是统计分组,统计分组的关键是选择分组标志。
2、统计整理包括资料审核、统计分组、统计汇总和编制统计表四方面内容。
3、在分布数列中,各组单位数与总体单位数的比率称为频率,又称为比重或百分比。
4、变量值中最大值与最小值的差额称为全距;在组距数列中,各组上限与下限的差额称为组距。
5、统计表从形式上看,由总标题、横标题、纵标题数据和四部分构成;从内容上看,由主词和宾词两部分构成。
6、统计表按主词是否分组和分组程度可分为简单表、简单分组表和复合分组表。
7、统计表的宾词排列形式有简单设计和符合设计两种。
8、统计分组的基本原则是穷尽原则和互斥原则;按分组标志的多少和组合形式不同,统计分组有简单分组和复合分组两种。
9、统计分组同时具有两个含义:一是将总体划分为性质不同的若干组;二是将性质相同的单位合并在一起。
10、在组距数列中,用组中值来代表各组内变量值的一般水平,它是假定各组内变量值是均匀分布的。
二、是非题1、按一个标志进行的分组是简单分组,按多个标志进行的分组是复合分组。
(×)2、统计表中如果不存在某项数字时,应用符号“—”表示。
(√)3、统计分组的首要问题就是正确划分各组的界限。
(√)4、在编制变量数列时,若资料有特大或特小的极端数值,则宜采用开口组表示。
(√)5、连续型变量只能作组距式分组,且组限只能是重叠组限表示法。
(√)6、所谓“上限不在内”原则,是指当某单位的标志值恰好等于某组上限时,就把该单位归入该组。
(×)7、次数分布有两种表现方法,一种是用表格表示,另一种是用图表示。
(√)8、能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。
(√)三、单项选择题1、统计分组的依据是(A )A、标志B、指标C、标志值D、变量值2、统计分组的关键在于( A )A、正确选择分组标志B、正确划分各组界限C、正确确定组数和组限D、正确选择分布数列种类3、在全距一定的情况下,组距的大小与组数的多少成( B )A、正比B、反比C、无比例关系D、有时成正比有时成反比4、简单分组与复合分组的区别在于(D )A、总体的复杂程度不同B、组数多少不同C、选择分组标志的性质不同D、选择的分组标志的数量不同5、等距分组适合于( B )A、一切变量B、变量变动比较均匀的情况C、呈急剧升降变动的变量D、按一定比率变动的变量6、确定连续型变量的组限时,相邻的组限一般要求( B )A、不重叠B、重叠C、不等D、重叠或不重叠7、简单表与分组表的区别在于( C )A、主词是否分组B、宾词是否分组C、分组标志的多少D、分组标志是否重叠8、统计表的横行标题表示各组的名称,一般应写在统计表的( B )A、上方B、左方C、右方D、均可以9、在统计汇总时,如果只要求计算各组分配的单位数,可采用(B )A、过录法B、划记法C、折叠法D、卡片法10、在填写统计表时,当发生某项不应有数字时,用( C )符号表示A、OB、XC、—D、...11、按某一标志分组的结果表现为( B )A、组内同质性,组间同质性B、组内同质性,组间差异性C、组间差异性,组间同质性D、组间差异性,组间差异性12、累计次数或累计频率中的“向上累计”是指( C )A、将各组变量值由小到大依次相加B、将各组次数或频率由小到大依次相加C、将各组次数或频率从变量值最低的一组向最高的一组依次相加D、将各组次数或频率从变量值最高的一组向最低的一组依次相加13、要准确地反映异距数列的实际分布情况,应采用( D )A、次数B、累计频率C、频率D、次数密度14、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,末组的组中值为( C )。
《统计学概论》第三章课后练习题答案
《统计学概论》第三章课后练习题答案一、思考题1.什么是统计整理,统计整理的对象是什么?P612.什么是统计分组,它可以分为哪几种形式?P633.简述编制变量数列的一般步骤。
P70-754.统计表分为哪几种?P785.什么是统计分布,它包括哪两个要素?P686.单项式分组和组距公式分组分别在什么情况下运用?P667.如何正确选择分组标志?P658.为什么要进行统计分组?其主要作用是什么?P63(2009.01)二、判断题1.统计整理只能对统计调查所得到的原始资料进行加工整理。
(×)P61【解析】统计整理分为两情况:一种是对原始资料进行整理,另一种是对次级资料即已加工过的现成资料进行在整理。
2.对一个既定总体而言,合理的分组标志只有一个。
(×)P67【解析】复合分组就是对同一总体选择两个或两个以上标志进行的分组。
3.在异距数列中,计算次数密度主要是为了消除组距因素对次数分布的影响。
(√)P74 4.组中值是指各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。
(×)P72【解析】当组内标志值分布均匀时,组中值能代表各组的一般水平(平均水平),当组内标志值分布不均匀时,组中值不能代表各组的一般水平(平均水平)。
5.在变量数列中,组数等于全距除以组距。
(×)(2010.01)P71【解析】变量数列的分组可分为等距分组和异距分组,只有在等距分组的情况下,组数等于全距除以组距。
6.统计分组的关键问题是确定组数和组距。
(×)(2009.10)P65【解析】统计分组的关键问题是选择恰当的分组标志。
7.按数量标志分组的目的,就是要区分各组在数量上的差别。
(×)P66【解析】按数量标志分组的目的,并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
8.连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。
统计学第三章习题答案
统计学第三章习题答案1. 描述性统计量:在描述一组数据时,我们通常使用均值、中位数、众数、方差和标准差等统计量。
例如,如果一组数据为 {2, 4, 4, 4, 5, 5, 7, 9},其均值为 (2+4+4+4+5+5+7+9)/8 = 5,中位数为4.5(因为数据是偶数个,所以取中间两个数的平均值),众数为4(出现次数最多),方差为 (1/8) * [(2-5)^2 + ... + (9-5)^2] = 8.5,标准差为方差的平方根,即√8.5。
2. 频率分布表:将数据分组并计算每个组的频数或频率。
例如,如果数据是年龄分布,可以创建如下的频率分布表:| 年龄区间 | 频数 | 频率 || | - | - || 20-25 | 10 | 0.2 || 26-30 | 15 | 0.3 || ... | ... | ... |3. 直方图和箱线图:直方图用于显示数据的分布情况,箱线图则提供了数据的最小值、第一四分位数、中位数、第三四分位数和最大值的快速视图。
例如,对于上述年龄数据,可以绘制相应的直方图和箱线图来观察数据的分布和集中趋势。
4. 概率分布:在统计学中,我们经常使用正态分布来描述数据的分布。
正态分布的数学表达式为N(μ, σ^2),其中μ是均值,σ^2是方差。
例如,如果一个随机变量X服从正态分布N(50, 25),那么X的均值是50,方差是25。
5. 中心极限定理:无论原始数据的分布如何,当样本量足够大时,样本均值的分布将趋近于正态分布。
这个定理是推断统计的基础之一。
6. 假设检验:假设检验是统计推断的一部分,用于确定一个统计假设是否成立。
例如,如果我们要检验一个样本均值是否显著不同于总体均值,可以使用t检验。
具体步骤包括提出原假设和备择假设,选择适当的检验统计量,确定显著性水平,计算p值,并作出结论。
7. 置信区间:置信区间提供了一个范围,我们可以在这个范围内估计总体参数的值。
例如,如果我们有一个样本均值和样本标准差,我们可以计算95%置信区间来估计总体均值的范围。
《统计学原理》教材课后习题参考答案
2.给定显著性水平。取显著性水平 ,由于是双侧检验,因此需要确定上下两个临界值 和 。查表得到 ,所以。拒绝区间为小于-1.96或者大于1.96。
3.检验统计量
4.检验判断。
由于z的实际值在-1.96和1.96之间,没有落入拒绝区间,所以接受原假设,认为净重是符合规定
(五)计算题
1.因为2000年计划完成相对数是110%,所以
实际产值=
2000年计划产值比1999年增长8%,
所以1999年的计划产值=
那么2000年实际产值比1999年计划产值增长=
2.(1)
从第四年第四季度到第五年第三季度这一年的时间,实际上这一年的产量达到
则
这一题规定年末产量应达到170,所以提前时间按照水平法来算。
3..根据题意,样本的平均数和标准差为
根据样本信息,计算统计量
4.检验判断。因为 ,所以在显著性水平0.01下,拒绝原假设,也就是说,含量是超过规定界限
第九章相关与回归
(一)判断题
1.×2.√3.√4.√5.×6.×7.×8.×
(二)单项选择题
1.① 2.① 3.③ 4.④ 5.④6.②7.②8.④
2.由题意
=8.89
3.由题意
令这个数为a。则
4.由题意
5.
销售额
售货员人数
组中值
20000-30000
30000-40000
40000-50000
50000-60000
60000-70000
70000-80000
80000以上
8
20
40
100
82
10
5
25000
35000
统计补充例题
第三章统计整理例1、某厂工人日产量资料如下:(单位:公斤)162158 158 163 156 157 160162168 160 164 152 159 159 168 159 154 157 160 159163160 158154156 156156 169 163 167试根据上述资料,编制组距式变量数列,并计算出频率。
解:将原始资料按其数值大小重新排列。
152154 154 156 156 156156157 157 158158 158 159 159 159159 160 160159160 162 162 163 163 163 164 167 168 168 169最大数=169,最小数=152,全距=169-152=17n=30,分为6组例2、某企业50个职工的月工资资料如下:113 125 78115 84 135 97 105 110130105 85 88 102 101103 107 118 10387116 67 106 63 115 85 121 97 117 10794 115 105 145 103 97 120 130 125 127122 8898 131 112 94 96 115 145 143试根据上述资料,将50个职工的工资编制成等距数列,列出累计频数和累计频率.解:将原始资料按其数值大小重新排列。
6367 78 84 85 85 87 8888 94 94 96 979797 98101 102 103 103 103 105 105 105106107110 112113 115 115 115 115 116117118 120 121 122125 125 127 130 130118131 135 143 145 145例3、有27个工人看管机器台数如下:5 4 2 4 3 4 3 4 42 434 3 2 6 4 42 2 3 4 53 24 3试编制分布数列。
《统计学概论》第三章课后练习题答案
《统计学概论》第三章课后练习题答案一、思考题1.什么是统计整理,统计整理的对象是什么?P612.什么是统计分组,它可以分为哪几种形式?P633.简述编制变量数列的一般步骤。
P70-754.统计表分为哪几种?P785.什么是统计分布,它包括哪两个要素?P686.单项式分组和组距公式分组分别在什么情况下运用?P667.如何正确选择分组标志?P658.为什么要进行统计分组?其主要作用是什么?P63(2009.01)二、判断题1.统计整理只能对统计调查所得到的原始资料进行加工整理。
(×)P61【解析】统计整理分为两情况:一种是对原始资料进行整理,另一种是对次级资料即已加工过的现成资料进行在整理。
2.对一个既定总体而言,合理的分组标志只有一个。
(×)P67【解析】复合分组就是对同一总体选择两个或两个以上标志进行的分组。
3.在异距数列中,计算次数密度主要是为了消除组距因素对次数分布的影响。
(√)P74 4.组中值是指各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。
(×)P72【解析】当组内标志值分布均匀时,组中值能代表各组的一般水平(平均水平),当组内标志值分布不均匀时,组中值不能代表各组的一般水平(平均水平)。
5.在变量数列中,组数等于全距除以组距。
(×)(2010.01)P71【解析】变量数列的分组可分为等距分组和异距分组,只有在等距分组的情况下,组数等于全距除以组距。
6.统计分组的关键问题是确定组数和组距。
(×)(2009.10)P65【解析】统计分组的关键问题是选择恰当的分组标志。
7.按数量标志分组的目的,就是要区分各组在数量上的差别。
(×)P66【解析】按数量标志分组的目的,并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
8.连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。
《统计学概论》第三章课后练习题答案
《统计学概论》第三章课后练习题答案一、思考题1.什么是统计整理,统计整理的对象是什么?P612.什么是统计分组,它可以分为哪几种形式?P633.简述编制变量数列的一般步骤。
P70-754.统计表分为哪几种?P785.什么是统计分布,它包括哪两个要素?P686.单项式分组和组距公式分组分别在什么情况下运用?P667.如何正确选择分组标志?P658.为什么要进行统计分组?其主要作用是什么?P63(2009.01)二、判断题1.统计整理只能对统计调查所得到的原始资料进行加工整理。
(×)P61【解析】统计整理分为两情况:一种是对原始资料进行整理,另一种是对次级资料即已加工过的现成资料进行在整理。
2.对一个既定总体而言,合理的分组标志只有一个。
(×)P67【解析】复合分组就是对同一总体选择两个或两个以上标志进行的分组。
3.在异距数列中,计算次数密度主要是为了消除组距因素对次数分布的影响。
(√)P74 4.组中值是指各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。
(×)P72【解析】当组内标志值分布均匀时,组中值能代表各组的一般水平(平均水平),当组内标志值分布不均匀时,组中值不能代表各组的一般水平(平均水平)。
5.在变量数列中,组数等于全距除以组距。
(×)(2010.01)P71【解析】变量数列的分组可分为等距分组和异距分组,只有在等距分组的情况下,组数等于全距除以组距。
6.统计分组的关键问题是确定组数和组距。
(×)(2009.10)P65【解析】统计分组的关键问题是选择恰当的分组标志。
7.按数量标志分组的目的,就是要区分各组在数量上的差别。
(×)P66【解析】按数量标志分组的目的,并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
8.连续型变量可以作单项式分组或组距式分组,而离散型变量只能作组距式分组。
统计学第三章课后题及答案解析
第三章 一、单项选择题1. 统计整理的中心工作是( )A. 对原始资料进行审核 C.统计汇总问题2. 统计汇总要求资料具有( )A. 及时性 C-全而性3. 某连续变量分为五组:第一组为40—50,70—80,第五组为80以上,依习惯上规定A. 50在第一组,70在第四组B. 编制统计表 D.汇总资料的再审核 B. 正确性 D.系统性第二组为50—60,第三组为60—70,第四组为)B. 60在第二组,80在第五组C. 70在第四组,80在第五组D. 80在第四组,50在第二组4・若数量标志的取值有限.且是为数不多的等差数值,宜编制( ) A.等距式分布数列 C.开口式数列 5・组距式分布数列多适用于( ) A.随机变量 C.连续型变量6.向上累计次数表示截止到某一组为止(A.上限以下的累计次数C.各组分布的次数B.单项式分布数列D.异距式数列 B.确立型变量 D ・离散型变量 ) B.下限以上的累计次数 D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于( ) A.正态分布曲线 C.右偏分布曲线 B. J 型分布曲线 D.左偏分布曲线 &划分连续变量的组限时,相临组的组限一般要( ) A.交叉 C.重叠 二、多项选择题 1.统讣整理的基本内容主要包括( A.统计分组 B.不等 D.间断 B.逻借检查C.数据录入 E.制表打印 2. 影响组距数列分布的要素有( A.组类 C.组距 E.组数据 3. 常见的频率分布类型主要有( A.钟型分布 C. U 型分布 D ・统讣汇总 )B.组限 D.组中值)B. x 型分布 D. J 型分布E. F 型分布 4•根据分组标志不同,分组数列可以分为()C.单项数列D. 变量数列E. 开口数列5. 下列变量一般是钟型分布的有()A. 粮食平均产量的分布B. 零件公差的分布C. 大学生身髙的分布D. 商品市场价格的分布E. 学生成绩的分布6. 下列变量呈J型分布的有()A. 投资额按利润率的分布B. 60岁以上人口按年龄分组的分布C.经济学中的供给曲线D.不同年龄人口的死亡率分布E.经济学中的需求曲线三、填空题1.分布在各组的 ______ 叫次数(频数)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计整理
计算题
例1、某厂工人日产量资料如下:(单位:公斤)
162 158 158 163 156 157 160 162 168 160
164 152 159 159 168 159 154 157 160 159
163 160 158 154 156 156 156 169 163 167
试根据上述资料,编制组距式变量数列,并计算出频率。
解:将原始资料按其数值大小重新排列。
152154 154 156 156 156 156 157 157
158158 158 159 159 159 159 160 160
159160 162 162 163 163 163 164 167
168 168 169
最大数=169,最小数=152,全距=169-152=17
例2、某企业50个职工的月工资资料如下:
113 125 78 115 84 135 97 105 110 130
105 85 88 102 101 103 107 118 103 87
116 67 106 63 115 85 121 97 117 107
94 115 105 145 103 97 120 130 125 127
122 88 98 131 112 94 96 115 145 143
试根据上述资料,将50个职工的工资编制成等距数列,列出累计频数和累计频率。
解:将原始资料按其数值大小重新排列。
6367 78 84 85 85 87 88 88 94 94 96 97
9797 98 101 102 103 103 103 105 105 105
106107 110 112 113 115 115 115 115 116
117118 120 121 122 125 125 127 130 130
例3、有27个工人看管机器台数如下:
5 4 2 4 3 4 3 4 4
2 4
3
4 3 2 6 4 4
2 2
3
4
5 3 2 4 3
试编制分布数列。
解:【分析】“工人看管机器台数”是离散型变量,变量值变动范围很小,变量值项数也很少,应编制单项变量数列。
编制结果如下:
为了研究工人数同产值和劳动生产率两指标的依存关系,试按工人数进行等距分组,组距和组数自行确定。
每组计算:(1)工厂数;(2)工人数;(3)产值(总产值和平均每个工厂产值);(4)每个工人的平均产值。
请使用汇总表进行汇总,把汇总结果用一张统计表表现出来,并做简单分析。
解:【分析】本题总体单位数少,只有15个工厂,组数不能太多。
分组标志(工人数)最大最小标志值之差为
448-160=288
考虑分为三组,组距为288÷3=96,可上调到100作为分组的实际组距。
根据统计整理的程序,首先使用汇总表进行汇总:
资料表明,产值明显地随着工人数的增加而增加,但工人生产效率并不随工厂工人数的增加而提高。
这里,工人数在150-250人的工厂组劳动生产率(1.28万元)同350-450人的工厂组劳动生产率(1.25万元)相差无几,而工人数在250-350的工厂组劳动生产率偏低了。
说明要有适当的企业规模,才有好的规模效益。
例5、有纺织企业的纺织设备效率资料如下,试编制成分布数列、累计频数和累计频率数列,来说明这两年30个企业设备效率的变动情况。
解:【分析】纺织设备“每千锭时产量”属于连续型变量,应采取组距式分组,编制组距数列。
在编制累计频数和累计频率数列时,要注意各组名称用上限或下限表示的特点。
我们把各纺织企业1月份每千锭时产量资料分成五组,编制的数列如下:
向下累计的频数和频率数列:
向上累计可见:按1月份每千锭时产量分组,基年年产量750千克以下的企业有17个,占企业总数的57%,而报告年只有11个,占企业总数的37%。
再从向下累计来看,按1月份每千锭时产量分组,基年年产量达到800千克以上的企业有3个,占企业总数的10%,而报告年增加到7个企业,占企业总数的23%;且报告年有2个企业1月份产量达到850千克以上,而基年没有,说明这30个纺织企业设备效率报告年比基年有明显提高。