第3章:统计资料的整理与显示

合集下载

第三章社会统计资料的整理

第三章社会统计资料的整理
表1 某班学生统计学考试成绩表
本例视研究对象本身的特点和研究的目的,按组距为10,定组数为5。按经验的看法,组数过多过少都不妥,一般情况下可分为5~7组,组数尽可能取奇数,避免偶数。
(二)等距分组和异距分组 组距数列根据组距是否相等,分为等距数列和异距数列两种。等距数列中各组组距都是相等的(如表1所示);异距数列中每组的组距是不全相等的(如表2所示)。
分配数列是统计分组的一种重要形式,它可以反映总体的结构分布状况和分布特征,这对于统计分析是很重要的。根据分组标志的不同,分配数列可分为两种:品质分配数列(简称品质数列);变量分配数列(简称变量数列)。 按品质标志分组形成为品质数列。品质数列由各组名称和次数组成。各组次数可以用绝对数表示,即频数;也可以用相对数表示,即频率。见表3-3。
由此可见,变量数列也是由各组名称(由变量值表示)和次数(或频率)组成。频率大小表明各组标志值对总体的相对作用程度,也可以表明各组标志值出现的频率大小。变量的具体数值即变量值通常用符号x表示;各组单位数即次数或频数(其相对形式即频率)通常用符号f表示。变量数列的编制,特别是其中组距数列的编制是比较复杂的,下面就组距数列的编制方法专门加以研究。
等距数列适用于标志变异比较均匀的现象,或者说,各组性质差异是由变量值均匀增加或减少而引起的。例如,学生成绩60分以上者,每增加10分就进入高一级档次。人口按身长、体重的分组等,一般均采用等距数列。
2、异距数列。异距数列各组次数的数值受组距不同的影响。在研究各组次数实际分布时,要消除组距不同的影响,这就要将不等组距的次数换算成标准组距次数。可以数列中最小组组距为标准组距,将不等组距次数换算为统一的标准组距次数,并以此绘制图形,或者是在原数列基础上先计算次数密度或频率密度,其公式为: 次数密度=各组次数/各组组距 频率密度=各组频率/各组组距 以上两种方法实质上是一样的。

统计学基础第三章统计整理

统计学基础第三章统计整理

第三章统计整理【教学目的】1. 深刻理解统计分组的作用,并且能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学重点】1. 能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学难点】1. 运用分配数列对原始数据进行系统整理2. 制作统计表,运用计算机绘制统计图【教学时数】教学学时为8 课时【教学内容参考】第一节统计整理的意义一、统计整理的意义统计整理,就是根据统计研究的目的和任务的要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化,从而得到表现总体特征的综合统计资料的工作过程。

对于已整理过的初级资料进行再整理,也属于统计整理。

统计调查取得的各种原始资料是分散的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的总体情况与全貌。

因此,只有对这些资料进行加工、整理,才能认识事物的总体及其内部联系。

例如,工业企业普查中,所调查的每个工业企业资料,只能说明每个工业企业的经济类型、注册资本、职工人数、工业总产值、工业增加值、实现利税等具体情况。

必须通过对所有资料进行分组、汇总等加工处理后,才能得到全国工业企业的综合情况,从而分析工业企业的构成、经营状况等,达到对全国工业企业的全面的、系统的认识。

统计整理是统计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。

因此,资料整理得是否正确,直接决定着整个统计研究任务的完成,不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值。

因此,必须十分重视统计整理工作。

二、统计整理的步骤统计整理的基本步骤是:(一)对原始资料进行审查。

1. 审查被调查单位的资料是否齐全;2. 应审查数据是否准确。

审查的办法主要有:①逻辑审查:主要是从定性角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。

第三章统计数据的整理和显示习题

第三章统计数据的整理和显示习题

第三章统计数据的整理和显示习题部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑第三章统计数据的整理和显示练习题一、填空题1.统计数据分组的关键在于。

2.一般说来,统计分组用于三方面:(1>;<2);<3)。

3.根据分组标志的不同,统计分组可以有分组和分组。

4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。

5.在组距式数列中,表示各组界限的变量值叫。

各组中点位置上的变量值叫。

6.组距式变量数列,根据各组的组距是否相等可以分为和。

7.已知一个变量数列最后一组的下限为900,其邻组的组中值为850,则最后一组的上限和组中值分别为和。

b5E2RGbCAP8.统计资料的表现形式主要有和。

9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。

10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。

p1EanqFDPw11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。

12.直方图是用的宽度和高度来表示频数分布的图形。

13.雷达图是一种的图示方法。

二、单项选择题1.统计分组的关键问题是( >A正确选择分组标志 B确定组距和组数C确定组距和组中值 D确定全距和组距2.为了反映我国经济中所有制成份的构成情况需要进行( >A经济成份分类B登记注册类型分类C三次产业分类 D国民经济行业分类3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( >A组数较多 B标志变异不明显C两种性质变异间存在过渡形态 D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( >A260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( >A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( >A简单分组 B平行分组C复合分组 D分组体系7.用组中值代表各组内的一般水平的假定条件是( >A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布8.对统计总体按两个及以上标志分组后形成的统计表叫( >A简单表 B简单分组表C复合分组表 D汇总表9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( >A变量分组 B属性分组C分组体系 D复合分组10.在频数分布中,频率是指( >A各组频数之比 B各组频率之比C各组频数与总频数之比 D各组频数与各组次数之比11.频数分布用来表明( >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于某组的下限时,一般应将其归在( >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( >A正比例关系 B反比例关系C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( >A标志 B总体单位C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( >A左方 B上端中部 C右方 D下方16.用组中值与次数求坐标点连接而成的统计图是( >A直方图 B条形图 C曲线图 D折线图17.按字母的顺序或笔画数的多少顺序排序的统计数据一般是( >A定类型数据 B定距数据C定比数据 D定序数据18.多指标的图示方法是( >A直方图 B条形图 C环行图 D雷达图19.变量数列的构成要素是< )A分组标志和指标B分组标志和次数C数量分组标志数值和频数D品质分组标志属性和频数20.下列哪一种资料,适合编制单项数列< )A连续型变量且各变量值变动比较均匀B离散型变量且变量值的种类数较少C连续型变量且各变量值变动幅度较大D离散型变量且各变量值变动幅度较大21.某组向上累计次数表示< )A大于该组上限的次数有多少B大于该组下限的次数有多少C小于该组上限的次数有多少D小于该组下限的次数有多少三、多项选择题1.统计分组的主要应用有(>A区分现象的类型 B反映现象总体的内部结构C比较现象间的一般水平 D分析现象的变化关系E研究现象之间的数量依存关系2.指出下表表示的分布数列所属的类型( >A品质数列 B变量数列C分组数列 D组距数列E等距数列3.指出下列分组哪些是属性分组( >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组 E宾馆按星级分组4.对统计数据准确性审核的方法有( >A计算检查 B逻辑检查C时间检查 D调查检查E平衡检查5.统计数据的预处理,包括( >A数据分类 B数据筛选C数据审核 D数据订正E数据排序6.从形式上看,统计表由哪些部分构成( >A总标题 B主词 C纵栏标题D横行标题 E宾词7.按主词是否分组,统计表可分为( >A单一表 B简单表 C分组表D复合表 E综合表8.统计数据的审核主要是审核数据的( >A准确性 B及时性 C完整性D适用性 E代表性9.统计数据整理的内容一般有( >A对原始数据进行预处理 B对统计数据进行分组C对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图10.国民经济中常用的统计分组有( >A经济成分分组 B登记注册类型分组C国民经济行业分类 D三次产业分类E机构部门分类11.某厂100名工人按工资额分为800以下、800-1000、1000-1200、1200-1400、1400以上等五个组。

统计学判断题

统计学判断题

第一章总论1.社会经济统计的研究对象是社会经济现象总体的各个方面。

(×)2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。

(×)3.个人的工资水平和全部职工的工资水平,都可以称为统计指标。

(×)4.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。

(×)5.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。

(√)6.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。

(×)7.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。

(√)第二章统计数据的收集1.全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。

(×)2.对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。

所规定的一个月时间是调查时间。

(×)3.对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。

(√)4.典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。

(√)5.统计调查误差就是指由于错误判断事实或者错误登记事实而发生的误差。

(×)6.我国人口普查的总体和调查单位都是每一个人,而填报单位是户。

(√)7.与普查相比,抽样调查调查的范围小,组织方便,省时省力,所以调查项目可以多一些。

(√)8.对调查资料进行准确性检查,既要检查调查资料的登记性误差,也要检查资料的代表性误差。

(×)9.在对现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查,这种调查属于重点调查。

(×)10.普查一般用来调查属于一定时点上社会经济现象的数量,它并不排斥对属于时期现象的项目的调查。

(√)第三章统计数据的整理与展示1.统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。

应用统计学练习题(含答案)

应用统计学练习题(含答案)

第一章绪论1.统计总体的同质性是指(A)。

A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。

A.200家公司的全部职工B.200家公司C.200家公司职工的全部工资D.200家公司每个职工的工资4.一个统计总体( D)。

A.只能有一个标志B.可以有多个标志C.只能有一个指标D.可以有多个指标5.以产品等级来反映某种产品的质量,则该产品等级是(C)。

A.数量标志B.数量指标C.品质标志D.质量指标6.某工人月工资为1550元,工资是( B )。

A.品质标志B.数量标志C.变量值D.指标7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。

A.标志B.指标值C.指标D.变量值8.工业企业的职工人数、职工工资是(D)。

A.连续变量B.离散变量C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量9.统计工作的成果是(C)。

A.统计学B.统计工作C.统计资料D.统计分析和预测10.统计学自身的发展,沿着两个不同的方向,形成(C)。

A.描述统计学与理论统计学B.理论统计学与推断统计学C.理论统计学与应用统计学D.描述统计学与推断统计学三、多项选择题1.统计的含义包括(ACD)。

A.统计资料B.统计指标C.统计工作D.统计学E.统计调查2.统计研究运用各种专门的方法,包括(ABCDE)。

A.大量观察法B.统计分组法C.综合指标法D.统计模型法E.统计推断法3.全国第5次人口普查中( BCE)。

第3章 统计整理与管理

第3章  统计整理与管理
• 离散变量可以一一列举,且相邻两组的组限数值之间没有 中间数值。即相邻组的上限和下限可用相邻的两个确定的 数值来分别表示,即可采用不重叠组限。例如,企业按职 工人数分组可以表示为:499及以下,500—999,1000— 1999,2000及以上等。 • 连续变量在两个变量值之间可以有无限多个中间数值,不 可能一一列举,因此,相邻组的上限和下限无法用两个确 定的数值来分别表示。在这种情况下,前一组的上限和后 一组的下限重叠,即可采用重叠组限。例如:学生按身高 分组为140cm以下,140—150,150—160,160—170, 170以上。这里150cm,是第二组的上限,也是第三组的 下限。
第3章 统计数据的整理和管理
• • • • §3.2 统计分组 §3.2.1 统计分组的概念及作用 1. 统计分组的概念 统计分组是根据现象总体内在特点和统计研究任 务的要求,将总体按照一定标志划分为若干性质 不同又有联系的组成部分的一种统计方法。 • 例如,企业按经济类型分组,可分为:国有企业、 集体企业、个体企业和其它企业;学生按考分分 组,可分为:60分以下 (不及格)60~70分(及 格)、70~80分(中等)、80~90分(良好)和 90~100分(优秀)。
第3章 统计数据的整理和管理
• 2. 统计分组的作用 • ⑴ 划分现象的类型,通过分组将同一总体 的各个单位划分成不同的类型; • ⑵ 反映现象的内部结构,各个组中总体单 位数的多少及占总体单位数的比重反映了 总体的内部结构; • ⑶ 分析总体各部分之间的依存关系。
第3章 统计数据的整理和管理
• • • • §3.2.2 分组标志的选择 1.必须根据统计研究的目的选择分组标志。 2.必须选择能够反映现象本质的分组标志。 3.要结合现象所处的具体历史条件选择分 组标志。

《统计学基础》第三章

《统计学基础》第三章

U形分布特点:与Q钟形相 反,靠近中间的变量值分布次 数较少,靠近两端的变量值分 布的次数较多,开成“两头大、 中间小”的U字形分布。
如:人口总体中幼儿和老年死
亡人数较多,而中年死亡人数最少。
研究对象4个特点
三、次数分布的主要类型(3种)
(三)J形分布
正J形分布:次数随着变量 值的增大而增多,如投资按利 润率大小分布。
V
13-17
18-25
第四节 基本概念
V
180以上
25以上
四、统计分组的种类
(三)平行分组体系与复合分组体系 2、复合分组体系——由复合组结果所形成的分组体系。 例如:认识我国高等学校在校学生的基本情况: (1)理科组 研究生 男 女 男 女 (2)文科组 研究生
本科
男 男
本科 女

专科 男
第四节 基本概念
六、分配数列的编制方法
(四)确定组限 组限——组距两端的分界限。 1、根据变量的性质确定:
重叠组限
(连续型变量) 月收入分组 (元) 3000以下 4000-6000 6000以上 合计 人数 20 15 10 35
不重叠组限
(离散型变量) 按班级人数分组 (人) 19以下 20-29 30-39 40以上 班级数 1 6 19 4
第二节
统计分组与分配数列
一、统计分组的概念
统计分组同时具有两方面的含义: 对总体而言是“分”:将总体区分为性质相异的若
干部分;
对个体而言是“合”:将性质相同的个体组合起来。 分组基本原则:必须保持各组内资料的“同质性”
和组与组之间资料的“差异性”。
第三节
二、统计分组的作用
(一)划分现象类型
专门调查

统计学第三章(统计资料的整理与展示)

统计学第三章(统计资料的整理与展示)

第三章统计数据的整理与显示一、单项选择题:1.将统计总体按某一标志进行分组后,其结果是()。

A.组内同质性,组间同质性B.组内差异性,组间差异性C.组内同质性,组间差异性D.组内差异性,组间同质性2.在组距数列中,当全距确定时,组距与组数的关系是()。

A.组距越大,组数越小B.组距越大,组数越大C.组距越小,组数越小D.组距与组数的关系不确定3.连续型量在确定组限时,相邻组的组限必须()。

A.间断B.重叠C.相等D.不等4.变量数列中,各组频率的合计数应该为()。

A.大于1B.等于1C.小于1D.不等于15.在异距数列中,要准确反映其分布状况,必须采用()。

A.向上累计B.向下累计C.频数D.频率密度6.计算向上累计次数或频数时,其计数表达的意义是()。

A.上限以下的累计次数或频数B.上限以上的累计次数或频数C.下限以下的累计次数或频数D.上限以上的累计次数或频数7.在统计表中,说明统计表名称的词语是()。

A.主词B.宾词C.总标题D.横行标题8.次数分布的特征是:两头小,中间大。

即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。

这种次数分布是()。

A.正态分布B.U形分布C.正J形分布D.反J形分布9.类似于直方图,与直方图比较,其构造更容易,且能显示变量的实际值,从而不会因数据分组将具体的数值信息丢失,这种图是()。

A.折线图B.曲线图C.茎叶图D.帕拉图10.填写统计表时,当某一位置不应该有数字,应用的符号是()。

A.0B.×C.…D.–二、多项选择题:1.在统计数据整理之前,要对统计数据进行审核。

审核的主要内容是()。

A.数据的准确性B.数据的及时性C.数据的系统性D.数据的完整性E.数据的客观性2.统计分组的作用是()。

A.划分社会经济现象的类型B.刻画总体具有的特征C.揭示社会经济现象的内部构成D.反映总体单位的分布情况E.分析社会经济现象之间的依存关系3.在组距数列中,组中值是()。

《统计基础与方法》习题03

《统计基础与方法》习题03

第三章统计整理一、本章重点1.统计整理的意义。

统计整理既是统计调查工作的继续和深化,又是统计分析的基础和前提。

统计整理的步骤大体上可以分为:设计整理方案;审核原始资料;对原始资料进行分组、汇总和计算;审核汇总资料;编制统计图表;进行统计资料的汇编等步骤。

统计资料审核的重点是资料的完整性、及时性和准确性。

包括汇总前的审核和汇总后的审核。

2.统计分组是统计整理的核心问题。

其意义在于划分现象的类型;解释现象内部结构;分析现象之间的依存关系。

统计分组的种类有:品质标志分组与数量标志分组;简单分组与复合分组;平行分组体系与复合分组体系等。

在统计分组时要根据目的性原则、本质性原则、具体条件原则等选择分组标志。

3.分布数列。

分布数列有品质标志分布数列与数量标志分布数列之分。

数量标志分布数列又可以分为:单项式数列与组距式数列。

组距数列又可分为:等距式数列与不等距式数列;开口式数列与封闭式数列等。

分布数列的编制大体上分为以下六个步骤:确定全距、组数、组距、组限、分配各组的次数和计算组中值等。

4.统计汇总。

统计汇总的组织形式有:逐级汇总、集中汇总和综合汇总。

汇总的方法有手工汇总和计算机汇总。

常用的汇总软件有SPSS、EXCEL等。

计算机汇总是今后统计汇总的主流。

5.统计表和统计图是表述统计资料的主要形式。

广义的统计表包括统计调查表,狭义的统计表仅侧重于统计整理阶段使用的统计表。

统计表从构成形式上看是由总标题、横栏标题、纵栏标题和指标数值四部分组成;从内容上看由主词和宾词两部分构成。

统计表可以分为:简单表、分组表、复合表等。

常用的统计图有直方图、柱形图、条形图、饼行图、折线图、曲线图等。

二、难点释疑1.不能把统计整理简单地理解为就是统计资料的汇总,统计整理比统计汇总包括的范围要广泛的多,除了包括原始资料的整理外,还包括次级统计资料的整理。

2.统计分组是统计整理的核心。

统计分组的中心问题是选择分组标志和划分各组的界限。

数据的整理与展示

数据的整理与展示

分类数据的整理与图示
分类数据的整理
(基本过程)
❖ 1. 列出各类别
2. 计算各类别的频数 3. 制作频数分布表
4. 用图形显示数据
分类 A B C D E
频数
比例
百分比 比率
☺☺☺ ☺☺
分类数据的整理
(可计算的统计量)
1. 频数(frequency) :落在各类别中的数据个数 2. 比例(proportion) :某一类别数据占全部数
93.0
一般
78 26.0 198
66.0 180 60.0
满意
64 21.3 262
102
34.0
非常满意
38 12.7 300 100.0
38
12.7
合计
300 100.0 —



数据分组
数据分组的作用
▪ 区分事物的性质
例:将我国企业进行分组,就可以有效地区分它们在所有制 方面的区别
☺ ☺☺
☺☺☺
顺序数据的频数分布表
(例题分析)
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意?
1.非常不 满意;2.不满意 ;3.一般;4. 满意;5.非常满 意。
甲城市家庭对住房状况评价的频数分布
甲城市
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔除
数据筛选
(data filter)
❖ 用Excel进行数据筛选
❖ 8名学生的考试成绩数据
步骤(自动筛选1)
步骤(自动筛选2)
步骤(自动筛选3)

最新三章节统计数据整理与显示

最新三章节统计数据整理与显示
–第一组开口(多少以下),组中值=上限-相邻组组距/2 –最后一组开口(多少以上),组中值=下限+相邻组组距/2
第四节 统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
二、统计汇总的形式:
• 1、逐级汇总 • 2、集中汇总 • 3、汇审汇编 • 4、综合汇总
三、统计汇总的技术
• 1、手工汇总 • 2、电子计算机汇总
第五节 分布数列
• 分布数列——也称次数分布或次数分配,指反映 总体单位在各组分布状况的一系列数字。
• 分布数列组成要素: • 1、组的名称 • 2、各组次数(也称频数)或频率
分布数列的分类
按分组标志 品质数列
变量数列


钟形分布数列 正态分布
按商品销售额分组(万元) 商店数(个)
100以下
25
100500
70
500 1000
130
1000 3000
75
3000 5000
40
5000 10000
18
10000以上
10
流通费用率(%)
11.2 10.6 9.9 8.7 7.8 7.0 6.3
三、统计分组的种类
• 按分组的作用或目的不同分为:类型分组、 结构分组和分析分组
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
人数(人) 80 150 230 340 150 50
1000
所占(%) 8 15 23 34 15 5 100

统计学原理与实务第三章统计整理

统计学原理与实务第三章统计整理

平均指标与变异指标
总结词
平均指标是用来反映社会经济现象总体的一 般水平或集中趋势的指标。
详细描述
平均指标通常用平均数表示,如人均收入、平 均工资等,用于描述总体的一般水平。
平均指标的分类
数值平均数和位置平均数,如算术平均数、调和 平均数、几何平均数等。
变异指标
变异指标是用来反映总体各单位之间数量差异程度 的指标。
直接计数法、测量法、推算法等。
相对指标
总结词
相对指标是用来反映社会经济 现象之间数量对比关系的指标 。
相对指标的分类
结构相对数、比例相对数、比 较相对数、强度相对数等。
详细描述
相对指标通常用相对数或比例表示 ,如人口密度、劳动生产率等,用 于揭示事物之间的数量关系。
相对指标的计算方法
直接计算法、对比法、平均法 等。
通过调查、观测、实验等方式直 接获取原始数据。
间接来源
通过文献资料、政府部门或统计机 构等途径获取已整理过的数据。
现代技术
利用互联网、大Biblioteka 据等技术手段进 行数据收集。数据预处理与筛选
01
02
03
04
缺失值处理
根据实际情况对缺失数据进行 填充或删除。
异常值处理
识别并处理异常值,如使用Z 分数法或IQR法。
详细描述
变异指标通常用变异系数或标准差表示,用于揭 示总体各单位之间的数量差异程度。
变异指标的分类
绝对变异指标和相对变异指标,如标准差系数、离差系 数等。
05
统计整理的应用实例
人口普查数据的整理
总结词
系统化、标准化
详细描述
人口普查数据涉及大量个体数据,需要进行系统化、标准化的整理,以便进行 后续的数据分析。具体包括数据清洗、分类、编码等步骤,确保数据质量可靠、 准确。

《统计学原理》课后练习答案

《统计学原理》课后练习答案

各章训练参考答案第一章统计概述一.填空题1.统计资料统计学统计工作统计资料统计学统计工作2.统计理论统计方法统计工作3.数量性总体性具体性社会性4.信息职能咨询职能监督职能信息职能5.统计设计统计数据采集统计数据整理和显示统计数据分析统计数据采集统计数据整理和显示统计数据分析6.同质性大量性差异性同质性7.总体单位名称总体单位8.品质标志数量标志标志值9.可变的数量标志连续型变量离散型变量10.数量指标质量指标11.统计指标体系12.同类社会经济现象总体范畴具体数值数量性综合性具体性二.单项选择题1.B 2.B 3.B 4.C 5.C 6.B 7.D 8.D 9.C 10.C 11.D 12.C 13.C 14.B 15.C三.多项选择题1.A E 2.ABCDE 3.ACD 4.ABDE 5.BCEF6.ACDE 7.DE 8.BDF 9.BC 10.ACE四.判断题1.错2.对3.对4.错5.错6.错7.对8.对9.对10.对五.论述题1.答:对统计指标进行分类可以从三个角度进行:从指标所反映现象的数量性能方面,可以将统计指标分为数量指标和质量指标两种,其中,数量指标反映现象的总规模或总水平,质量指标反映现象的相对水平或平均水平;从指标的计算形式方面,可以将统计指标分为总量指标、相对指标和平均指标三种;从指标的作用和功能方面,可以将统计指标分为描述性指标、评价性指标和预警性指标三种。

2.答:指标和标志之间既有区别又有联系:指标和标志的区别主要表现在:①所有统计指标都是可量的,而标志未必都可量,其中品质标志就不可量。

②指标是说明总体特征的,其承担者是统计总体;而标志是说明总体单位的特征或属性的,其承担者是总体单位。

③指标具有综合性,反映总体的综合特征;而标志一般不具有综合性能。

指标和标志的联系主要表现在:①指标的数值以总体单位的标志表现为基础,是由总体单位的标志表现经过综合汇总而得到的,没有单位的标志表现,就没有总体的指标数值。

统计学原理第三章(统计资料整理)习题答案

统计学原理第三章(统计资料整理)习题答案

第三章统计资料整理一.判断题部分1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。

(×)2:统计分组的关键问题是确定组距和组数。

(×)3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。

(×)3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。

(∨)4:次数分配数列中的次数,也称为频数。

频数的大小反映了它所对应的标志值在总体中所起的作用程度。

(∨)5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。

(×)6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。

(∨)7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。

(∨)8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于 1 或100%。

(×)9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。

( ∨ )10:按数量标志分组的目的,就是要区分各组在数量上的差异。

(×)11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。

(∨)12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。

(×)二.单项选择题部分1:统计整理的关键在( B )。

A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表2:在组距分组时,对于连续型变量,相邻两组的组限( A )。

A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数3:下列分组中属于按品质标志分组的是( B )。

A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算检查:即检查各 项指标的计算口径、计 量单位是否符合规定, 并通过各种计算方法来 检查各指标间的数字是 否相互衔接,一致。
3.1.2 数据筛选
数据筛选是根据需要找出符合特定条件的某类数据。
【例3.1】有4名学生语文、英语、数学三门课程考试成绩数据如表下 表所示,试用Excel进行数据筛选。
4名学生三门课程考试成绩
组距式变量数列的编制步骤:
● 第一步:将原始数据进行排序并计算全距
50名工人日加工零件数排序表
单位:个
107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
2、 统 计分组 的作用
3.2.1 统计分组的意义和作用
◆划分社会经济现象的类型
◆研究现象总体的内部结构及其特征。通过统 计分组可以反映总体内部各部分之间的差别和 相互关系,表明总体的内部结构。同时在各组 的基础上计算各组所占总体的比重,从总体的 构成上认识总体各部分的作用,并对总体作出 正确的评价。
按年财政总收入分 组(万元)
800~900
乡镇数(个) 1
比率(%) 2
900~1000
5
10
1000~1100
8
16
1100~1200
11
22
1200~1300
11
22
1300~1400
7
14
1400~1500
4
8
1500~1600
3
6
合计
50
100
等距
组距式变量数列 某地区人口年龄分布表
按年龄分组(岁) 人口数(万人)
3.2.4 统计分组的种类
2、按分组标志的多少不同,分为简单分组和复合分组
(1)简单分组:是对总体指只按一个标志进行的分组。例 如 :如学生按性别进行分组,企业按销售额进行分组等。
(2)复合分组:同一个总体选择两个或两个以上的标志层 叠起来进行的分组。例如 :如高校教师先按“性别”分 组,然后按“职称”分组。
3.2.3 分组标志的选择
2、选择与研究目的最有关系、能反映现象本质特征的分 组标志
同一研究目的下,往往有很多分组标志可供选择,但 要选择其中最能反映企业规模本质特征的标志作为分组的 依据。如,研究职工的生活水平,人均收入比职工的工资 水平作为分组标志要好。
3、要考虑到现象所处的具体历史条件或经济条件
按各组变量值的表现形式不同分为单项式变量数列 和组距式变量数列,组距又分等距和异距。
品质数列
某地区2015年末三次产业从业人员分布状况
按产业分组 第一产业 第二产业 第三产业
合计
从业人数(万人) 1963.2 2338.0 2331.3 6632.5
比率(%) 29.6 35.3 35.1
100.0
第3章 统计资料的整理与显示
统计数据的预处理 数据分组与频数分布 频数分布的图示 统计表
学习目标
1.了解数据预处理的内容和目的 2.掌握统计分组和频数分布的基本程序和技巧 3.能运用Excel制作频数分布表和各种图形
3.1 统计数据的预处理
3.1.1 数据审核
预处理:是对数据分类或分组之前所做的必要处理, 内容包括数据的审核、筛选、排序等。
Excel操作步骤:
〖2〗在下拉箭头方框内选择选择要筛选出的数据. (2)若要筛选语文成绩最高的前两名学生,则需在“语文” 下拉箭头处的“数字筛选”中“10个最大的值”对话框中输 入据2,结果如下图所示:
(3)若要三门课程绩都大于70分的学生,由于设定的 条件比较多,需要使用“高级筛选”命令。 使用高级筛选时,必须建立条件区域。这时需要在数据清 单上面至少留出三行作为条件区域,如图3-4所示。然后 在“列表区域”中选中要筛选的数据清单,在“条件区域” 中选择匹配的条件。
复合分组体系就是将总体按两个或两个以上的标志结合 起来进行层叠分组,形成复合分组体系。具体地说,它是先 按一个标志分组,再按另一个标志对已经分好的各个组进行 再分组。
初教
讲师 男 副教授
教授
按性别分组
初教

讲师 副教授
教授
3.2.5 频数分布
1、频数分布的概念和种类
(1)频数分布的含义
在统计分组的基础上,将总体中的所有单位按组归类整 理,形成总体中各重叠分组的结果如下表所示:
某车间50名工人日加工零件数分组表(重叠分组)
按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计
随着社会经济环境的发展变化,被研究对象的特征也 在不断变化。因而分组标志应该适应这种变化。
3.2.4 统计分组的种类
1、按分组标志的性质不同,分为品质标志分组和数量标 志分组
(1)按品质标志分组:是以反映现象的属性、性质的标 志进行的分组。例如 :人口按性别、企业按经济类型、 商品按类别等。
(2)按数量标志分组:按数量标志分组是把研究总体按 标志值的多少进行分组。例如 :人口按年龄进行分组, 工业企业按职工人数分组、生产能力分组,商业企业按 销售额分组等。
各组名称
频数
频率
单项式变量数列是指变量 数列中每一个变量值代表 一组。适用于变量值不多, 变动幅度不大的离散变量。
某城市有子女家庭情况分布表
家庭按子女数分组 (个)
1
2
3 3个以上
合计
家庭数(万户)
140 470 280 110 1000
比率(%)
14 47 28 11 100
组距式变量数列
某地区50个乡镇财政总收入分布表
平行分组体系
对同一个总体选择两个或两个以上的标志分别进行简单分 组,就形成平行分组体系。例如,为了解人口总体的基本 特征,我们将人口总体按性别、年龄、民族、居住地不同 进行了分组,形成平行分组体系如下:
男 性






年 15 ~ 64岁
城镇人口 乡村人口
汉族 民
族 少数民族
龄 65岁及以上
复合分组体系
全距=139-107=32
● 第二步:确定组数 确定的组数应能反映出总体分布的本质特征和组间性质 上的差异。
◆根据对现象的定性分析确定组数。例如 :学生成绩实行 五级分制时分:不及格、及格、中、良好、优秀,可将此 分制换算成传统百分制。
◆采用经验公式确定:
美国学者斯特杰斯 H.A.Sturges 提出的经验公式确定组数。
◆分析现象之间的依存关系。社会经济现象之 间存在着相互制约、相互联系的关系,通过统 计分组可以根据现象间的影响因素和结果因素 的对应更好地揭示现象之间的这种依存关系。
3.2.2 统计分组原则
1、科学性原则 : 统计分组要根据统计研究的目的,突出 反映客观现象在各组间的差异。
2、完整性原则:指分组的结果使总体中的每一个单位都应 有组可归,或者说各分组的空间足以容纳总体的所有单位。 例如:如果人口按受教育程度分为小学、初中、高中、大 学专科和大学本科五个组,则那些未上过学以及研究生学 历者则无组可归。
组距式变量数列中各组的最大变量值与最小 变量值分别称为组上限和组下限。组限的确 定应遵循“既不重复,也不漏”的原则。
● 第四步: 离散型变量一般采用间断分组,即前一组的
确定组限
组上限与后一组的组下限不相等;
连续型变量必须采取重叠分组,即前一组的 组上限与后一组的组下限相等,为同一个变 量值。当某一个变量值恰好等于某组的组上 限时,一般规定“上组限不在内”。
Excel操作步骤:
3.1.3 数据排序
数据排序是指按一定顺序将数据排列,以便研究者通过浏 览数据发现一些明显的特征或趋势,找到解决问题的线索。
对于分类数据,如果是字母型数据,排序则有升序、降 序之分,但习惯上升序用得更多,因为升序与字母的自 然排列相同;如果是汉字型数据,排序方式则很多,如 按汉字的首位拼音字母排列,这与字母型数据的排序完 全一样,也可按姓氏笔画排序,其中也有笔画多少的升 序、降序之分。
数据审核就是检查数据中是否有错误。对于通过调查取得 的原始数据,主要从完整性和准确性两个方面去审核。完 整性审核主要是检查应调查的单位是否有遗漏,所有的调 查项目是否填写齐全等。准确性审核主要是检查数据是否 有错误,是否存在异常值等。
3.1.1 数据审核
准确性检查: 逻辑检查和计算检查
逻辑检查:从理论上或 常识上检查资料是否有悖 常理、有无不切实际或不 符合逻辑的地方。例如: 年龄9岁职业教师;某大 型企业人数:100人等。
对于数值型数据,排序只有两种,即递增和递减。
3.2 数据分组与频数分布
3.2.1 统计分组的意义和作用
1、统计分 组的意义
①统计分组是根据统计研究任务的要 求和研究现象总体的内在特点,将通 过统计调查搜集到的数据资料按照一 定的标志划分为若干部分(组)的一种 统计方法。
②统计分组兼有分与 合两方面的含义,是 将总体区分为性质相 异的若干部分;将性 质相同的许多个体合 成一个小组。
姓名
语文
英语
数学

65
82
76

86
81
57

75
75
60

90
78
89
要求运用Excel筛选出: (1)语文成绩为75分的学生; (2)筛选出 语文成绩最高的前两名学生; (3)筛选出三门课程都大于70分的学生。
相关文档
最新文档