第三章 统计整理 高教社统计学概论第五版课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 统计整理
学习目的:通过本章的学习,使学生掌握统计资料整理 的程序、统计分组的方法以及分布数列的编制、统计汇 总的组织形式和技术方法,以及设计和编制统计表。
分以下几节来讲: 第一节 统计整理概述 第二节 统计分组 第三节 分布数列 第四节 统计汇总 第五节 统计表
2、对第二手资料的审核:
二、变量数列的种类
按各组表示方式不同可分为:
1、单项变量数列:每组用一个数表示。 适合于离散变量,且变量值较少的情况。 这种类似于品质数列的编制,相对比较简单。
工人按日产量(件)分组 工人数(人)
2
5
3
10
4
3
2、组距数列: 适合于连续变量和变量值较多的离散型变量
学生按成绩分组 60以下
60——70 70——80 80——90
(2)开口组:上、下限有一缺一
2、组距
计算公式:组距(i) = 上限 – 下限 种类:
根据各组组距是否相等,组距数列可分为:等距数列 异距数列
表示方法:
一般用5、10、20、50、100等类似数字表示。 另一相似的概念:
全距(R)= 最大变量值 – 最小变量值
3、组中值
概念:每组中点的数值 计算公式:组中值 上限 下限
根据上述资料编制变量数列
第四节 分布数列的表示方法
一、表示法
学生按 成绩分
组
60以下
组中 值
55
学生数 (人)
2
比率 (%)
5.0
向上累计 工人数 比率
2
5.0
60 ~ 70 65
6
15.0
8
20.0
70 ~ 80 75
13
32.5
21
52.5
80 ~ 90 85
15
37.5
36
90.0
90~100 95
人口按年龄分组 14岁以下
15 —— 64 65岁以上 合计
人口数(亿人) 2.8979 8.8793 0.8811 12.6583
比率(%) 22.89 70.15 6.96 100.00
2、构成:
由两部分构成:(1)各组 (2)各组次数(或频率)
3、种类:根据分组标志的不同可分为:
品质分布数列: 数量分布数列:简称为变量数列
各组
2、分组原则:
(1)周延性:即一个不漏(又称穷举原则) (2)互斥性:即不能重复(又称互斥原则)
即:要求保持组内资料同质性和组间资料的差异性
二、统计分组的作用
1、区分社会经济现象的类型 2、研究总体的内部结构 3、研究现象之间的依存关系
三、分组标志(分组标准)
1、概念:即分组的依据 2、选择: (1)根据统计研究的目的选择 (2)选择具有本质性的重要标志 (3)结合现象所处的具体条件
(1)适用性审核
弄清楚数据的来源、数据的口径以及有关的 背景材料
确定这些数据是否符合自己分析研究的需要
(2)时效性审核
应尽可能使用最新的统计数据
(3)确认是否必要做进一步的加工整理
(二)统计分组:分类 (三)统计汇总:加总,求合计数 (四)编制统计表
第二节 统计分组
一、概念 1、概念:总体
90以上 合计
学生数(人) 3 7 20 8 2 40
三、组距数列中的有关概念
1、组限:有:上限(μ)
下限( L )
A、组限的表示方法有:
(1)重叠组限: 如:10 —— 20 20 —— 30 …
(2)不重叠组限: 如:10 —— 20
(只适用于离散变量)
21 —— 30
…
B、组的表示方法:
(1)闭口组:上、下限都有
所分得的各组 各组次数(或频率)
合计
总次数
这种形式称为分布数列(或次数分布或频率分布)
第三节 分布数列
一、分布数列 1、概念:在统计分组的基础上,将总体的各单
位按组归类整理,形成总体单位在各 组间的分布。这种表明总体单位数在 各组分配情况的资料称为次数(频率) 分布,又称分布数列。
例:我国第五次人口普查我国大陆人口年龄分布:
但最佳决定还是依据常识和数列使用的目的而定。
四、变量数列的编制
1、排序: 排序后 :(1)求出全距 R (2)确定变量数列的种类 (等距数列或不等距数列)
2、确定组距和组数 3、划定各组的界限 4、汇总得出各组单位数(次数)
如:
某工厂同工种的50名工人完成生产定额百分数 (%)资料如下:
83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93
有的很简单,如人口按性别分组。 有的很复杂(如人口按职业分组),可查相应的专业分类目录。
(二)按数量标志分组
1、选择数量标志作为分组标志 2、确定组数、划定各组的界限(较复杂) 3、把各单位归入相应的组汇总得出各组的单位数(称
为次数或频数;也可用相对数表示,称为频率)
六、分组结果的表示方法
分组后的结果通常用如下形式来表示:
四、统计分组的种类
(一)按分组标志的性质不同分
1、Байду номын сангаас品质标志分组
如:学生按性别分组,企业按所有制性质分组等
2、按数量标志分组
如:学生按年龄分组,企业按产值分组等
(二)按分组标志的多少不同分
1、简单分组:对总体只按一个标志分组。
例:对企业这个总体按所有制性质、规模大小分别分组。
(1) 国有
(2) 大型
企业 民营
企业 中型
其他
小型
若干个相互联系的简单分组构成平行分组体系
2、复合分组:对同一总体按照两个或两个以上的 标志层叠起来进行分组
例:
国有企业 企业 民营企业
其他经济类型
大型
中型 小型 大型 中型 小型 大型 中型 小型
在复合分组方法下形成复合分组体系
五、统计分组的方法
(一)按品质标志分组
1、选择品质标志作为分组标志 2、确定组数并表示出各组(根据品质标志的具体表现) 3、把各单位归入相应的组汇总出各组的单位数(次数)
2
对于开口组,需先假定其所缺的上限或下限(假设开口 组的组距与其相邻组的组距相等)。 如:
各组 60以下
60——70 70——80 80——90
90以上
组中值
55 65 75 85 95
4、组数(K)
组数、组距、全距之间存在如下关系:
组距i( )组 全数 距KR( ( ) )
可用经验公式来确定: K = 1 + 3.322lgn
学习目的:通过本章的学习,使学生掌握统计资料整理 的程序、统计分组的方法以及分布数列的编制、统计汇 总的组织形式和技术方法,以及设计和编制统计表。
分以下几节来讲: 第一节 统计整理概述 第二节 统计分组 第三节 分布数列 第四节 统计汇总 第五节 统计表
2、对第二手资料的审核:
二、变量数列的种类
按各组表示方式不同可分为:
1、单项变量数列:每组用一个数表示。 适合于离散变量,且变量值较少的情况。 这种类似于品质数列的编制,相对比较简单。
工人按日产量(件)分组 工人数(人)
2
5
3
10
4
3
2、组距数列: 适合于连续变量和变量值较多的离散型变量
学生按成绩分组 60以下
60——70 70——80 80——90
(2)开口组:上、下限有一缺一
2、组距
计算公式:组距(i) = 上限 – 下限 种类:
根据各组组距是否相等,组距数列可分为:等距数列 异距数列
表示方法:
一般用5、10、20、50、100等类似数字表示。 另一相似的概念:
全距(R)= 最大变量值 – 最小变量值
3、组中值
概念:每组中点的数值 计算公式:组中值 上限 下限
根据上述资料编制变量数列
第四节 分布数列的表示方法
一、表示法
学生按 成绩分
组
60以下
组中 值
55
学生数 (人)
2
比率 (%)
5.0
向上累计 工人数 比率
2
5.0
60 ~ 70 65
6
15.0
8
20.0
70 ~ 80 75
13
32.5
21
52.5
80 ~ 90 85
15
37.5
36
90.0
90~100 95
人口按年龄分组 14岁以下
15 —— 64 65岁以上 合计
人口数(亿人) 2.8979 8.8793 0.8811 12.6583
比率(%) 22.89 70.15 6.96 100.00
2、构成:
由两部分构成:(1)各组 (2)各组次数(或频率)
3、种类:根据分组标志的不同可分为:
品质分布数列: 数量分布数列:简称为变量数列
各组
2、分组原则:
(1)周延性:即一个不漏(又称穷举原则) (2)互斥性:即不能重复(又称互斥原则)
即:要求保持组内资料同质性和组间资料的差异性
二、统计分组的作用
1、区分社会经济现象的类型 2、研究总体的内部结构 3、研究现象之间的依存关系
三、分组标志(分组标准)
1、概念:即分组的依据 2、选择: (1)根据统计研究的目的选择 (2)选择具有本质性的重要标志 (3)结合现象所处的具体条件
(1)适用性审核
弄清楚数据的来源、数据的口径以及有关的 背景材料
确定这些数据是否符合自己分析研究的需要
(2)时效性审核
应尽可能使用最新的统计数据
(3)确认是否必要做进一步的加工整理
(二)统计分组:分类 (三)统计汇总:加总,求合计数 (四)编制统计表
第二节 统计分组
一、概念 1、概念:总体
90以上 合计
学生数(人) 3 7 20 8 2 40
三、组距数列中的有关概念
1、组限:有:上限(μ)
下限( L )
A、组限的表示方法有:
(1)重叠组限: 如:10 —— 20 20 —— 30 …
(2)不重叠组限: 如:10 —— 20
(只适用于离散变量)
21 —— 30
…
B、组的表示方法:
(1)闭口组:上、下限都有
所分得的各组 各组次数(或频率)
合计
总次数
这种形式称为分布数列(或次数分布或频率分布)
第三节 分布数列
一、分布数列 1、概念:在统计分组的基础上,将总体的各单
位按组归类整理,形成总体单位在各 组间的分布。这种表明总体单位数在 各组分配情况的资料称为次数(频率) 分布,又称分布数列。
例:我国第五次人口普查我国大陆人口年龄分布:
但最佳决定还是依据常识和数列使用的目的而定。
四、变量数列的编制
1、排序: 排序后 :(1)求出全距 R (2)确定变量数列的种类 (等距数列或不等距数列)
2、确定组距和组数 3、划定各组的界限 4、汇总得出各组单位数(次数)
如:
某工厂同工种的50名工人完成生产定额百分数 (%)资料如下:
83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93
有的很简单,如人口按性别分组。 有的很复杂(如人口按职业分组),可查相应的专业分类目录。
(二)按数量标志分组
1、选择数量标志作为分组标志 2、确定组数、划定各组的界限(较复杂) 3、把各单位归入相应的组汇总得出各组的单位数(称
为次数或频数;也可用相对数表示,称为频率)
六、分组结果的表示方法
分组后的结果通常用如下形式来表示:
四、统计分组的种类
(一)按分组标志的性质不同分
1、Байду номын сангаас品质标志分组
如:学生按性别分组,企业按所有制性质分组等
2、按数量标志分组
如:学生按年龄分组,企业按产值分组等
(二)按分组标志的多少不同分
1、简单分组:对总体只按一个标志分组。
例:对企业这个总体按所有制性质、规模大小分别分组。
(1) 国有
(2) 大型
企业 民营
企业 中型
其他
小型
若干个相互联系的简单分组构成平行分组体系
2、复合分组:对同一总体按照两个或两个以上的 标志层叠起来进行分组
例:
国有企业 企业 民营企业
其他经济类型
大型
中型 小型 大型 中型 小型 大型 中型 小型
在复合分组方法下形成复合分组体系
五、统计分组的方法
(一)按品质标志分组
1、选择品质标志作为分组标志 2、确定组数并表示出各组(根据品质标志的具体表现) 3、把各单位归入相应的组汇总出各组的单位数(次数)
2
对于开口组,需先假定其所缺的上限或下限(假设开口 组的组距与其相邻组的组距相等)。 如:
各组 60以下
60——70 70——80 80——90
90以上
组中值
55 65 75 85 95
4、组数(K)
组数、组距、全距之间存在如下关系:
组距i( )组 全数 距KR( ( ) )
可用经验公式来确定: K = 1 + 3.322lgn