第三章 统计数据整理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用
判断以下数列是品质数列还是变量数 是连续变量数列还是离散变量数列? 列?是连续变量数列还是离散变量数列? A 按企业职工人数分组形成的数列 B 按企业销售利润率分组形成的数 列 C 按教师职称分组形成的数列
(三)分配数列的编制
分配数列术语 分配数列术语
1.全距(R)=数列中最大变量值-最小变量值 全距( 2.组限:每一组的最大变量值与最小变量值 组限 上限: 上限:每一组的最大变量值 下限:每一组的最小变量值 下限: 组距( 3.组距(d):每一组的最大变量值与最小变量值之差 组距=上限组距=上限-下限 组数: 4.组数:数列中的分组个数
2.数值变量数列又可分为: 数值变量数列又可分为:
一个变量值的变量数列。 单项数列:每组只有一个变量值 一个变量值 变量值是一段区间的变量数列。 组距数列:每组变量值是一段区间 变量值是一段区间
连续变量数列:按连续变量分组形成的数列 离散变量数列:按离散变量分组形成的数列
数值变量分配数列实例
表3.3 营额万) 业(元 10万 以 元下 10- 50 50-100 100-500 500万 以 元上 合计 某市餐饮业按营业额分组 餐企个() 饮业数家 比 () 重% 1350 58.70 650 28.25 180 7.83 85 3.70 35 1.52 2300 100.00
(49)
第 三 节 分配数列和次数分布
一、分配数列 (一)概念
将总体按分组标志分组后形成的总体单位在各 组的分布,又称次数分布数列 频数分布数列 次数分布数列或频数分布数列 次数分布数列 频数分布数列。
分配数列的二要素: 分配数列的二要素:
1、组别:各组名称或变量值 组别: 组别 2、次数 ( 频数 ): 分布在各组的总体 次数( 次数 频数)
组别
频数
频率
分配数列实例
表3.2 某高校在校生性别状况分组表
性 别 男 生 女 生 合 计
人() 数人 40 50 30 60 80 10
比 () 重% 5 .5 56 4 .4 44 10 0 0 .0
(二)分配数列的种类
1.按分组标志的性质不同
品质变量数列:按品质变量分组形成 数值变量数列:按数值变量分组形成
75 54 62 75
解题思路
*编制步骤之一----数据排序并确定全距 编制步骤之一-------数据排序并确定全距
将数据从低到高排列,形成如下变量序列: 51 67 76 85 54 68 77 86 57 70 78 86 59 71 78 88 62 72 79 89 64 72 81 90 65 74 83 93 65 75 84 94 66 75 84 96 66 76 84 98
表3.5
月工资(元) 500 元以下 500-600 600-700 700-800 800-900 900-1000 1000 元以上 合 计
某车间工人按月工资分组
工人数(人) 16 28 34 56 38 18 10 200 比重(%) 8.00 14.00 17.00 28.00 19.00 9.00 5.00 100.00
布的总体单位数, 公式: 次数密度= 次数密度=各组次数 / 各组组距
开口组: 开口组:缺上限或缺下限的组 9. 闭口组: 闭口组:上下限齐全的组 10.组中值及计算** 10.组中值及计算** (1)闭口组
临近组组限重合 组限重合时:组中值=(上限+下限)/ 2 组限重合 临近组组限间断 组限间断时:组中值=(下限+下组下限)/2 组限间断
(四)累计次数分布表(图)的编制 累计次数分布表(
1.相关概念(56页) 相关概念(56页
累计次数和 (1)累计次数 (1)累计次数和累计频率
反映总体单位分布特征的指标,累计次数 累计次数说明总体 累计次数 中在某一变量值水平上下总共包含的总体单位次数; 累计频率说明总体中在某一变量值水平上下总共包含 累计频率 的总体单位数占总体单位总Biblioteka Baidu的比重。
2.累计次数分布表(图)的编(绘)制步骤 累计次数分布表( 累计次数分布表 的编(
数据排序并计算全距 确定变量数列的形式(单项式或组距式) 确定组数和组距 确定组限 计算各组次数和频率 计算各组累计次数和频率 编(绘)制图表
累计次数分布数列的示例
表3-7 某班级学生考试成绩累计次数分组表
按成绩分 学生人数 组(分) (次数) 50~60 60~70 70~80 80~90 90~100 合计 3 8 16 8 5 40
(四)累计次数分布表(图)的编制 累计次数分布表(
1.相关概念(56页) 相关概念(56页
(2)累计次数和频率的计算方法 (2)累计次数和频率的计算方法 向上累计:是将各组的次数和频率,由变量值低的组 向上累计 由变量值低的组 向高的组累计。说明各组上限以下 上限以下包含的总体单位数 向高的组累计 上限以下 和比率。 向下累计:是将各组的次数和频率,由变量值高的组 由变量值高的组 向下累计 向低的组累计。说明各组下限以上 下限以上包含的总体单位数 向低的组累计 下限以上 和比率。
(2)开口组
缺上限时: 组中值=下限+邻组组距/ 2 缺上限 缺下限时: 组中值=上限 -邻组组距/ 2 缺下限
(三)分配数列的编制
注意事项** 注意事项**
10的倍数 1.组距最好为5或10 倍数 组距 5 10 2.最小组的下限略低于最小变量值,最大组的上限 2. 略高于最大变量值 3.离散型变量 组限可以间断, 3.离散型变量分组,相邻组的组限可以间断,也可 离散型变量 组限可以间断 以重叠;连续型变量 连续型变量分组,相邻组的组限必须重叠 组限必须重叠。 以重叠 连续型变量 组限必须重叠 4.组限重叠时,临界点的总体单位按“上限不在内” “上限不在内” 4. 的原则归组。 。
单项式变量数列实例
表3.4
家庭人口数(人) 1 2 3 4 5 6 合 计
某市某年居民家庭按家庭人口数分组
家庭数(千户) 9.8 27.5 94.6 19.2 10.9 8.0 170.0 比重(%) 5.76 16.18 55.65 11.29 6.41 4.71 100.00
组距式变量数列实例
(二)作用
统计数据整理,是统计调查的继续,也是统计分 是统计调查的继续, 是统计调查的继续 析的前提,承前启后,在整个统计工作中具有重要的 析的前提 作用。
二、数据整理的程序
数据整理方案的设计 数据的审核与检查 数据的排序 数据分组 数据的显示——统计图表 统计图表 数据的显示 数据的积累与保管
第二节 数据分组
本章重难点提示: 本章重难点提示:
本章重点: 本章重点:统计分组、变量数列的编制、统计数据的 显示方法——统计表和统计图 本章难点: 本章难点:统计分组、变量数列的编制、次数分布图 的绘制
第一节 数据整理的一般问题
一、数据整理的概念与作用
(一)概念
数据进行分类和汇总,使 对统计调查所搜集到的数据进行分类和汇总 数据进行分类和汇总 其系统化、条理化、科学化,以得出反映事物总体综 以 反映事物总体综 合特征的资料的工作过程。 合特征
五、统计分组的种类
(一)根据分组变量(标志)的性质不同 根据分组变量(标志)
按品质变量分组(49页) 品质变量分组(49页 品质变量分组 按数值变量分组(48页) 数值变量分组( 数值变量分组 48页
( 二 ) 根据采用的分组标志的个数多 少
简单分组: 简单分组:只按一个标志分组(48) 复合分组:按两个或以上的标志分组
频率 (%) 7.5 20.0 40.0 20.0 12.5 100.0
向上累计 次数 3 11 27 35 40 — 频率 7.5 27.5 67.5 87.5 100.0 — 40 37 29 13 5 —
解题思路
编制步骤之六----绘制表格 编制步骤之六----绘制表格 ---表3-6 某车间工人日产零件分组表
日 零 数( ) 产 件 量件 50-60 60-70 70-80 80-90 90-100 合 计
工 数 人 人 ( ) 4 8 13 10 5 40
比 () 重 % 10.00 20.00 32.50 25.00 12.50 100.00
一、数据分组的概念
根据统计研究目的和客观现象的内在特点, 标志,将 按 照选定的某个或几个标志 将 被研究的总体 标志 总体 数据分成若干个性质不同的组别。 数据分成若干个性质不同的组别
二、数据分组的作用
(1)区分现象的类型 (2)反映总体的内部结构 (3)揭示现象之间的依存关系 (4)反映事物的数量特征和发展规律
三、数据分组的关键** 数据分组的关键
选择分组标志和分组划分各组界限 划分各组界限(针对数值 选择分组标志 划分各组界限 型变量)
四、选择分组标志的原则** 选择分组标志的原则
1.根据研究任务 目的 研究任务和目的 研究任务 目的选择分组标志 反映事物本质特征或重要特征的标 2. 选择能反映事物本质特征或重要特征 反映事物本质特征或重要特征 志 结合现象所处的历史条件和社会经济条件 3. 结合 历史条件和社会经济条件 选择分组标志
单位数。各组的 次数 频数 之和等于总 次数(频数 频数)之和等于总 体单位总数。 体单位总数
分配数列实例
表3.1
按 拔 组 海 分 ( ) 米 500以 下 500~ 1000 1000~ 1000 2000 2000~ 3000 3000以 上 合 计
我国土地状况分组表
面 积 ( 平 公 ) 万 方 里 241.7 162.5 239.9 67.6 248.3 960.0 占 面 比 总 积 重 ( ) % 25.18 16.93 24.99 7.04 25.86 100.00
计算全距=98-51=47
编制步骤之二-------确定变量数列的形式 *编制步骤之二----确定变量数列的形式
因变量值较多、变动幅度较大,适宜采用组距式数 组距式数 列
解题思路
----确定组数和组距 *编制步骤之三----确定组数和组距 编制步骤之三---[分析 全距为47,分为5组,组距为10 分析] 分析
----确定组限 *编制步骤之四----确定组限 编制步骤之四---[分析 离散型变量分组,相邻组的组限可以重叠,也 分析] 分析 可间断,本例选择重叠
*编制步骤之五----计算各组的频数和频率 编制步骤之五----计算各组的频数和频率 ---[分析 根据排序后的变量序列清点各数据区间的频数 分析] 分析 并计算比重,也可利用excel统计软件进行
第三章 统计数据的整理
第三章 统计数据的整理
第一节数据整理的一般问题 第二节 数据分组 第三节分配数列和次数分布 第四节 统计图表
学习目的及重难点提示
本章学习目的: 本章学习目的:
了解数据整理在统计活动中的地位、数据整理的内容、 了解 数据审核与汇总的技术; 领会统计分组的概念、关键、统计分组体系及次数分 领会 布的类型和特征; 明确统计数据的表现形式——统计表和统计图的基本 明确 内容; 掌握统计分组、分配数列和统计图表的编绘制方法。 掌握
(三)分配数列的编制
简单次数分布数列的编制步骤
数据排序并计算全距 确定变量数列的形式(单项式或组距式) 确定组数和组距 确定组限 计算各组次数和频率 绘制表格
简单次数分布数列的编制实例
[例3-1]:数据资料 某车间40名工人日产零件如下: 40名工人日产零件如下 某车间40名工人日产零件如下: 65 72 66 57 90 86 83 68 84 66 59 67 70 79 51 81 78 86 94 64 77 74 76 96 98 85 71 79 84 65 72 89
组数和组距的关系
定性关系:全距一定的情况下,组数和组距呈 组数和组距呈 定性关系 反方向变动 定量关系: 定量关系 组数≈全距 组距≈R/d 全距/组距 组距=R/(1+3.322lgN) ( + 组距 ) 式二为确定组距的经验公式,其中N代表组数
(三)分配数列的编制
分配数列术语 分配数列术语
频率( 5.频数(次数)与频率(比重) 频数(次数) 频率 比重) 6.品质数列 品质数列与变量数列 6.品质数列 变量数列 7.等距数列 等距数列与异距数列 7.等距数列 异距数列 8.次数密度 次数密度( 8.次数密度(一般用于不同组距):单位组距内分
相关文档
最新文档