【管理统计学】2-统计资料的整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 统计资料的整理
➢统计表 ➢统计图 ➢双变量的二元分布
第二章 统计资料的整理
调查收集到的原始统计资料常常是大量的。它必须经过加工整理, 如分类归并汇总,按时间前后或按数值大小重新排列等,才容易 发现数据的规律性,并便于做进一步的统计分析。
调查得到 的原始
统计资料
加工整理, 归并汇总,
重新排列
第二章 统计资料的整理
第二章 统计资料的整理
2.1 统计表
表2-5中组距等于6,频数分布 的规则性,仍然可以维持,同 时细节的损失也可减轻
表2-5 与
表2-6 的
对比
表2-6中的组距等于2,各组频数 分布就变得很不规则了。
由此可见,组数的确定应适当, 亦不宜太多
第二章 统计资料的整理
2.1 统计表
发现数据 的规律性, 作进一步的
统计分析
第二章 统计资料的整理
2.1 统计表
时间序列表
统计表 类型
序列表
频数 分类表
地域序列 定性分布 频数分布
将变量所取值按时 间顺序排列
将变量所取值按 地域排列
按性质分类
按数值分类
第二章 统计资料的整理
2.1 统计表
第二章 统计资料的整理
2.1 统计表
定性变量:
变量之间 相互关联情况
研究二元分布 的主要任务
本节内容结束
第二章 统计资料的整理
武汉市2003年规模以上工业企业单位数
国有企业 集体企业 私营企业 联营企业 股份有限公司 外商投资企业 港澳台投资企 业 有限责任公司 股份合作企业 其他企业
第二章 统计资料的整理
第二章 统计资料的整理
2.3 双变量的二元分布 双变量的统计资料:对每一元素观测两个特 征,记录观测结果,就是双变量的统计资料 双变量常用(X,Y)形式表示,以区别两个 单变量X和Y
第二章 统计资料的整理
2.2 统计图
统计图: 统计资料整理成统计表后,可以比较清晰 地展示变量的变化规律。为了使这种规律更有直 观性,常采用统计图表示。包括:线图 、条形图 、 圆饼图等
统计图
线图 条形图 圆饼图
第二章 统计资料的整理
2.2 统计图
第二章 统计资料的整理
第二章 统计资料的整理
第二章 统计资料的整理
2.1 统计表
分数 40—49 50—59
某校200个学生高等数学考试成绩
计
数
正正
60—69 70—79 80—89
正正正正正正正正正正正 正正正正正正正正正正正 正正正正正正正正正正
90—99 正正正
100—109 总数
人数(f) 1 14 55 58 52
17 3 200
2.3 双变量的二元分布
一个双变量的二元分布绝不同于两个单变量的一元分布,它不仅说明两 变量各自的分布情况,而且说明两变量之间(飞行状态与错误原因之间) 的相互关联情况。而这种关联情况(即是否存在关联以及关联的性态和程 度等)正是研究双变量的二元分布的主要任务。
双 变量 二元 分布
说明
两变量各自 的分布情况
频数分布:
先确定组数,再计算组距 按变量所取的值进行分类, 于是资料中每个观测值都分到相应类中去。记录各类 中观测值出现的次数,制成频数分布表。
找出
确 定
xmin
组
与
数
xmax
k
计 算 组 距 h xmax xmin
k
h
确定 每组 上下
限
将 相应 数据 归并到 各组
Xmin 最小值,xmax 最大值
2.3 双变量的二元分布பைடு நூலகம்
测定45次的打印记录如下:
第二章 统计资料的整理
2.3 双变量的二元分布
根据该记录整理的二元分布表如下:
从表中看出,在起飞(T)时容易发生规范理解错误(R) 和仪表读数错误(M),而着陆(L)时不太容易发生规范 理解错误。
第二章 统计资料的整理
啤酒偏好
淡啤酒
普通啤酒
黑啤酒
合计
男性
20
40
20
80
女性
30
30
10
70
合计
50
70
30
150
第二章 统计资料的整理
2.3 双变量的二元分布
边际分布:在二元分布表最下行(合计行)和最右列 (合计列)分别是X和Y的单变量分布,称为边际分布。
二元分布表 最下行
二元分布表 最右行
X的单变量 分布
统称
Y的单变量 分布
边际分布
第二章 统计资料的整理
累计频数与频率
累积频数(Cumulative Frequency):由第一组起至第i 组止各频数之和称为第i组的累积频数,记为Fi,即:
i
Fi fk Fi1 fi k 1
(i 1)
(2-1)
频率(Percent Frequency):就是频数除以总数n:fi/n,经常以百分数表示。
第二章 统计资料的整理
首先建立一个元素的类别系统,使得各类互相排斥,而且是完备 的,使被观测的各元素能既不重复又无遗漏地分到各类中去。 然后记录分到同类中的元素个数,或将同类中各元素的观测值加 以归并,这样得到定性分布。
定
元素分类
观测值 记录与归并
性 分
布
第二章 统计资料的整理
2.1 统计表
第二章 统计资料的整理
2.1 统计表
第二章 统计资料的整理
2.3 双变量的二元分布
在飞行模拟训练时,用计算机测定并打印出飞行动 作的错误,从两方面进行测定:
➢ 错误发生时的飞行状态,分起飞(T),巡航(C) 和着陆(L)三种。
➢ 错误发生的原因,分规范理解错误(R),仪表读数错 误(M)和其它原因(O)三种。
第二章 统计资料的整理
第二章 统计资料的整理
2.1 统计表
表2-5 某校200个学生高等数学考试成绩的频数分布表
分数 40—45 46—51 52—57 58—63 64—69 70—75
人数(f) 1 0 12 29 28 39
分数 76—81 82—87 88—93 94—99 100—105
总数
人数(f) 25 42 10 11 3 200
➢统计表 ➢统计图 ➢双变量的二元分布
第二章 统计资料的整理
调查收集到的原始统计资料常常是大量的。它必须经过加工整理, 如分类归并汇总,按时间前后或按数值大小重新排列等,才容易 发现数据的规律性,并便于做进一步的统计分析。
调查得到 的原始
统计资料
加工整理, 归并汇总,
重新排列
第二章 统计资料的整理
第二章 统计资料的整理
2.1 统计表
表2-5中组距等于6,频数分布 的规则性,仍然可以维持,同 时细节的损失也可减轻
表2-5 与
表2-6 的
对比
表2-6中的组距等于2,各组频数 分布就变得很不规则了。
由此可见,组数的确定应适当, 亦不宜太多
第二章 统计资料的整理
2.1 统计表
发现数据 的规律性, 作进一步的
统计分析
第二章 统计资料的整理
2.1 统计表
时间序列表
统计表 类型
序列表
频数 分类表
地域序列 定性分布 频数分布
将变量所取值按时 间顺序排列
将变量所取值按 地域排列
按性质分类
按数值分类
第二章 统计资料的整理
2.1 统计表
第二章 统计资料的整理
2.1 统计表
定性变量:
变量之间 相互关联情况
研究二元分布 的主要任务
本节内容结束
第二章 统计资料的整理
武汉市2003年规模以上工业企业单位数
国有企业 集体企业 私营企业 联营企业 股份有限公司 外商投资企业 港澳台投资企 业 有限责任公司 股份合作企业 其他企业
第二章 统计资料的整理
第二章 统计资料的整理
2.3 双变量的二元分布 双变量的统计资料:对每一元素观测两个特 征,记录观测结果,就是双变量的统计资料 双变量常用(X,Y)形式表示,以区别两个 单变量X和Y
第二章 统计资料的整理
2.2 统计图
统计图: 统计资料整理成统计表后,可以比较清晰 地展示变量的变化规律。为了使这种规律更有直 观性,常采用统计图表示。包括:线图 、条形图 、 圆饼图等
统计图
线图 条形图 圆饼图
第二章 统计资料的整理
2.2 统计图
第二章 统计资料的整理
第二章 统计资料的整理
第二章 统计资料的整理
2.1 统计表
分数 40—49 50—59
某校200个学生高等数学考试成绩
计
数
正正
60—69 70—79 80—89
正正正正正正正正正正正 正正正正正正正正正正正 正正正正正正正正正正
90—99 正正正
100—109 总数
人数(f) 1 14 55 58 52
17 3 200
2.3 双变量的二元分布
一个双变量的二元分布绝不同于两个单变量的一元分布,它不仅说明两 变量各自的分布情况,而且说明两变量之间(飞行状态与错误原因之间) 的相互关联情况。而这种关联情况(即是否存在关联以及关联的性态和程 度等)正是研究双变量的二元分布的主要任务。
双 变量 二元 分布
说明
两变量各自 的分布情况
频数分布:
先确定组数,再计算组距 按变量所取的值进行分类, 于是资料中每个观测值都分到相应类中去。记录各类 中观测值出现的次数,制成频数分布表。
找出
确 定
xmin
组
与
数
xmax
k
计 算 组 距 h xmax xmin
k
h
确定 每组 上下
限
将 相应 数据 归并到 各组
Xmin 最小值,xmax 最大值
2.3 双变量的二元分布பைடு நூலகம்
测定45次的打印记录如下:
第二章 统计资料的整理
2.3 双变量的二元分布
根据该记录整理的二元分布表如下:
从表中看出,在起飞(T)时容易发生规范理解错误(R) 和仪表读数错误(M),而着陆(L)时不太容易发生规范 理解错误。
第二章 统计资料的整理
啤酒偏好
淡啤酒
普通啤酒
黑啤酒
合计
男性
20
40
20
80
女性
30
30
10
70
合计
50
70
30
150
第二章 统计资料的整理
2.3 双变量的二元分布
边际分布:在二元分布表最下行(合计行)和最右列 (合计列)分别是X和Y的单变量分布,称为边际分布。
二元分布表 最下行
二元分布表 最右行
X的单变量 分布
统称
Y的单变量 分布
边际分布
第二章 统计资料的整理
累计频数与频率
累积频数(Cumulative Frequency):由第一组起至第i 组止各频数之和称为第i组的累积频数,记为Fi,即:
i
Fi fk Fi1 fi k 1
(i 1)
(2-1)
频率(Percent Frequency):就是频数除以总数n:fi/n,经常以百分数表示。
第二章 统计资料的整理
首先建立一个元素的类别系统,使得各类互相排斥,而且是完备 的,使被观测的各元素能既不重复又无遗漏地分到各类中去。 然后记录分到同类中的元素个数,或将同类中各元素的观测值加 以归并,这样得到定性分布。
定
元素分类
观测值 记录与归并
性 分
布
第二章 统计资料的整理
2.1 统计表
第二章 统计资料的整理
2.1 统计表
第二章 统计资料的整理
2.3 双变量的二元分布
在飞行模拟训练时,用计算机测定并打印出飞行动 作的错误,从两方面进行测定:
➢ 错误发生时的飞行状态,分起飞(T),巡航(C) 和着陆(L)三种。
➢ 错误发生的原因,分规范理解错误(R),仪表读数错 误(M)和其它原因(O)三种。
第二章 统计资料的整理
第二章 统计资料的整理
2.1 统计表
表2-5 某校200个学生高等数学考试成绩的频数分布表
分数 40—45 46—51 52—57 58—63 64—69 70—75
人数(f) 1 0 12 29 28 39
分数 76—81 82—87 88—93 94—99 100—105
总数
人数(f) 25 42 10 11 3 200