excel
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量数列 组距式数列
品质数列:按品质标志分组的数列,用来观察总
品质分配数列(简称品质数列)
单项式数列
体单位中不同属性的单位分布情况。例1
变量数列:将总体按数量标志分组,将分组后形
成的各组变量值与该组中所分配的单位次数或频 数,按照一定的顺序相对应排列所形成的分配数 列。例2和例3
(a) 正态分布
(b) 偏态分布
正J形
反J形
(c) J形分布 图 几种常见的频数分布
(d) U形分布
统计表和统计图 的编制方法
一、统计表
1、统计表的概念和结构 统计表是表现统计资料的一种形式。把 经过大量调查得来的统计资料,经过汇 总整理以后,按照一定的规定和要求填 列在相应的表格内,就形成了一定的统 计表。
变量的最大值是129%最小值是81% 全距 = 最大值 - 最小值=129% - 81%= 48% 第二步:确定组数和组距 组距和组数的确定没有顺序规定,即可以先根据数 据的变化特征确定组数,也可以在事先对研究对象 的性质比较了解的情况下,先确定组距,然后确定 组数,但组数必须是整数。
全距 全距 组数 , 或: 组距 组距 组数
统计表的结构,从外表形式上看,是由四部分构成
总标题 横行标题
纵栏标题 指标数值
表的名称,用于概括统计表中要说明的 内容。 各组的名称,反映总体各组成部分的。
分组标志或指标的名称,说明纵行所列 各项资料的内容。 统计表的具体内容,每一项数值由相应 的横行标题和纵栏标题限定,可以是总 体单位数,也可以是标志总量,或者平 均数、相对数等,也称数字资料。
2003年9月27日,中国教育网(中国教育和考验计 算机网)展开了关于何种原因引起大学生心理障碍 的调查,截止2004年2月13日,共有1786名热心用户 参与了调查投票,其汇总结果如下图所示: 调查结果表明,34.94%的读者认为引起大学生 心理障碍的主要原因是因为应试教育导致家长学校 的过度保护,学生缺乏应对困难及心理承受力等锻 炼.同时,有31.12%的读者认为学习与生活、就业的 压力也是引起大学生心理障碍的一个主要原因,认 为大学生人际关系处理不当、属于敏感群体,容易 产生心理问题、难以排除的的情感危机等为主要原 因的分别占投票总数的12.5% 、9.78% 及7.47%.
纵栏 标题
指标 数值
主词
宾词
时间序列表
将变量所取值按时 间顺序排列
序列表
地域序列
统计表 类型
定性分布
将变量所取值按 地域排列
按性质分类
分类表
频数分布 按数值分类
统计表的种类
主词未经过任何分组,反映出总体各单位 的名称或按时间顺序简单排列,或同时反 映以上内容的统计表。 主词按照一定标志分组的统计表,也称简 单分组表。
模块三 利用Excel和SPSS编制 统计表(图),显示数据
一、教学目标
最终目标:能归并、汇总、展示市场调研数据。 促成目标:
1.能利用EXCEL、SPSS加工整理、归并
汇总、展示数据; 2.能发现数据的规律性。
二、工作任务
1.利用EXCEL、SPSS加工整理、归并、 汇总、展示数据;
2.发现数据的规律性。
169 538 216 129 73
五、项目任务
1、根据实地调研数据录入电脑所形 成数据库,对调研得到的原始数据进 行归并、汇总和展示。 2、见子项目实训六、七、九、十。
六、实践操作
数据的归并、汇总方法: 次数分布表的制作
一、次数分布的概念
在统计分组的基础上,把总体的所有单位按组 归并、排列,形成总体中各个单位在各组间的分布, 称为次数分布。
第四步:编制频数(频率)分布表。
计算本例中各组的频数(工人数)和频率,编制某企 业30个工人劳动定额完成情况的分布表(下表) 某企业30个工人劳动定额完成情况分布图表 劳动定额完成程度(%) 80—90 90—100 100—110 110—120 120—130 合计 频数(人) 3 4 12 8 3 30 频数(%) 10.0 13.3 40.0 26.7 10.0 100.0
何种原因引起大学生心理障碍的调查结果分布图
选项 应试教育导致家长学校的过度保 护,缺乏应对困难及心理承受力 等训练 属于敏感群体,容易产生心理问 题 学习与生活就业的压力 人际关系处理不当 难以排除的情感危机 其他 比例 34.94% 票数 604
9.78% 31.12% 12.5% 7.47% 4.23%
为了控制清洁剂重量这一难题, 要对粉的密度的可接受范围加以限制。 定期抽取统计样本,测量每一样本的 密度。然后把汇总数据提供给经营人 员,以便在需要把密度保持在期望的 质量规格尺寸时采取正确的行动. 在一周的期间采集的150个样本的 密度的频数分布和直方图列示在相应 的表和图上。密度水平高于0.40是不 可接受的。
第一,最小组的下限(起点值)应低于最小变量值,
最大组的上限(终点值)应高于最大变量值。 第二,组限的确定应有利于表现出总体分布的特点, 应反映出事物质的变化。 第三,为了方便计算组限应尽可能取整数,最好是 5或10的整倍数。 第四,由于变量有连续型变量和离散型变量两种, 其组限的确定方法是不同的。
[例5]对某企业30个工人完成劳动定额的情况进 行调查,某原始资料如下(%) 98 81 95 84 93 86 91 102 100 103 105 100 104 108 107 108 106 109 112 114 109 117 125 115 120 119 118 116 129 113 第一步:计算全距。(将各变量值由小到大排序, 确定某最大值,最小值,并计算全距。) 81 84 86 91 93 95 98 100 100 102 103 104 105 106 107 108 108 109 109 112 113 114 115 116 117 118 119 120 125 129
汇总计算各组相应的单位数(次数),并采用表格 形式列示即可,例如下表
计
工人数 3 7 10 6 4 30
比率(%) 10.0 23.3 33.3 20.1 13.3 100.0
(各组变量值)
(次数)
(频率)
组距变量数列的编制
从统计表的内容来看,由主词和宾词两个部分组成。 主词是统计表所说明的总体,总体的各组或各组的名 称。宾词是用于说明主词的各种指标。 某地区1999年工业总产值按轻重工业分组表 工业总产值
项目
横 行 标 题 轻工业 重工业 合计
产值(亿元) 比重(%) 3059.7 68.84 3105.7 51.16 6264.4 100.00
例1、某高校学生性别分布表(品质数列)
性 男
别
人 数(人) 次数(频数) 732
频
率(%) 57.14
女
合 计
549
1281
42.86
100.00
例2、某厂工人日产量分布表(单项数列)
按日产量分组 (件) 9
10 11 12 13 14 15
工人数(人) 12
38 65 85 60 30 10
比
三、变量数列的编制方法
举例说明: [例4]某工厂生产车间30人工人日产量原始数据如 下: 20 21 21 24 23 22 20 21 22 23 24 20 24 21 22 22 23 24 22 21 22 23 22 21 21 22 22 23 22 23
单项式变量数列,可以直接将每一变量值作为一组,
4、统计表的上下两端用粗线或双线绘制,在有些需 要明显分隔的部分也应用粗线或双线,其他则用 细线。在横行和合计栏、横行与纵栏标题间要划 线。表的左右两端应是开口的,不得划线。 5、统计表中计指标有一定的计算关系,还可以用算 式表示如果栏目较多,可以加以编号:一般主词 的计量单位栏用(甲)、(乙)、(丙)……等次序编 号,宾词各栏用(1)、(2)、(3)………等次序编号。 若各栏中统之。 6、统计表中的数字要注明计量单位。如果表中的数 字属同一计量单位,可将计量单位标在表的右上 方;如果宾词的计量单位不同,可直接标注在指 标名称的旁边或下方;如果主词的计量单位不同, 可在横行标题后设计计量单位专栏。
三、归并、汇总、展示调研数据的步骤
1.对经过审核的资料进行加工整理、归并汇总,
计算出总体总量指标;
2.将汇总计算的结果,以统计表或统计图的 形式表现出来。
市场调研数据整理的步骤
(2) 发现数据的规 律性,作进一步 的统计分析
(1) 加工整理, 归并汇总, 重新排列
四、典型案例1:
高露洁—棕榄公司
率(%) 4.00
12.67 21.67 28.33 20.00 10.00 3.33
合
计
300
100.00
例3、某班学生按考试成绩分组(组距数列)
按成绩分组 (分) 60以下 60—70 70—80 80—90 90以上 合 计
人数(人) 7 21 25 19 8 80
比率(%) 8.8 26.2 31.2 23.8 10.0 100.0
问题:
1、清洁剂产品生产质量符合其质 量标准吗? 2、你从哪里得出这个结论的?
答案:
1、频数分布和直方图中所有的密度小 于或等于0.40表明经营符合其质量标 准,检查这些统计摘要的管理人员 将认为清洁剂产品生产质量满意。 2 、从150个样本总体内部的密度分布 结构可以看出.
四、典型案例2:关于何种原因引起大学生 心理障碍的调查报告
第五步:计算累计频数和累计频率 为了更详细的认识变量的分布特征,还可以计算累 计频数和累计频率,编制累计频数和累计频率数列。
以下累计(向上累计)数是:小于该组上限的各组的
频数或频率之和;
以上累计(向下累计)数是:大于及等于该组下限的
各组的频数或频数或频率之和。
四、频数分布的类型
正偏(右偏) 负偏(左偏)
次数分布又称分配数列,有两个组成要素: 一是分组;另一个是次数或比率。 1、次数:分配数列中,分布在各个组的总体单位 数叫次数。 2、频率分布不受总体单位总数大小的影响,能够 正确地反映现象在总体的分布特征、结构状况,是 分析总体特征及其变动规律的重要手段。
二、次数分布的种类
分配数列 变量分配数列(简称变量数列)
纽约州,纽约市 高露洁—棕榄(Colgate-Palmolive)公司.1806年 在纽约开业,是一家经营香皂和蜡烛的小商店,今天, 高露洁—棕榄公司的产品全世界可见,公司已在55个 国家实现跨国经营,1996年年销售额超过87亿美元。 除了著名的传统的产品香皂、清洁剂、牙膏外,公司 还兼营软皂、Mennen、宠物食品和其他产品. 高露洁—棕榄公司在其对家用洗涤产品的质量保证 程序中利用统计学。—个焦点是客户对盒装清洁剂的 数量的满意度。每一类尺寸的盒子都填充相同重量的 清洁剂.但是清洁剂的容量受其清洁粉的密度影响。 例如。如果粉的密度偏大,达到盒的指定重量就需要 少一些清洁剂;结果,当消费者打开盒子时,盒子显 然未充满。
在等距分组时,组距与组数的关系是:
本例中的数据为劳动定额的完成情况,属于工作成 绩的评定。根据一般将成绩分成优、良、中、及格 和不及格的五档评分习惯,可以先确定组数为5。 在等距分组时,计算组距如下: 48% 组距 9.6% 5
为了符合习惯和计算方便,组距近似地取10%。 第三步:确定组限
从此表可以看到,30名工人中,劳动定 额完成主要集中在100%—120%之间,占 66.7%。 在变量数列中标志值构成的数列表 示标志值的变动幅度,而频数构成的数 列则表示标志值相对的作用程度。频数 愈大则组的标志值对于全体标志水平所 起的作用也愈大;反之,频数愈小则各 组标志值所起的作用也愈小。
主词按照两个或两个以上的标志层叠分组 所形成的统计表。
简单表 分组表 复合表
统计表的编制规则
统计表应遵循科学、实用、简练、美观的原则进行设计。
1、统计表通常应设计成由纵横交叉线组成的长方形 表格,长宽之间应保持适当的比例。 2、统计表的总标题要用概括、简练的文字说明表的 内容,并在总标题内或在其下注明资料所属的时 间、地点和单位。 3、统计表的主词各行和宾词各栏,一般应按先局部 后整体的原则排列,即先列各项目,再列总计。 如果没有必要列出所有项目时,可以先列总计, 而后再列其中一部分重要的项目。
品质数列:按品质标志分组的数列,用来观察总
品质分配数列(简称品质数列)
单项式数列
体单位中不同属性的单位分布情况。例1
变量数列:将总体按数量标志分组,将分组后形
成的各组变量值与该组中所分配的单位次数或频 数,按照一定的顺序相对应排列所形成的分配数 列。例2和例3
(a) 正态分布
(b) 偏态分布
正J形
反J形
(c) J形分布 图 几种常见的频数分布
(d) U形分布
统计表和统计图 的编制方法
一、统计表
1、统计表的概念和结构 统计表是表现统计资料的一种形式。把 经过大量调查得来的统计资料,经过汇 总整理以后,按照一定的规定和要求填 列在相应的表格内,就形成了一定的统 计表。
变量的最大值是129%最小值是81% 全距 = 最大值 - 最小值=129% - 81%= 48% 第二步:确定组数和组距 组距和组数的确定没有顺序规定,即可以先根据数 据的变化特征确定组数,也可以在事先对研究对象 的性质比较了解的情况下,先确定组距,然后确定 组数,但组数必须是整数。
全距 全距 组数 , 或: 组距 组距 组数
统计表的结构,从外表形式上看,是由四部分构成
总标题 横行标题
纵栏标题 指标数值
表的名称,用于概括统计表中要说明的 内容。 各组的名称,反映总体各组成部分的。
分组标志或指标的名称,说明纵行所列 各项资料的内容。 统计表的具体内容,每一项数值由相应 的横行标题和纵栏标题限定,可以是总 体单位数,也可以是标志总量,或者平 均数、相对数等,也称数字资料。
2003年9月27日,中国教育网(中国教育和考验计 算机网)展开了关于何种原因引起大学生心理障碍 的调查,截止2004年2月13日,共有1786名热心用户 参与了调查投票,其汇总结果如下图所示: 调查结果表明,34.94%的读者认为引起大学生 心理障碍的主要原因是因为应试教育导致家长学校 的过度保护,学生缺乏应对困难及心理承受力等锻 炼.同时,有31.12%的读者认为学习与生活、就业的 压力也是引起大学生心理障碍的一个主要原因,认 为大学生人际关系处理不当、属于敏感群体,容易 产生心理问题、难以排除的的情感危机等为主要原 因的分别占投票总数的12.5% 、9.78% 及7.47%.
纵栏 标题
指标 数值
主词
宾词
时间序列表
将变量所取值按时 间顺序排列
序列表
地域序列
统计表 类型
定性分布
将变量所取值按 地域排列
按性质分类
分类表
频数分布 按数值分类
统计表的种类
主词未经过任何分组,反映出总体各单位 的名称或按时间顺序简单排列,或同时反 映以上内容的统计表。 主词按照一定标志分组的统计表,也称简 单分组表。
模块三 利用Excel和SPSS编制 统计表(图),显示数据
一、教学目标
最终目标:能归并、汇总、展示市场调研数据。 促成目标:
1.能利用EXCEL、SPSS加工整理、归并
汇总、展示数据; 2.能发现数据的规律性。
二、工作任务
1.利用EXCEL、SPSS加工整理、归并、 汇总、展示数据;
2.发现数据的规律性。
169 538 216 129 73
五、项目任务
1、根据实地调研数据录入电脑所形 成数据库,对调研得到的原始数据进 行归并、汇总和展示。 2、见子项目实训六、七、九、十。
六、实践操作
数据的归并、汇总方法: 次数分布表的制作
一、次数分布的概念
在统计分组的基础上,把总体的所有单位按组 归并、排列,形成总体中各个单位在各组间的分布, 称为次数分布。
第四步:编制频数(频率)分布表。
计算本例中各组的频数(工人数)和频率,编制某企 业30个工人劳动定额完成情况的分布表(下表) 某企业30个工人劳动定额完成情况分布图表 劳动定额完成程度(%) 80—90 90—100 100—110 110—120 120—130 合计 频数(人) 3 4 12 8 3 30 频数(%) 10.0 13.3 40.0 26.7 10.0 100.0
何种原因引起大学生心理障碍的调查结果分布图
选项 应试教育导致家长学校的过度保 护,缺乏应对困难及心理承受力 等训练 属于敏感群体,容易产生心理问 题 学习与生活就业的压力 人际关系处理不当 难以排除的情感危机 其他 比例 34.94% 票数 604
9.78% 31.12% 12.5% 7.47% 4.23%
为了控制清洁剂重量这一难题, 要对粉的密度的可接受范围加以限制。 定期抽取统计样本,测量每一样本的 密度。然后把汇总数据提供给经营人 员,以便在需要把密度保持在期望的 质量规格尺寸时采取正确的行动. 在一周的期间采集的150个样本的 密度的频数分布和直方图列示在相应 的表和图上。密度水平高于0.40是不 可接受的。
第一,最小组的下限(起点值)应低于最小变量值,
最大组的上限(终点值)应高于最大变量值。 第二,组限的确定应有利于表现出总体分布的特点, 应反映出事物质的变化。 第三,为了方便计算组限应尽可能取整数,最好是 5或10的整倍数。 第四,由于变量有连续型变量和离散型变量两种, 其组限的确定方法是不同的。
[例5]对某企业30个工人完成劳动定额的情况进 行调查,某原始资料如下(%) 98 81 95 84 93 86 91 102 100 103 105 100 104 108 107 108 106 109 112 114 109 117 125 115 120 119 118 116 129 113 第一步:计算全距。(将各变量值由小到大排序, 确定某最大值,最小值,并计算全距。) 81 84 86 91 93 95 98 100 100 102 103 104 105 106 107 108 108 109 109 112 113 114 115 116 117 118 119 120 125 129
汇总计算各组相应的单位数(次数),并采用表格 形式列示即可,例如下表
计
工人数 3 7 10 6 4 30
比率(%) 10.0 23.3 33.3 20.1 13.3 100.0
(各组变量值)
(次数)
(频率)
组距变量数列的编制
从统计表的内容来看,由主词和宾词两个部分组成。 主词是统计表所说明的总体,总体的各组或各组的名 称。宾词是用于说明主词的各种指标。 某地区1999年工业总产值按轻重工业分组表 工业总产值
项目
横 行 标 题 轻工业 重工业 合计
产值(亿元) 比重(%) 3059.7 68.84 3105.7 51.16 6264.4 100.00
例1、某高校学生性别分布表(品质数列)
性 男
别
人 数(人) 次数(频数) 732
频
率(%) 57.14
女
合 计
549
1281
42.86
100.00
例2、某厂工人日产量分布表(单项数列)
按日产量分组 (件) 9
10 11 12 13 14 15
工人数(人) 12
38 65 85 60 30 10
比
三、变量数列的编制方法
举例说明: [例4]某工厂生产车间30人工人日产量原始数据如 下: 20 21 21 24 23 22 20 21 22 23 24 20 24 21 22 22 23 24 22 21 22 23 22 21 21 22 22 23 22 23
单项式变量数列,可以直接将每一变量值作为一组,
4、统计表的上下两端用粗线或双线绘制,在有些需 要明显分隔的部分也应用粗线或双线,其他则用 细线。在横行和合计栏、横行与纵栏标题间要划 线。表的左右两端应是开口的,不得划线。 5、统计表中计指标有一定的计算关系,还可以用算 式表示如果栏目较多,可以加以编号:一般主词 的计量单位栏用(甲)、(乙)、(丙)……等次序编 号,宾词各栏用(1)、(2)、(3)………等次序编号。 若各栏中统之。 6、统计表中的数字要注明计量单位。如果表中的数 字属同一计量单位,可将计量单位标在表的右上 方;如果宾词的计量单位不同,可直接标注在指 标名称的旁边或下方;如果主词的计量单位不同, 可在横行标题后设计计量单位专栏。
三、归并、汇总、展示调研数据的步骤
1.对经过审核的资料进行加工整理、归并汇总,
计算出总体总量指标;
2.将汇总计算的结果,以统计表或统计图的 形式表现出来。
市场调研数据整理的步骤
(2) 发现数据的规 律性,作进一步 的统计分析
(1) 加工整理, 归并汇总, 重新排列
四、典型案例1:
高露洁—棕榄公司
率(%) 4.00
12.67 21.67 28.33 20.00 10.00 3.33
合
计
300
100.00
例3、某班学生按考试成绩分组(组距数列)
按成绩分组 (分) 60以下 60—70 70—80 80—90 90以上 合 计
人数(人) 7 21 25 19 8 80
比率(%) 8.8 26.2 31.2 23.8 10.0 100.0
问题:
1、清洁剂产品生产质量符合其质 量标准吗? 2、你从哪里得出这个结论的?
答案:
1、频数分布和直方图中所有的密度小 于或等于0.40表明经营符合其质量标 准,检查这些统计摘要的管理人员 将认为清洁剂产品生产质量满意。 2 、从150个样本总体内部的密度分布 结构可以看出.
四、典型案例2:关于何种原因引起大学生 心理障碍的调查报告
第五步:计算累计频数和累计频率 为了更详细的认识变量的分布特征,还可以计算累 计频数和累计频率,编制累计频数和累计频率数列。
以下累计(向上累计)数是:小于该组上限的各组的
频数或频率之和;
以上累计(向下累计)数是:大于及等于该组下限的
各组的频数或频数或频率之和。
四、频数分布的类型
正偏(右偏) 负偏(左偏)
次数分布又称分配数列,有两个组成要素: 一是分组;另一个是次数或比率。 1、次数:分配数列中,分布在各个组的总体单位 数叫次数。 2、频率分布不受总体单位总数大小的影响,能够 正确地反映现象在总体的分布特征、结构状况,是 分析总体特征及其变动规律的重要手段。
二、次数分布的种类
分配数列 变量分配数列(简称变量数列)
纽约州,纽约市 高露洁—棕榄(Colgate-Palmolive)公司.1806年 在纽约开业,是一家经营香皂和蜡烛的小商店,今天, 高露洁—棕榄公司的产品全世界可见,公司已在55个 国家实现跨国经营,1996年年销售额超过87亿美元。 除了著名的传统的产品香皂、清洁剂、牙膏外,公司 还兼营软皂、Mennen、宠物食品和其他产品. 高露洁—棕榄公司在其对家用洗涤产品的质量保证 程序中利用统计学。—个焦点是客户对盒装清洁剂的 数量的满意度。每一类尺寸的盒子都填充相同重量的 清洁剂.但是清洁剂的容量受其清洁粉的密度影响。 例如。如果粉的密度偏大,达到盒的指定重量就需要 少一些清洁剂;结果,当消费者打开盒子时,盒子显 然未充满。
在等距分组时,组距与组数的关系是:
本例中的数据为劳动定额的完成情况,属于工作成 绩的评定。根据一般将成绩分成优、良、中、及格 和不及格的五档评分习惯,可以先确定组数为5。 在等距分组时,计算组距如下: 48% 组距 9.6% 5
为了符合习惯和计算方便,组距近似地取10%。 第三步:确定组限
从此表可以看到,30名工人中,劳动定 额完成主要集中在100%—120%之间,占 66.7%。 在变量数列中标志值构成的数列表 示标志值的变动幅度,而频数构成的数 列则表示标志值相对的作用程度。频数 愈大则组的标志值对于全体标志水平所 起的作用也愈大;反之,频数愈小则各 组标志值所起的作用也愈小。
主词按照两个或两个以上的标志层叠分组 所形成的统计表。
简单表 分组表 复合表
统计表的编制规则
统计表应遵循科学、实用、简练、美观的原则进行设计。
1、统计表通常应设计成由纵横交叉线组成的长方形 表格,长宽之间应保持适当的比例。 2、统计表的总标题要用概括、简练的文字说明表的 内容,并在总标题内或在其下注明资料所属的时 间、地点和单位。 3、统计表的主词各行和宾词各栏,一般应按先局部 后整体的原则排列,即先列各项目,再列总计。 如果没有必要列出所有项目时,可以先列总计, 而后再列其中一部分重要的项目。