频数分布表及图形描述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
积累了各种各样的数据。这些数据的特点是
数据量大、杂乱无章!如何从这些数据中得
到有价值的信息?这就是统计分析所研究的
课题,而SPSS正是解决这样问题的工具及手
段。
2) SPSS的发展过程
20世纪60年代末,美国斯坦福大学的3位 研究生研制开发了统计分析软件: 社会科学 统计软件包(Statistical Package for Social Science) 1975年成立了SPSS软件公司,专门进行 统计分析软件的研发。由于市场前景广阔, 多家从事统计分析软件开发的公司相继出现, 但SPSS公司始终处于市场领先的位置。
顾 客 性 别
男
女
Total
Count % within 顾 客 性 别 % within 饮 料 类 型 % of Total Count % within 顾 客 性 别 % within 饮 料 类 型 % of Total Count % within 顾 客 性 别 % within 饮 料 类 型 % of Total
统计的应用实例
【例1-3】挑战者号航天飞机失事预测 在此次失事前,该航天飞机 24 次发射成功。将航天飞机 送入太空的两个固体燃料推进器由 6只O型项圈密封。在几次 飞行中,曾发生过O型项圈被腐蚀或气体泄漏事故。这样的事 故是及其危险的。前24 次发射中有一次发动机遭到了永久性 破坏。根据23次飞行中发生腐蚀或泄漏事故的次数(因变量)及 火箭连接处的温度(自变量)数据,进行线性回归得到的回归方 程为
统计的应用实例
【例1-2】用简单的描述统计量得到一个重要发现 费舍 (R . A . Fisher) 在 1952 的一篇文章中举了一个例 子,说明如何由基本的描述统计量的知识引出一个重要 的发现。 20 世纪早期,哥本哈根卡尔堡实验室的施密特 (J.Schmidt) 发现不同地区所捕获的同种鱼类的脊椎骨和 鳃线的数量有很大不同;甚至在同一海湾内不同地点所 捕获的同种鱼类,也发现这样的倾向 然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲 各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域 里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值 和标准偏差值。由此,施密特推断所有各个不同海域内 的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳 (Dana)”的科学考察船在一次远征中发现了这个场所
ˆ 3.698 0.04754 x y
当温度为310F时,O型项圈发生事故的预计次数为 2.225次。 结果显示连接处的温度与O型项圈事故之间有一定的相关性。 如果当时那些经理们看到了回归的预测结果,也许推迟发射 会成为其谨慎的选择
管理统计的描述
使用对象:管理类各专业
频数分布表的生成
【例 1-1】为研究人们 对不同类型软饮料的偏 好情况,一家调查公司 在某超市随机调查了 50 名 顾 客 。 右 表 是 顾 客性别及其所偏好的饮 料类型记录。生成频数 分布表,观察不同性别 的顾客及其所偏好的饮 料类型的分布状况,并 进行描述性分析
2009 年 7 月 26 日至 8 月 3 日第 13 届世界游泳 锦标赛在意大利罗马举行。本届游泳世锦 赛金牌总数取得前三名的国家所获得奖牌 的分布情况如下表所示:
3) SPSS的应用领域
啤酒与尿布的故事:在美国的一家沃尔玛超市 里,有一个有趣的现象:尿布和啤酒赫然摆在一起 出售。匪夷所思! 原来,沃尔玛请咨询公司进行一年一度的数据 分析时发现,有相当数量购买尿布的购货单中也购 买了啤酒!经公司调查发现:美国的妇女们经常会嘱 咐她们的丈夫,在下班回家的路上务必为孩子购买 尿布。而丈夫在买尿布的同时,大都顺手买回犒劳 自己的啤酒!发现这一秘密后,超市将啤酒和尿布 放在了相邻的柜台进行销售,其结果是啤酒和尿布 的销量都大大提高。 • 咨询公司发现这一秘密的手段就是关联分析和 频数分析,这正是SPSS统计分析方法及应用中要讲 的部分内容。
果 汁 1 4.5% 16.7% 2.0% 5 17.9% 83.3% 10.0% 6 12.0% 100% 12.0%
矿 泉 水 6 27.3% 60.0% 12.0% 4 14.3% 40.0% 8.0% 10 20.0% 100.0% 20.0%
其 他 2 9.1% 25.0% 4.0% 6 21.4% 75.0% 12.0% 8 16.0% 100% 16.0%
1994-1998年间,SPSS公司兼并了多家从 事统计分析软件研发的公司,对这一市场进行 了整合,软件名称也改为:统计产品与服务解 决方案(Statistical Product and Service Solutions),最新版本SPSS20.0。 据不完全统计,现在的SPSS统计分析软件 在全球拥有26万家以上的用户,广泛应用于社 会的各个领域,是当今世界最流行的软件之一。 我们现在使用的是SPSS for Windows 17.0版。
生成交叉频数分布表
列联表的描述性分析
(例题分析—SPSS)
饮 料 类 型* 顾 客 性 别Crosstabulation
列 联 表 的 统 计 描 述
顾 客 性 别 男 饮 料 类 型 果 汁 Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total 1 16.7% 4.5% 2.0% 6 60.0% 27.3% 12.0% 7 63.6% 31.8% 14.0% 2 25.0% 9.1% 4.0% 6 40.0% 27.3% 12.0% 22 44.0% 100.0% 44.0% 女 5 83.3% 17.9% 10.0% 4 40.0% 14.3% 8.0% 4 36.4% 14.3% 8.0% 6 75.0% 21.4% 12.0% 9 60.0% 32.1% 18.0% 28 56.0% 100.0% 56.0% Total 6 100.0% 12.0% 12.0% 10 100.0% 20.0% 20.0% 11 100.0% 22.0% 22.0% 8 100.0% 16.0% 16.0% 15 100.0% 30.0% 30.0% 50 100.0% 100.0% 100.0%
Valid
用SPSS生成定性数据的列联表 (Crosstabulation—交叉表)
第 1 步: 选择 【Analyze】【Descriptive StatisticsCrosstabs】进入主对话框 第2步:将“饮料类型”选入【Row(s)】,将“顾客 性别”选入【Column(s)】(行列可以互换) 第3步:(若需要对列联表进行描述性分析)点击 【Cells】, 在 【Percentages】 下选中需 要的统计量,如 【Row】、【Column】、【Total】 等; ( 若需要图形 ) 点击 【Display clustered bar chart】。点击【OK】
碳 酸 饮 料 6 27.3% 40.0% 12.0% 9 32.1% 60.0% 18.0% 15 30.0% 100.0% 30.0%
Total 22 100.0% 44.0% 44.0% 28 100.0% 56.0% 56.0% 50 100.0% 100.0% 100.0%
列百分比
(二)图形表示法
生成频数分布表
SPSS生成的分布表
升序 排列 ( 汉字 拼音 字母) Valid
不同类型饮料的分布表
饮 料 类 型 Cumulative Percent 12.0 32.0 54.0 70.0 100.0 Frequency 6 10 11 8 15 50 Percent 12.0 20.0 22.0 16.0 30.0 100.0 Valid Percent 12.0 20.0 22.0 16.0 30.0 100.0
未分组数据组距分组数据未分组数据组距分组数据方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式当样本数据的个数为n时若样本平均数确定后则附加给n个观测值的约束个数就是1个因此只有n1个数据可以自由取值其中必有一个数据不能自由取值而x则是附件给离差平方和的一个约束因此计算离差平方和时只有n1个独立的观测值而不是n个样本标准差例题分析例35计算计算9名员工的月工资收入的方差和标准差1500750780108085096020001250163018635012001630120012501200750012001500方差方差标准差标准差683431186350可用于判断一组数据是否有离群点outlier用于对变量的标准化处理均值等于0方差等于1计算公式为标准化分数standardscore第1步
统计的应用实例
【例1-3】挑战者号航天飞机失事预测
1986年1月28日清晨,载有7名宇航员的挑战者号进 入发射状态。就在发射前,有冰片牢附在机壳上。几分 钟后,正当电视新闻报道它已进入轨道时,航天飞机在 毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存 推动航天飞机进入太空的两个固体燃料发动机是由 Thiokol公司制造的。失事前一天晚上,Thiokol公司的经 理们和国家航空航天局就如期发射还是推迟发射产生了 争执。天气预报发射时的气温为 310F。争执的结果采纳 了Thiokol公司经理们的建:按计划发射航天飞机。因为 他们觉得没有确凿证据表明低温会对固体燃料火箭推进 器的性能产生影响
统计的应用实例
【例1-1】用统计识别作者 1787—1788年,三位作者Alexander Hamilton, John Jay和James Madison为了说服纽约人认可宪法 ,匿名发表了著名的 85 篇论文。这些论文中的大多 数作者已经得到了识别,但是,其中的 12 篇论文的 作者身份引起了争议 通过对不同单词的频数进行统计分析,得出的结 论是, James Madison 最有可能是这 12 篇论文的作 者。现在,对于这些存在争议的论文,认为 James Madison是原创作者的说法占主导地位,而且几乎可 以肯定这种说法是正确
• SPSS统计分析方法在各行各业中有着广泛的应用。 • 频数分析:科学经营的依据----房地产项目,不 同户型数量的确定。 • 经济预测:制定省市乃至于一个企业的发展规划、 营销规划、预算的制定;上市公司是否被特别处理 (ST)。 • 判别分析:呼叫指纹识别、贷款客户的信用等级识 别、诊病。 • 聚类分析:市场的细分。手机使用者涉及各行各业, 其使用什么品牌、什么功能、什么价位的手机? • 时间序列分析:北京乘客数量的发展预测… • SPSS统计分析又称为数据分析、数据挖掘,是用 定量的方法,研究系统中各个变量之间的相互关系, 得到的结论用于决策,使得决策更科学、更优化!
绿色 健康饮品ຫໍສະໝຸດ 软件应用: 几种常用的统计软件(Software)
• 典型的统计软件
–
SAS – SPSS – R – MINITAB – STATISTICA – Excel – ……
SAS SPSS
STATISTICA MINITAB Excel
1. SPSS概述
1) SPSS的产生背景
随着计算机的普及,数据库的广泛应用,
果 汁 矿 泉 水 绿 茶 其 他 碳 酸 饮 料 Total
顾 客 性 别 男 女 Total Frequency 22 28 50 Percent 44.0 56.0 100.0 Valid Percent 44.0 56.0 100.0 Cumulative Percent 44.0 100.0
二、SPSS的主界面
用SPSS生成定性数据的频数分布表
第1步:选择【Analyze】【Descriptive Statistics-Frequencies】进入主对话框 第2步:将“饮料类型”或“顾客性别”选入 【Variable(s)】;选中【Display Frequency tables】
矿 泉 水
绿 茶
行 百 分 比 列 百 分 比
其 他
碳 酸 饮 料
Total
列联表的描述性分析
(例题分析—SPSS)
行百分比 列联表的统计描述
顾 客 性 别* 饮 料 类 型Crosstabulation 饮 料 类 型 绿 茶 7 31.8% 63.6% 14.0% 4 14.3% 36.4% 8.0% 11 22.0% 100% 22.0%
数据量大、杂乱无章!如何从这些数据中得
到有价值的信息?这就是统计分析所研究的
课题,而SPSS正是解决这样问题的工具及手
段。
2) SPSS的发展过程
20世纪60年代末,美国斯坦福大学的3位 研究生研制开发了统计分析软件: 社会科学 统计软件包(Statistical Package for Social Science) 1975年成立了SPSS软件公司,专门进行 统计分析软件的研发。由于市场前景广阔, 多家从事统计分析软件开发的公司相继出现, 但SPSS公司始终处于市场领先的位置。
顾 客 性 别
男
女
Total
Count % within 顾 客 性 别 % within 饮 料 类 型 % of Total Count % within 顾 客 性 别 % within 饮 料 类 型 % of Total Count % within 顾 客 性 别 % within 饮 料 类 型 % of Total
统计的应用实例
【例1-3】挑战者号航天飞机失事预测 在此次失事前,该航天飞机 24 次发射成功。将航天飞机 送入太空的两个固体燃料推进器由 6只O型项圈密封。在几次 飞行中,曾发生过O型项圈被腐蚀或气体泄漏事故。这样的事 故是及其危险的。前24 次发射中有一次发动机遭到了永久性 破坏。根据23次飞行中发生腐蚀或泄漏事故的次数(因变量)及 火箭连接处的温度(自变量)数据,进行线性回归得到的回归方 程为
统计的应用实例
【例1-2】用简单的描述统计量得到一个重要发现 费舍 (R . A . Fisher) 在 1952 的一篇文章中举了一个例 子,说明如何由基本的描述统计量的知识引出一个重要 的发现。 20 世纪早期,哥本哈根卡尔堡实验室的施密特 (J.Schmidt) 发现不同地区所捕获的同种鱼类的脊椎骨和 鳃线的数量有很大不同;甚至在同一海湾内不同地点所 捕获的同种鱼类,也发现这样的倾向 然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲 各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域 里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值 和标准偏差值。由此,施密特推断所有各个不同海域内 的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳 (Dana)”的科学考察船在一次远征中发现了这个场所
ˆ 3.698 0.04754 x y
当温度为310F时,O型项圈发生事故的预计次数为 2.225次。 结果显示连接处的温度与O型项圈事故之间有一定的相关性。 如果当时那些经理们看到了回归的预测结果,也许推迟发射 会成为其谨慎的选择
管理统计的描述
使用对象:管理类各专业
频数分布表的生成
【例 1-1】为研究人们 对不同类型软饮料的偏 好情况,一家调查公司 在某超市随机调查了 50 名 顾 客 。 右 表 是 顾 客性别及其所偏好的饮 料类型记录。生成频数 分布表,观察不同性别 的顾客及其所偏好的饮 料类型的分布状况,并 进行描述性分析
2009 年 7 月 26 日至 8 月 3 日第 13 届世界游泳 锦标赛在意大利罗马举行。本届游泳世锦 赛金牌总数取得前三名的国家所获得奖牌 的分布情况如下表所示:
3) SPSS的应用领域
啤酒与尿布的故事:在美国的一家沃尔玛超市 里,有一个有趣的现象:尿布和啤酒赫然摆在一起 出售。匪夷所思! 原来,沃尔玛请咨询公司进行一年一度的数据 分析时发现,有相当数量购买尿布的购货单中也购 买了啤酒!经公司调查发现:美国的妇女们经常会嘱 咐她们的丈夫,在下班回家的路上务必为孩子购买 尿布。而丈夫在买尿布的同时,大都顺手买回犒劳 自己的啤酒!发现这一秘密后,超市将啤酒和尿布 放在了相邻的柜台进行销售,其结果是啤酒和尿布 的销量都大大提高。 • 咨询公司发现这一秘密的手段就是关联分析和 频数分析,这正是SPSS统计分析方法及应用中要讲 的部分内容。
果 汁 1 4.5% 16.7% 2.0% 5 17.9% 83.3% 10.0% 6 12.0% 100% 12.0%
矿 泉 水 6 27.3% 60.0% 12.0% 4 14.3% 40.0% 8.0% 10 20.0% 100.0% 20.0%
其 他 2 9.1% 25.0% 4.0% 6 21.4% 75.0% 12.0% 8 16.0% 100% 16.0%
1994-1998年间,SPSS公司兼并了多家从 事统计分析软件研发的公司,对这一市场进行 了整合,软件名称也改为:统计产品与服务解 决方案(Statistical Product and Service Solutions),最新版本SPSS20.0。 据不完全统计,现在的SPSS统计分析软件 在全球拥有26万家以上的用户,广泛应用于社 会的各个领域,是当今世界最流行的软件之一。 我们现在使用的是SPSS for Windows 17.0版。
生成交叉频数分布表
列联表的描述性分析
(例题分析—SPSS)
饮 料 类 型* 顾 客 性 别Crosstabulation
列 联 表 的 统 计 描 述
顾 客 性 别 男 饮 料 类 型 果 汁 Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total Count % withi n 饮 料 类 型 % withi n 顾 客 性 别 % of Total 1 16.7% 4.5% 2.0% 6 60.0% 27.3% 12.0% 7 63.6% 31.8% 14.0% 2 25.0% 9.1% 4.0% 6 40.0% 27.3% 12.0% 22 44.0% 100.0% 44.0% 女 5 83.3% 17.9% 10.0% 4 40.0% 14.3% 8.0% 4 36.4% 14.3% 8.0% 6 75.0% 21.4% 12.0% 9 60.0% 32.1% 18.0% 28 56.0% 100.0% 56.0% Total 6 100.0% 12.0% 12.0% 10 100.0% 20.0% 20.0% 11 100.0% 22.0% 22.0% 8 100.0% 16.0% 16.0% 15 100.0% 30.0% 30.0% 50 100.0% 100.0% 100.0%
Valid
用SPSS生成定性数据的列联表 (Crosstabulation—交叉表)
第 1 步: 选择 【Analyze】【Descriptive StatisticsCrosstabs】进入主对话框 第2步:将“饮料类型”选入【Row(s)】,将“顾客 性别”选入【Column(s)】(行列可以互换) 第3步:(若需要对列联表进行描述性分析)点击 【Cells】, 在 【Percentages】 下选中需 要的统计量,如 【Row】、【Column】、【Total】 等; ( 若需要图形 ) 点击 【Display clustered bar chart】。点击【OK】
碳 酸 饮 料 6 27.3% 40.0% 12.0% 9 32.1% 60.0% 18.0% 15 30.0% 100.0% 30.0%
Total 22 100.0% 44.0% 44.0% 28 100.0% 56.0% 56.0% 50 100.0% 100.0% 100.0%
列百分比
(二)图形表示法
生成频数分布表
SPSS生成的分布表
升序 排列 ( 汉字 拼音 字母) Valid
不同类型饮料的分布表
饮 料 类 型 Cumulative Percent 12.0 32.0 54.0 70.0 100.0 Frequency 6 10 11 8 15 50 Percent 12.0 20.0 22.0 16.0 30.0 100.0 Valid Percent 12.0 20.0 22.0 16.0 30.0 100.0
未分组数据组距分组数据未分组数据组距分组数据方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式当样本数据的个数为n时若样本平均数确定后则附加给n个观测值的约束个数就是1个因此只有n1个数据可以自由取值其中必有一个数据不能自由取值而x则是附件给离差平方和的一个约束因此计算离差平方和时只有n1个独立的观测值而不是n个样本标准差例题分析例35计算计算9名员工的月工资收入的方差和标准差1500750780108085096020001250163018635012001630120012501200750012001500方差方差标准差标准差683431186350可用于判断一组数据是否有离群点outlier用于对变量的标准化处理均值等于0方差等于1计算公式为标准化分数standardscore第1步
统计的应用实例
【例1-3】挑战者号航天飞机失事预测
1986年1月28日清晨,载有7名宇航员的挑战者号进 入发射状态。就在发射前,有冰片牢附在机壳上。几分 钟后,正当电视新闻报道它已进入轨道时,航天飞机在 毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存 推动航天飞机进入太空的两个固体燃料发动机是由 Thiokol公司制造的。失事前一天晚上,Thiokol公司的经 理们和国家航空航天局就如期发射还是推迟发射产生了 争执。天气预报发射时的气温为 310F。争执的结果采纳 了Thiokol公司经理们的建:按计划发射航天飞机。因为 他们觉得没有确凿证据表明低温会对固体燃料火箭推进 器的性能产生影响
统计的应用实例
【例1-1】用统计识别作者 1787—1788年,三位作者Alexander Hamilton, John Jay和James Madison为了说服纽约人认可宪法 ,匿名发表了著名的 85 篇论文。这些论文中的大多 数作者已经得到了识别,但是,其中的 12 篇论文的 作者身份引起了争议 通过对不同单词的频数进行统计分析,得出的结 论是, James Madison 最有可能是这 12 篇论文的作 者。现在,对于这些存在争议的论文,认为 James Madison是原创作者的说法占主导地位,而且几乎可 以肯定这种说法是正确
• SPSS统计分析方法在各行各业中有着广泛的应用。 • 频数分析:科学经营的依据----房地产项目,不 同户型数量的确定。 • 经济预测:制定省市乃至于一个企业的发展规划、 营销规划、预算的制定;上市公司是否被特别处理 (ST)。 • 判别分析:呼叫指纹识别、贷款客户的信用等级识 别、诊病。 • 聚类分析:市场的细分。手机使用者涉及各行各业, 其使用什么品牌、什么功能、什么价位的手机? • 时间序列分析:北京乘客数量的发展预测… • SPSS统计分析又称为数据分析、数据挖掘,是用 定量的方法,研究系统中各个变量之间的相互关系, 得到的结论用于决策,使得决策更科学、更优化!
绿色 健康饮品ຫໍສະໝຸດ 软件应用: 几种常用的统计软件(Software)
• 典型的统计软件
–
SAS – SPSS – R – MINITAB – STATISTICA – Excel – ……
SAS SPSS
STATISTICA MINITAB Excel
1. SPSS概述
1) SPSS的产生背景
随着计算机的普及,数据库的广泛应用,
果 汁 矿 泉 水 绿 茶 其 他 碳 酸 饮 料 Total
顾 客 性 别 男 女 Total Frequency 22 28 50 Percent 44.0 56.0 100.0 Valid Percent 44.0 56.0 100.0 Cumulative Percent 44.0 100.0
二、SPSS的主界面
用SPSS生成定性数据的频数分布表
第1步:选择【Analyze】【Descriptive Statistics-Frequencies】进入主对话框 第2步:将“饮料类型”或“顾客性别”选入 【Variable(s)】;选中【Display Frequency tables】
矿 泉 水
绿 茶
行 百 分 比 列 百 分 比
其 他
碳 酸 饮 料
Total
列联表的描述性分析
(例题分析—SPSS)
行百分比 列联表的统计描述
顾 客 性 别* 饮 料 类 型Crosstabulation 饮 料 类 型 绿 茶 7 31.8% 63.6% 14.0% 4 14.3% 36.4% 8.0% 11 22.0% 100% 22.0%