描述性分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三峡大学
经济与管理学院
第三讲 描述性分析
实验目的 摘要性分析的诸个过程,完成许多统计学 指标,对于计量资料,可完成均数、标准差、 标准误等指标的计算;对于计数和一些等级资 料,可完成构成比率等指标的计算。
2016/8/5
例:30名学生的考试成绩:SPSS练习21 打开【分析】选择【频率】
三 峡 大 学 Frequencies过程(频数分析) 第一节 经济与管理学院
Statistics 对话框
进行相关 系数的检 验,有两 项结果显 示: Pearson 相关系数 和 Spearma n相关系 数 适用于定序变量: Gamma系数反映两个有序变量间 的对称相关性。 是Gamma检验的非对称推广。 对有序变量和秩变量相关性的非参 数检验。 与Kendall’s tau-c相似
地板 材料 地板
其他 合计
地区
1 69 78 147 2 126 99 225 3 16 27 43
合计
211 204 415
这些数据是否提供证据说明该城市不同地区居民 对地板喜好比例不同?
2016/8/5
三峡大学
经济与管理学院
2016/8/5
三峡大学
经济与管理学院
商品 地板 其他 合计
商品* 地区 交叉制表 1 计数 地区 中的 % 计数 地区 中的 % 计数 地区 中的 % 69 46.9% 78 53.1% 147 100.0% 地区 2 126 56.0% 99 44.0% 225 100.0% 3 16 37.2% 27 62.8% 43 100.0% 合计 211 50.8% 204 49.2% 415 100.0%
2016/8/5
三峡大学
经济与管理学院
第二步:【多重响应】—【定义变量集】
2016/8/5
三峡大学
经济与管理学院
第三步:【多重响应】—【定义变量集】—【频率】
$a1 频率 响应 N 获取新闻 报纸 主要渠道a 电视 杂志 广播 互联网 朋友/家人/同事 总计 a. 组 802 794 243 171 1031 145 3186 个案百分 百分比 比 25.2% 72.3% 24.9% 7.6% 5.4% 32.4% 4.6% 100.0% 71.5% 21.9% 15.4% 92.9% 13.1% 287.0%
三峡大学
经济与管理学院
系统以ZCJ为变量名将原始数据转换成标准z 分值,存放在原数据库中,亦即变量的标准化过 程。
2016/8/5
三峡大学
经济与管理学院
第三节 Explore过程(探索分析)
调用此过程可对变量进行更为深入详尽的描 述性统计分析,故称之为探索性统计。 它在一般描述性统计指标的基础上,增加有 关数据其他特征的文字与图形描述,显得更加细 致与全面,有助于用户思考对数据进行进一步分 析的方案。
32 16.3% 240 21.9%
100.0%
196 100.0% 1096 100.0%
合计
输出结果: 男性网民与女性网民对周末读物的需求并不相同。
2016/8/5
卡方检验 经济与管理学院 值 df
三峡大学
对称度量
渐进 Sig. (双侧)
Pearson 卡方
7.251a 7.337 .538 1096
2 2 1
.027 .026 .463
似然比
线性和线性组合 有效案例中的 N
φ 按标量 Cramer 标定 的V
有效案例中的 N
近似 值 值 Sig. .081 .027 .081 1096 .027
a. 0 单元格(.0%) 的期望计数少于 5。最小 期望计数为 42.92。
卡方检验结果:零假设为比例 相同,显著性水平(sig)小于 0.05,意味着零假设不成立, 因此不同性别的网民对周末读 物的选择性有显著差异。
卡方检验
Pearson 卡方 似然比 有效案例中的 415 N a. 0 单元格(.0%) 的期望计数少于 5。最小期望计 数为 21.14。 值 6.489a 6.527 df 渐进 Sig. (双侧) 2 .039 2 .038
对称度量 按标量标 φ 定 Cramer 的 V 有效案例中的 N 近似值 Sig. 值 .125 .039 .125 415 .039
2016/8/5
三峡大学
第二节 Descriptives过程(描述性分析)
调用此过程可对变量进行描述性统计分析, 计算并列出一系列相应的统计指标,且可将原始 数据转换成标准Z分值并存入数据库,所谓Z分值 是指某原始数值比其均值高或低多少个标准差单 位,高的为正值,低的为负值,相等的为零。
经济与管理学院
结论:不同地区对地板喜欢程度有显著差异性
2016/8/5
三峡大学
经济与管理学院
练习:某市商业系统为提高商业企业的服务质量,对 本市的四个大商场进行调查,征求顾客意见,共收回 有效问卷443分,每张问卷对某一商场按照优、中、 差进行服务质量评价,试分析四个商场的服务质量评 价是否一样? 商场 合计 A B C D 优 中 差 合计
.580 1.121 2.336
.580 1.121
三峡大学
经济与管理学院
第四节 交互分析(crosstabs)
• 基本功能:适用于两个或两个以上变量交叉分类 形成列联表,对变量的关联性进行分析。数量变 量和类别变量都可以进行。 • 常用于检验两类假设,即变量间的独立性假设与 比例一致性假设。 • 独立性假设检验同意群样本在两个变量上的反应, 以判断在总体范围内两变量之间的关系。 • 比例一致性假设检验,首先从两个总体范围内抽 取两个样本(同一总体抽取2个样本),然后根据 两个样本反应推论两个总体是否相同。
如:1班分数的均值和标准差分别为78.53和 9.43,而2班的均值和标准差分别为70.19和7.00。 试问1班的90分是不是比2班的82分成绩更好? (Z1=1.22, Z2=1.69)
2016/8/5
x x z s
三峡大学
经济与管理学院
例:30名学生的考试成绩:SPSS练习21 1.打开【分析】—【描述统计】—【描述】
2016/8/5
81 38 25 144
46 33 7 86
49 39 20 108
67 26 12 105
243 136 64 443
三峡大学
经济与管理学院
多重反应下的交互分析
对每一项目对应多个反应(如多项选择)的数据进行频 次分析。 菜单:【分析】—【多重响应】—【定义变量集】—【交叉】
2016/8/5
2016/8/5
三峡大学
经济与管理学院
菜单位置:【分析】—【描述统计】—【交叉】
例:在网民媒体习惯调查中,有一个问题“您认为哪一种读 物更适合在周末阅读?”有三个选项:日报的周末版、杂志、 周报。研究者想知道不同性别网民的选择是否一致?
2016/8/5
三峡大学
经济与管理学院
进行行和列变量相互独立的假 设检验,有多种检验法。
2016/8/5
三峡大学
经济与管理学院
若要做等距分组进行频数描述如何操作? 如分成:60以下 60—70 70—80 80—90 90以上
2016/8/5
三峡大学
经济与管理学院
练习:
某百货公司连续40天的商品销售额如下 (单位:万元)
41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35
用来描述相关性 当用自变量预测因变量时,此 系数反映这种预测降低错误的比 率。(1表示自变量可以完全预测 因变量,0表示完全不能) 表示用一个变量来预测其他变 量时降低错误的比率
适用于定序变量: 用于检验相关性(“1”高度相关,“0”无相 关) 进行一个二值因素变量和一个二值响应变量的独 立性检验。 用于检验两个评估方法对同一对象的评估是否具 有一致系。 检验某事件发生和某因子之间的关系(“1”完 2016/8/50”一致性与偶然预期相同,至少大于 全一致,“ 0.7)
三峡大学
经济与管理学院
你认为下列哪一种读物更适合在 周末阅读?
性别 男 计数 性别 中的 % 女 计数 性别 中的 % 计数 性别 中的 %
日报的周末版 379
杂志 313
周报 208
合计 900
42.1%
78 39.8% 457 41.7%
34.8%
86 43.9% 399 36.4%
23.1%
2016/8/5
三峡大学
经济与管理学院
2016/8/5
度量变量 选择直方 图
名义和序 号变量一 般选择条 形图或饼 图
三峡大学
经济与管理学院
Bootstrap法又称为自助法,是以现 有样本为基础的模拟抽样判断法, 可用于研究某统计量的分布特征, 特别适用于那些难以用常规方法处 理的参数区间估计,假设检验等问 题。其提出是基于参数估计准确性 考察的目的,目前已发展到几乎统 计学所有领域。提供了一条确保所 建模型的稳定性和可靠性的有效途 径,它通过对原始样本进行有放回 的重置抽样,进而估计某个估计量 的抽样分布。
(1)根据以上的数据进行适当的分组,编制频数 分布表,并绘制频数分布的直方图; (2)计算适当的统计指标对该百货公司这40天的 销售情况进行描述说明。
2016/8/5
三峡大学
经济与管理学院
多重反应下的频次分析
基本功能:对每一项目对应多个反应(如多项 选择)的数据进行频次分析。 菜单位置:【分析】—【多重响应】—【定义变 量集】—【频率】 例:你主要的新闻渠道包括哪些?(可多选) 1报纸 2 电视 3杂志 4 广播 5互联网 6 朋友/家人 步骤:第一步:录入,把每个选项视为一个变量,变 量的数目与选项的数目相等。最好把每个多选项统 一编码,以便于分析数据。
三峡大学
经济与管理学院
2016/8/5
2016/8/5
卡方检验结果存在显著差异, 有必要对每对假设分别进行 检验。Φ和v值是衡量两个 变量关系强度的常用指标。 一般适用于2*2、2*3、3*2 交互列表,值在(-1,1) 之间,越小关系强度越低, 其中0.1表示低,0.30表示 一般,0.5表示高。
三峡大学
经济与管理学院
例:某公司调研关于不同地区对地板的喜好数据:
2016/8/5
三峡大学
经济与管理学院
打开【分析】—【描述统计】—【探索】 例:男女各15名学生的考试成绩,试分析成绩与性 别是否有关系。 见SPSS练习21
2016ห้องสมุดไป่ตู้8/5
描述 SEX 三 峡 大 学 统计量 成绩 男 均值 71.80 经济与管理学院 均值的 95% 置信区间 下65.04 限 上78.56 限 5% 修整均值 72.11 中值 71.00 方差 148.88 6 标准差 12.202 极小值 51 极大值 87 范围 36 四分位距 20 偏度 -.196 峰度 -1.244 女 均值 78.00 均值的 95% 置信区间 下72.99 限 上83.01 限 5% 修整均值 78.00 中值 77.00 方差 81.857 标准差 9.047 极小值 64 极大值 92 范围 28 四分位距 17 2016/8/5 偏度 .310 峰度 -1.082 标准误 3.151
描述统计量
标准 N 全距 极小值 极大值 和 均值 方差 偏度 峰度 差 统计 统计 标准 统计 统计 统计 统计 量 统计量 统计量 统计量 统计量 量 误 量 量 量 标准误 量 标准误 成绩 30 41 51 92 2.E3 74.90 2.01 11.01 121.3 .427 -.599 .833 1 5 34 .283 有效的 N 30 (列表状 2016/8/5 态)
经济与管理学院
第三讲 描述性分析
实验目的 摘要性分析的诸个过程,完成许多统计学 指标,对于计量资料,可完成均数、标准差、 标准误等指标的计算;对于计数和一些等级资 料,可完成构成比率等指标的计算。
2016/8/5
例:30名学生的考试成绩:SPSS练习21 打开【分析】选择【频率】
三 峡 大 学 Frequencies过程(频数分析) 第一节 经济与管理学院
Statistics 对话框
进行相关 系数的检 验,有两 项结果显 示: Pearson 相关系数 和 Spearma n相关系 数 适用于定序变量: Gamma系数反映两个有序变量间 的对称相关性。 是Gamma检验的非对称推广。 对有序变量和秩变量相关性的非参 数检验。 与Kendall’s tau-c相似
地板 材料 地板
其他 合计
地区
1 69 78 147 2 126 99 225 3 16 27 43
合计
211 204 415
这些数据是否提供证据说明该城市不同地区居民 对地板喜好比例不同?
2016/8/5
三峡大学
经济与管理学院
2016/8/5
三峡大学
经济与管理学院
商品 地板 其他 合计
商品* 地区 交叉制表 1 计数 地区 中的 % 计数 地区 中的 % 计数 地区 中的 % 69 46.9% 78 53.1% 147 100.0% 地区 2 126 56.0% 99 44.0% 225 100.0% 3 16 37.2% 27 62.8% 43 100.0% 合计 211 50.8% 204 49.2% 415 100.0%
2016/8/5
三峡大学
经济与管理学院
第二步:【多重响应】—【定义变量集】
2016/8/5
三峡大学
经济与管理学院
第三步:【多重响应】—【定义变量集】—【频率】
$a1 频率 响应 N 获取新闻 报纸 主要渠道a 电视 杂志 广播 互联网 朋友/家人/同事 总计 a. 组 802 794 243 171 1031 145 3186 个案百分 百分比 比 25.2% 72.3% 24.9% 7.6% 5.4% 32.4% 4.6% 100.0% 71.5% 21.9% 15.4% 92.9% 13.1% 287.0%
三峡大学
经济与管理学院
系统以ZCJ为变量名将原始数据转换成标准z 分值,存放在原数据库中,亦即变量的标准化过 程。
2016/8/5
三峡大学
经济与管理学院
第三节 Explore过程(探索分析)
调用此过程可对变量进行更为深入详尽的描 述性统计分析,故称之为探索性统计。 它在一般描述性统计指标的基础上,增加有 关数据其他特征的文字与图形描述,显得更加细 致与全面,有助于用户思考对数据进行进一步分 析的方案。
32 16.3% 240 21.9%
100.0%
196 100.0% 1096 100.0%
合计
输出结果: 男性网民与女性网民对周末读物的需求并不相同。
2016/8/5
卡方检验 经济与管理学院 值 df
三峡大学
对称度量
渐进 Sig. (双侧)
Pearson 卡方
7.251a 7.337 .538 1096
2 2 1
.027 .026 .463
似然比
线性和线性组合 有效案例中的 N
φ 按标量 Cramer 标定 的V
有效案例中的 N
近似 值 值 Sig. .081 .027 .081 1096 .027
a. 0 单元格(.0%) 的期望计数少于 5。最小 期望计数为 42.92。
卡方检验结果:零假设为比例 相同,显著性水平(sig)小于 0.05,意味着零假设不成立, 因此不同性别的网民对周末读 物的选择性有显著差异。
卡方检验
Pearson 卡方 似然比 有效案例中的 415 N a. 0 单元格(.0%) 的期望计数少于 5。最小期望计 数为 21.14。 值 6.489a 6.527 df 渐进 Sig. (双侧) 2 .039 2 .038
对称度量 按标量标 φ 定 Cramer 的 V 有效案例中的 N 近似值 Sig. 值 .125 .039 .125 415 .039
2016/8/5
三峡大学
第二节 Descriptives过程(描述性分析)
调用此过程可对变量进行描述性统计分析, 计算并列出一系列相应的统计指标,且可将原始 数据转换成标准Z分值并存入数据库,所谓Z分值 是指某原始数值比其均值高或低多少个标准差单 位,高的为正值,低的为负值,相等的为零。
经济与管理学院
结论:不同地区对地板喜欢程度有显著差异性
2016/8/5
三峡大学
经济与管理学院
练习:某市商业系统为提高商业企业的服务质量,对 本市的四个大商场进行调查,征求顾客意见,共收回 有效问卷443分,每张问卷对某一商场按照优、中、 差进行服务质量评价,试分析四个商场的服务质量评 价是否一样? 商场 合计 A B C D 优 中 差 合计
.580 1.121 2.336
.580 1.121
三峡大学
经济与管理学院
第四节 交互分析(crosstabs)
• 基本功能:适用于两个或两个以上变量交叉分类 形成列联表,对变量的关联性进行分析。数量变 量和类别变量都可以进行。 • 常用于检验两类假设,即变量间的独立性假设与 比例一致性假设。 • 独立性假设检验同意群样本在两个变量上的反应, 以判断在总体范围内两变量之间的关系。 • 比例一致性假设检验,首先从两个总体范围内抽 取两个样本(同一总体抽取2个样本),然后根据 两个样本反应推论两个总体是否相同。
如:1班分数的均值和标准差分别为78.53和 9.43,而2班的均值和标准差分别为70.19和7.00。 试问1班的90分是不是比2班的82分成绩更好? (Z1=1.22, Z2=1.69)
2016/8/5
x x z s
三峡大学
经济与管理学院
例:30名学生的考试成绩:SPSS练习21 1.打开【分析】—【描述统计】—【描述】
2016/8/5
81 38 25 144
46 33 7 86
49 39 20 108
67 26 12 105
243 136 64 443
三峡大学
经济与管理学院
多重反应下的交互分析
对每一项目对应多个反应(如多项选择)的数据进行频 次分析。 菜单:【分析】—【多重响应】—【定义变量集】—【交叉】
2016/8/5
2016/8/5
三峡大学
经济与管理学院
菜单位置:【分析】—【描述统计】—【交叉】
例:在网民媒体习惯调查中,有一个问题“您认为哪一种读 物更适合在周末阅读?”有三个选项:日报的周末版、杂志、 周报。研究者想知道不同性别网民的选择是否一致?
2016/8/5
三峡大学
经济与管理学院
进行行和列变量相互独立的假 设检验,有多种检验法。
2016/8/5
三峡大学
经济与管理学院
若要做等距分组进行频数描述如何操作? 如分成:60以下 60—70 70—80 80—90 90以上
2016/8/5
三峡大学
经济与管理学院
练习:
某百货公司连续40天的商品销售额如下 (单位:万元)
41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35
用来描述相关性 当用自变量预测因变量时,此 系数反映这种预测降低错误的比 率。(1表示自变量可以完全预测 因变量,0表示完全不能) 表示用一个变量来预测其他变 量时降低错误的比率
适用于定序变量: 用于检验相关性(“1”高度相关,“0”无相 关) 进行一个二值因素变量和一个二值响应变量的独 立性检验。 用于检验两个评估方法对同一对象的评估是否具 有一致系。 检验某事件发生和某因子之间的关系(“1”完 2016/8/50”一致性与偶然预期相同,至少大于 全一致,“ 0.7)
三峡大学
经济与管理学院
你认为下列哪一种读物更适合在 周末阅读?
性别 男 计数 性别 中的 % 女 计数 性别 中的 % 计数 性别 中的 %
日报的周末版 379
杂志 313
周报 208
合计 900
42.1%
78 39.8% 457 41.7%
34.8%
86 43.9% 399 36.4%
23.1%
2016/8/5
三峡大学
经济与管理学院
2016/8/5
度量变量 选择直方 图
名义和序 号变量一 般选择条 形图或饼 图
三峡大学
经济与管理学院
Bootstrap法又称为自助法,是以现 有样本为基础的模拟抽样判断法, 可用于研究某统计量的分布特征, 特别适用于那些难以用常规方法处 理的参数区间估计,假设检验等问 题。其提出是基于参数估计准确性 考察的目的,目前已发展到几乎统 计学所有领域。提供了一条确保所 建模型的稳定性和可靠性的有效途 径,它通过对原始样本进行有放回 的重置抽样,进而估计某个估计量 的抽样分布。
(1)根据以上的数据进行适当的分组,编制频数 分布表,并绘制频数分布的直方图; (2)计算适当的统计指标对该百货公司这40天的 销售情况进行描述说明。
2016/8/5
三峡大学
经济与管理学院
多重反应下的频次分析
基本功能:对每一项目对应多个反应(如多项 选择)的数据进行频次分析。 菜单位置:【分析】—【多重响应】—【定义变 量集】—【频率】 例:你主要的新闻渠道包括哪些?(可多选) 1报纸 2 电视 3杂志 4 广播 5互联网 6 朋友/家人 步骤:第一步:录入,把每个选项视为一个变量,变 量的数目与选项的数目相等。最好把每个多选项统 一编码,以便于分析数据。
三峡大学
经济与管理学院
2016/8/5
2016/8/5
卡方检验结果存在显著差异, 有必要对每对假设分别进行 检验。Φ和v值是衡量两个 变量关系强度的常用指标。 一般适用于2*2、2*3、3*2 交互列表,值在(-1,1) 之间,越小关系强度越低, 其中0.1表示低,0.30表示 一般,0.5表示高。
三峡大学
经济与管理学院
例:某公司调研关于不同地区对地板的喜好数据:
2016/8/5
三峡大学
经济与管理学院
打开【分析】—【描述统计】—【探索】 例:男女各15名学生的考试成绩,试分析成绩与性 别是否有关系。 见SPSS练习21
2016ห้องสมุดไป่ตู้8/5
描述 SEX 三 峡 大 学 统计量 成绩 男 均值 71.80 经济与管理学院 均值的 95% 置信区间 下65.04 限 上78.56 限 5% 修整均值 72.11 中值 71.00 方差 148.88 6 标准差 12.202 极小值 51 极大值 87 范围 36 四分位距 20 偏度 -.196 峰度 -1.244 女 均值 78.00 均值的 95% 置信区间 下72.99 限 上83.01 限 5% 修整均值 78.00 中值 77.00 方差 81.857 标准差 9.047 极小值 64 极大值 92 范围 28 四分位距 17 2016/8/5 偏度 .310 峰度 -1.082 标准误 3.151
描述统计量
标准 N 全距 极小值 极大值 和 均值 方差 偏度 峰度 差 统计 统计 标准 统计 统计 统计 统计 量 统计量 统计量 统计量 统计量 量 误 量 量 量 标准误 量 标准误 成绩 30 41 51 92 2.E3 74.90 2.01 11.01 121.3 .427 -.599 .833 1 5 34 .283 有效的 N 30 (列表状 2016/8/5 态)