[课件]相关性分析PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
序-序
类\序-距 (≥3) 距-距
G/ rs E/E2
r
[-1.1] [0.1]
[-1.1]
G/rs2 E2
r2
T检验 F检验
T检验
相关系数的取值范围在−1和+1之间,即 −1≤r≤+1。其中: 若0<r≤1,表明变量之间存在正相关关 系,即两个变量的相随变动方向相同 ; 若−1≤r<0,表明变量之间存在负相关 关系,即两个变量的相随变动方向相 反;
序-序:τb ,rs
outline
• 线性相关(linear Correlation)
• 秩相关(rank correlation) • 分类变量的关联性分析
线性相关
(linear Correlation)
Sir Francis Galton 1822-1911
Karl Pearson 1857-1936
SPSS的运行方式
SPSS主要有3种运行方式。 1.批处理方式 2.完全窗口菜单运行方式 3.程序运行方式
SPSS的数据编辑窗口
SPSS主界面主要有两个,一个是SPSS数据 编辑窗口,另一个是SPSS输出窗口。 数据编辑窗口由标题栏、菜单栏、工具栏、 编辑栏、变量名栏、内容区、窗口切换标 签页和状态栏组成,如图1-2所示。
卡方检验的基本原理
• 卡方检验用于检验因素变量的两项或多
项分类的实际观察频数与期望频数之间
是否差异显著。
•
这里的差异是指:
与某种理论分布的频数分布是否吻合
两个变量所分的类别中频数是否一致
在描述统计菜单中做卡方检 验
一个分类变量
另一个分类变量
在非参数检验菜单中做卡方 检验
关于卡方检验
研究目的:两随机变量间的关系
身高和体重的关系
凝血酶浓度和凝血时间的关系 上网时间和考试分数的关系 收入和生活满意度的关系
线性相关
(双变量正态分布资料)
秩相关
(偏峰分布、分布未知、等级资料)
婴儿腹泻和婴儿喂养方式的关系
分类变量的关联性分析
(二分类和无序多分类资料)
ABO血型和MN血型的关系
距-距Pearson: r系数
都要求各个体间满足独立性
都用于刻画两变量间相关的方向与密切程度
outline
• 线性相关(linear Correlation)
• 秩相关(rank correlation) • 分类变量的关联性分析
分类变量的关联性分析
• 交叉分类2×2表资料的关联分析 • 2×2配对资料的关联性分析 • R×C表分类资料的关联性分析
实现步骤
6.2.3 结果和讨论
outline
• 线性相关(linear Correlation)
• 秩相关(rank correlation) • 分类变量的关联性分析
秩相关
也称等级相关,最常用的Spearman秩相关。
资料类型 不服从正态分布的资料 总体分布未知的资料 等级资料
(3)单元包含值,即每个单元包括一个观测中的 单个变量值。单元(Cell)是观测和变量的交叉 。 (4)数据文件是一张长方形的二维表。数据文件 的范围是由观测和变量的数目决定的。可以在任 一单元中输入数据。如果在定义好的数据文件边 界以外键入数据,SPSS将数据长方形延长到可 包括那个单元和文件边界之间的任何行和列。
该窗口下方有两个标签:“Data View”(数据视图 )和“Variable View”(变量视图)。 如果使用过电子表格,如Microsoft Excel等,那么 数据编辑窗口中“Data View”所对应表格许多功 能应该已经熟悉。但是它和一般的电子表格处理 软件还有以下区别。
(1) 一个列对应一个变量,即每一列代表一个变 量(Variable)或一个被观测量的特征。例如问 卷上的每一项就是一个变量。 (2) 行是观测,即每一行代表一个个体、一个观 测、一个样品,在SPSS中称为事件(Case)。 例如,问卷上的每一个人就是一个观测。
• Pearson简单相关系数用来衡量定距 变量间的线性关系。如衡量国民收入 和居民储蓄存款、身高和体重、高中 成绩和高考成绩等变量间的线性相关 关系。
SPSS中实现过程
• 研究问题 某班级学生数学和化学的期末考试成绩 如表6-1所示,现要研究该班学生的数 学和化学成绩之间是否具有相关性。
表6-1 学生的数学和化学成绩
相关性分析
SPSS简介
SPSS for Windows是一个组合式软件包,它集数据整理、分析功能于 一身。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管 理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模 型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存 分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程 ,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、 Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过 程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专 门的绘图系统,可以根据数据绘制各种图形。
原理 利用两变量的秩次作线性相关分析,对原变 量的分布不作要求,属非参数统计方法。
Pearson积差相关与Spearman秩相关的区别 与联系 Pearson积差相 Spearman秩相关
关 区别 布 双变量正态分 偏峰分布 分布未知、 等级资料 rs为非参数统计量
r为参数统计量
原始数据 联系
秩次
χ² 检验
χ² 检验 秩和检验
Logistic回归分析
测量级别 类-类 (类-序)
相关 系数 λ
取值范 围 [0.1]
PRE意义 λ
检验方 法 χ2
wenku.baidu.com
SPSS程序 crosstabs Crosstabs/ correlation crosstabs/ Oneway/ means crosstabs/ correlation /linear
• SPSS结果输出窗口名为Viewer,它是 显示和管理SPSS统计分析结果、报表 及图形的窗口。读者可以将此窗口中 的内容以结果文件.spo的形式保存。
不同类型的数据适用的统计方法不同
统计资料分析方法
测量资料
计数资料
等级/顺序资料
t检验 F检验 方差分析 秩和检验 相关分析 线性回归分析 因子分析