第7章--相关分析与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ Spearman等级相关系数用来度量定序变量间的线性相
关关系,设计思想与Pearson简单相关系数相同,只是数据
为非定距的,故计算时并不直接采用原始数据 ( x i , y,i ) 而
是利用数据的秩,用两变量的秩 (U i , V i 代) 替 ( x i , y i代) 入
Pearson简单相关系数计算公式中,于是其中的
13
❖ (三)相关系数在SPSS中的实现
❖
1、建立或打开数据文件后,进入
Analyze→Correlate→Bivariate主对话框,如图7-4所示。
2021/2/6
14
❖ 图7-4 相关分析主对话框
❖ 2、选择参加计算相关系数的变量到Variables框。
❖ 3、Correlation Coefficients分析方法选择项,有 三种相关系数,如Pearson复选项、Spearman复选 项、Kendall’s tau-b 复选项,对应于三种分析方法。
❖ ❖
r (xix)(yiy) (xix)2•(yiy)2
(7.1)
❖ Pearson 简单相关系数的检验统计量为统计量,其数 学定义为:
❖
t r n2
1 r2
❖
(7.2)
❖ SPSS将自动计算Pearson 简单相关系数、检验统计量
2021/2/6的观察值和对应的概率值。
10
❖ 2、Spearman等级相关系数
于是
n
Di2
n
(Ui
的Vi)值2 较大,r趋向于0;
i1
i1
❖ 在小样本下,在零假设成立时, Spearman等级相关系数
服从Spearman分布;在大样本下, Spearman等级相关系
数的检验统计量为Z统计量,定义为:
Z r n1
❖ Z统计量近似服从标准正态分布。
❖ SPSS将自动计算Spearman等级相关系数,Z检验统计量 的观察值和相伴概率 p值。
❖ 3、根据所选择的散点图的类型,按Define按 钮对散点图作具体定义。不同类型的散点图其具 体的定义选项略有差别。
2021/2/6
7
❖ 三、相关系数
❖ (一)相关系数的概念和分析步骤
❖
相关系数能够以数字的方式准确描述变量间的
线性关系程度和方向。
❖
相关系数的分析步骤:
❖
1、计算样本相关系数 r
❖
2021/2/6
第七章 相关分析与回归分析
1
本章内容
❖ 第一节 相关分析 ❖ 第二节 线性回归分析 ❖ 第三节 曲线估计
2021/2/6
2
第一节 相关分析
❖ 一、相关分析的概念与类型 ❖ (一)相关分析的基本概念 ❖ 相关关系是指变量之间存在的不确定的依存关
系,即当一个变量取一定值时,另一变量无法依确 定的函数取唯一确定的值,然而它仍按某种规律 在一定的范围内变化。
取值范围被限制在1和 之n间,且可被简化为:
和x i
的y i
n
6
D
2 i
r 1 i1 n(n 2 1)
❖ 式中:
n
Hale Waihona Puke Baidu
n
Di2 (Ui Vi)2
2021/2/6
i1
i1
11
❖ 如果两变量的正相关性较强,它们秩的变化具有同步性,于
是
n
Di2
n
(Ui
V的i)2值较小,r趋向于1;
i1
i1
❖ 如果两变量的正相关性较弱,它们秩的变化不具有同步性,
(7.5)
❖ 在小样本下Kendall τ服从Kendall分布。在大样本下 采用的检验统计量为
❖
Z 9n(n1)
❖
2(2n 5)
(7.6)
❖ 在公式(7.6)中, Z统计量近似服从标准正态分布。
❖ SPSS将自动计算Kendall τ相关、Z检验统计量的观测
2021/2/6值和相伴概率 p值。
2021/2/6
12
❖ 3、Kendall τ相关系数
❖ Kendall τ相关采用非参数检验方法用来度量定序变量
间的线性相关关系。它利用变量秩数据计算一致对数目U
和非一致对数目V 。
❖ Kendall τ相关正是要对此进行检验。Kendall τ统计 量的数学定义为
(UV) 2
❖
n(n1)
2021/2/6
5
❖ (二)散点图在SPSS中的实现
❖ 1、建立或打开数据文件后,进入“Graphs” →“Legacy Dialogs”→“Scatter/Dot”主对话框,如图71所示。
2021/2/6
❖ 图7-1 散点图主对话框
6
❖ 2、选择散点图的类型。SPSS中提供了四种散 点图,分别是简单散点图(Simple)、重叠散点 图(Overlay)、矩阵散点图(Matrix)和三维 散点图(3-D)。
2具021/,2/6 它们的相互结合能够达到较为理想的分析效果。4
❖ 二、散点图
❖ (一)散点图的特点
❖ 绘制散点图是相关分析过程中极为常用且非常直 观的分析方法,它将数据以点的形式画在直角平面 上。通过观察散点图可以比较直观地看出变量之间 的相关关系以及它们的强弱程度和数据的可能走向。 通常橄榄球和棒状代表了数据对的主要结构和特征, 可以利用曲线将这种主要结构的轮廓描述出来,使 数据的主要特征更突显。
对不同类型的变量应采用不同的相关系数指标,
但它们的取值范围和含义都是相同的,即相关系
数 没有r单位,其值在-1~+1 之间。
❖ 2021/2/6
8
❖ 2、对样本来自的两总体是否存在显著的线性关 系进行推断。
❖ (1)提出原假设:总体中两个变量间的相关系数 为0,即两总体无显著的线性相关关系。
❖ (2)选择检验统计量。对不同类型的变量应采 用不同的相关系数,对应也应采用不同的检验统计 量。
❖ (3)计算检验统计量的观测值和相伴概率 p值。
❖ (4)给定显著性水平 ,并作出决策。如果相 伴概率值小于或等于给定的显著性水平,则拒绝原
假设;如果相伴概率值大于给定的显著性水平,则
2021不/2/6 能拒绝原假设。
9
❖ (二)相关系数的种类
❖ 1、Pearson 简单相关系数
❖ Pearson 简单相关系数用来度量定距型变量间的线性 相关关系,它的数学定义为:
2021/2/6
3
❖ (二)相关关系的类型 ❖ 1、按相关关系的程度,分为完全相关、不完全相关
和零相关。 ❖ 2、按相关变量的变化方向,分为正相关和负相关。 ❖ 3、按相关关系的表现形式,分为线性相关和曲线
相关。 ❖ 4、按变量多少,分为单相关、复相关和偏相关。 ❖ 5、按相关性质,分为“真实相关”和“虚假相关” ❖ 绘制散点图和计算相关系数是相关分析最常用的工