普通相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
独立.
2. 样本相关
定义: ( X1, Y1 ) ,…, ( Xn, Yn )是 ( X, Y ) 的 一组样 本( 样本 X, Y 是配对的, 不可独自交换顺序 ), 则 样本相关系数:
rXY
xi yi
i
xi2
yi2
i
i
( X i X )(Yi Y )
i
( X i X )2
(Yi Y )2
1. 剔除了一个变量 Z 的影响后, 两个变量 X , Y 之间的 偏相关系数。
偏相关系数是:
rxy,z
rxy rxzryz (1 rx2z ) (1 ry2z )
式中, r..是普通样本相关系数.
2 . 剔除了两个变量 Z1, Z2 的影响后, 两个变量 X , Y 之 间的偏相关系数
偏相关系数是:
1. 简单样本相关系数(Pearson)显著异于 0 的 T 检验
在二维总体(X,Y)服从正态分布条件下, Fisher 给出了 检验简单相关系数(Pearson)显著异于0的t 统计量为:
t r n 2 服从 t (n-1)分布 1 r2
式中, n 是样本容量, r 是简单相关系数.
设定假设: H0: r =0 H1: r 0
i
i
注意: 小写的 xi 是大写 Xi 的中心化结果, 即 xi = Xi –X . 对yi 同理. 这种相关关系, 又称 Pearson积矩相关.
3 样本相关系数的几何解释
y
ຫໍສະໝຸດ Baidu x
r x, y cos
x y ||y|| = y12 +…+ yn2 , 表示向量 y =(y1,…, yn) T的模长.
这是一个双尾检验问题.
2. 等级相关系数(Spearman)显著异于 0 的 T 检验 检验等级相关系数(Spearman)显著异于0的t 统计量为:
t r n 2 服从 t (n-1)分布 1 r2
式中, n 是样本容量, r 是等级相关系数.
3. 偏相关系数显著异于 0 的 T 检验
检验偏相关系数显著异于0的t 统计量为:
i
i
i
( Rx Rx )2
(Ry Ry )2
i
i
i
i
2. 刻度级(Scale) 配对样本的等级相关系数
刻度级的配对样本, 也可以排名次(秩), 因此可以求 Spearman 等级相关系数. 计算公式同上. 等级相关, 也称非参数相关.
三 . 偏相关
偏相关就是, 在诸多相关的变量中, 剔除了其中的一个 或若干个变量的影响后, 两个变量之间的相关关系.
第九章 普通相关分析
变量之间的相关关系有两种: ➢ 确定性的关系 ➢ 不确定性的关系
相关分析是研究变量之间不确定关系的统计方 法。最为常见的是两个或多个随机变量之间的线 性相关关系。 也是本章研究的主要内容。
一.两个随机变量的总体相关与样本相关
1. 两个随机变量的总体 (简单) 相关系数
定义: X , Y 是随机变量, 已知二维( X, Y ) 分布, 总体相关系数
XY
cov(X ,Y ) D( X ) D(Y )
E[(X E( X ))(Y E(Y ))] E( X E( X ))2 E(Y E(Y ))2
相关系数 XY[-1, 1], 若XY = 0, 则称 X 与 Y 不相关.
若 X 与Y 相互独立, 则必然不相关, 即 XY = 0 .
反之, 不相关, 不一定独立. 但对两个正态分布, 不相关
t r n k 2 服从 t (n-1)分布 1 r2
式中, n 是样本容量, r 是偏相关系数,k是剔除了的变量数. 注意: 如果要作正负相关的双向检验,就要做双尾的T检验。 如果只作正相关或负相关的检验,就只作单尾的T检验。 选择双尾还是单尾的T检验,所计算出来的 t 值是相同的,但 是t的显著性概率p(统计值t的外侧概率)是不同的。在双尾 情况下,t的外侧的概率是 2[1-P(T<t)].在单尾的情况下, t的外 侧的概率是1-P(T<t).
设有配对样本观测值x1,…, xn与 y1,…, yn .
等级相关系数公式如下:
n
6
d
2 i
1
i 1
n( n 2
1)
式中, di Rx Ry
i
i
,
而
Rx i
表示
xi
的名次,
Ry i
表示yi
的名次.
注: 两个相同的名次 , 要加起来除以 2.
一个等价的公式是:
( Rx Rx )(Ry Ry )
rxy,z z 12
rxy,z rxz ,z ryz ,z
1
21
21
(1 rx2z ,z ) (1 ry2z ,z )
21
21
式中, r..,.是偏相关系数.
四. 相关系数异于零的显著性检验
由于我们是通过抽样的方法来研究变量之间的关系, 所 以, 当求出各类样本相关系数不为零时, 并不能真正一定 表明变量之间是相关的, 要通过假设检验判别是否显著异 于 0.
4 . 直观散点图
设有配对样本观测值: x1,…, xn与 y1,…, yn , 则其直观 散点图如图:
该散点图, 反映出x, y 之间的正相关关系.
二. Spearman 等级相关
1. 两组配对的顺序数据的 Spearman 等级相关系数(又称秩 相关 或 名次相关)
对两组配对顺序样本而言, 无法求出上述样本相关系 数, 而应当采用Spearman 等级相关系数.