第六章相关系数检验

合集下载

计量经济学 第六章 自相关

计量经济学 第六章 自相关
即假定自回归形式为一阶自回归 AR(1)。
20
第二节 自相关的后果
本节基本内容:
●一阶自回归形式的性质 ●自相关对参数估计的影响 ●自相关对模型检验的影响 ●自相关对模型预测的影响
21
一、一阶自回归形式的性质
对于一元线性回归模型:
Y = 1 + 2 X + u 假定随机误差项 u存在一阶自相关:
许多农产品的供给呈现为 蛛网现象,供给对价格的 反应要滞后一段时间,因 为供给需要经过一定的时
间才能实现。如果时期 t
的价格 Pt 低于上一期的 价格 Pt-1 ,农民就会减少 时期 t 1 的生产量。如
此则形成蛛网现象,此时 的供给模型为:
蛛网现象是微观经济学中的 一个概念。它表示某种商品 的供给量受前一期价格影响 而表现出来的某种规律性, 即呈蛛网状收敛或发散于供 需的均衡点。
xt xt+1
t =1 n
+ 22
xt xt+2
t =1 n
+ ...+ 2 n-1
x1xn
n
)
xt2
xt2
xt2
xt2
t =1
t =1
t =1
t =1
29
当存在自相关时,普通最小二乘估计量不再是最
佳线性无估计量,即它在线性无偏估计量中不是

心理统计学基础讲义 第六章 平均数差异、相关系数显著性检验

心理统计学基础讲义 第六章 平均数差异、相关系数显著性检验

方 差 齐 性检验
独立样本:F 检验,Fobs = Smax2 / Smin2
例:一家企业中 18 名员工进行工作满意度问卷调查,男、女员工得分如下:
男:67、73、74、70、70、75、73、68、69
女:69、63、67、64、61、66、60、63、63
问在α = 0.05 水平上,不同性别员工的满意度方差是否齐性?
φ相关
p1:A 的比率, p2:非 A 的比率
q1:B 的比率,q2:非 B 的比率
y1、y2:p1、p2 对应的正态表 y 值
z 1 y1 y2
r
p1q1 p2q2 n
求 相 关 的答题步骤
a. 画散点图
b. 求解相关系数
c. 相关系数显著性检验
41
D
2 1
2 2
=
n1 n2
52 6.52 + =1.55
30 27
Zobs
(X1
X
2 ) (1 D
2 )
(114 112) 0 1.55
0.96
Zobs 0.96 Z0.05/2 1.96
接受 H0,在α = 0.05 水平上,男女孩身高没显著差异 相关样本 已知相关系数 r
36
D
2 1
平上,是否存在相关?
39
解:虚无假设 H0:ρ = 0,两种能力不相关。 备择假设 H1:ρ ≠ 0,两种能力相关。 双尾检验,α = 0.05

第六章 相关关系(0-1)

第六章 相关关系(0-1)

第六讲相关关系

课时安排:6课时

教学课型:理论课,课堂同步练习

教学目的要求:理解相关分析的意义与条件;熟练掌握积差相关法的基本思想与分析方法;

熟练掌握等级相关、点二列相关、二列相关及φ相关的使用前提与分析方法;能应用各种相关解决实际问题。

教学重点与教学难点:重点——积差相关的意义与应用;难点——各种相关方法的选择应用

教学方法、手段、媒介:讲授、教材、板书、多媒体

教学过程与教学内容:

第一节相关与相关系数 (2)

第二节积差相关 (8)

第三节等级相关 (14)

第四节质与量的相关 (22)

第五节品质相关——φ相关 (25)

本章小结 (28)

学习目标:

1.理解相关分析的意义与条件

2.熟练掌握积差相关法的基本思想与分析方法(重点)

3.熟练掌握等级相关、点二列相关、二列相关及φ相关的使用前提与分析方法(难点)4.能应用各种相关解决实际问题

问题导入:

在学校、社会及家庭教育中,人们常常会遇到一些涉及事物关系的问题,譬如学生品德与家庭教育的关系,个体的智力水平高低与成绩的关系,学生身高与体重的关系,各科成绩之间的关系,人的兴趣爱好与学科成绩的关系,一般能力与特殊能力的关系,智力与创造力的关系,教育经费投入与教学效果的关系等等。对这些问题的解释需要借助相关分析的方法进行说明。

客观世界涉及事物关系的问题比比皆是。然而,我们在前几章所处理的数据均属单—变量范围的,即分析一种变量及其取值的分布情况与特征,属单变

量的分析。而涉及事物的关系的时候,至少要有两个变量,分析或研究两个或两个以上变量之间相互关系的量数称相关量数。

心理统计SPSS-第六章-相关性研究及其分析过程 PPT课件

心理统计SPSS-第六章-相关性研究及其分析过程 PPT课件
第一,因果关系(两个变量中一个为因、一个为果); 第二,存在公共因子或中介变量。 心理学的许多研究就是为了寻找这些因果关系,或者是寻找 公共因子。可见,相关研究是许多深入研究的初始阶段。
1
研究变量的相关关系,一般要在自然或实验室条件下对一 组被试进行观测,被观测的变量不是在操纵下发生变化,而是 自然发生变化。利用相关分析它们之间的变化关系:
第三步:在Model下拉框中选择信度分析类型“Alpha”;
第四步:点击Statistics打开对话框,选中以下几项:
(1)Correlation:计算项目间的两两相关系数; (2)Scale if item deleted:显示去掉该项目后量表总体的平均值、 方差,该项目与其他项目的相关性、Alpha系数的变化。
作品
评价者
1
2
3
4
5
6
7
8
9
10
1
3
2
2
3
4
4
3
2
4
3
2
6
7
7
6
7
5
7
7
6
6
3
5
5
5
7
6
6
4
4
5
4
4
1
1
1
2
2
2
2
1

第六章相关系数检验

第六章相关系数检验

第六章 相关系数检验

一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即)(i Y E =i X βα+或)(i E μ=0。这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。

现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。

6·1、建立相关系数检验方法的基本思路

实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。其基本思路是:建立一种方法(2R ),希望此方法在测定被解释变量Y 的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。下面简要介绍其方法的建立过程:

首先,我们有

Y 的总的变化可表示为 : Y Y y i i -=

回归直线能够解释的部分: Y Y y i

i -=ˆˆ 由此我们可以得到,回归直线没有(或不能)解释的部分为:i i i Y Y e ˆ-= 因而我们有

Y 的总的变差=∑∑∑++=+=)ˆ2ˆ()ˆ(2

2

22

i i i i i i i e e y y e y

y 其中,)(ˆ)ˆ(ˆ)ˆ)(ˆ(ˆ2

22∑∑∑∑∑∑∑-

=-=-=i

i

i i i i i i i i i i i i x

x y x y x x y x x y x e y βββββ

第六章 相关与回归分析(1)

第六章 相关与回归分析(1)

计学一、变量间的相互关系
Y=f (X) (ε为随机变量) (ε为随机变量) 为随机变量
35 30 25 20 15 10 5 0 0 10 20
TICS
函数关系
与Y之间呈确定的数量变化关系
相关关系 Y= f(X)+ε f(
取一定值时Y值不确定,但是按照某种规律在一定范围内变化 但是按照某种规律在一定范围内变化
25 20 15 10 5 0 0 2 4 6 8 10 12
11.2 11 10.8 10.6 10.4 10.2 10 0 2 4 6 8 10
、相关关系的类型
25 20
从变量相关关系变化的方向看
A
关——变量同方向变化 同增同减 (A) 关——变量反方向ቤተ መጻሕፍቲ ባይዱ化 一增一减 (B)
15 10 5 0 0 2 4 6 8
B
25 20 15 10 5 0 0 2 4 6 8
从变量相关的程度看
C
完全相关 (B) 不完全相关 (A) 不相关 (C)
35 30 25 20 15 10 5 0
、相关分析与回归分析
分析:是研究两个或两个以上随机变量之间线性依存关系的紧 分析: 程度。即随机变量之间线性相关及关联程度的强弱。 程度。即随机变量之间线性相关及关联程度的强弱。 通常用相关系数表示,多元相关时用复相关系数表示。 通常用相关系数表示,多元相关时用复相关系数表示。

第六章-相关与回归

第六章-相关与回归

( y2
y)2 n
28 4 9 5 25 4.3 5 3 8 69 .8 1 2
三、相关系数的显著性检验
由样本资料求出的相关系数r与其他统计量一样,也存在 着抽样误差,假若求得的r值不等于零,它是否是一个有 意义的数值,还需要进行显著性检验之后才能作出判断。 检验的目的就是要判明r所在的总体是否确有线性关系。
“回归”名称的由来
英国统计学家F·Galton(1822——1911 年)和他 的学生、现代统计学的奠基者之一 K·Pearson(1856——1936 年)在研究父母身高与其 子女身高的遗传问题时,观察了1078 对夫妇,以 每对夫妇中父亲的身高作为解释变量X,而取他们 的一个成年儿子的身高作为被解释变量Y(应变 量),将结果在平面直角坐标系上绘成散点图,发 现趋势近乎一条直线。计算出的回归直线方程为 :
Y ˆ 3 3 .7 3 0 .5 1 6 X
Galton数据散点图(英寸)
height of son
75
70
65
60
60
65
70
75
height of father
一、一元线性回归的数学模型及方程的建立
1:表示原因的变量X 称为自变量,是一个普通数学变量
(常变量)。
2:表示结果的变量Y 称为依变量或应变量,是一个随机
变量。

第六章相关与回归分析

第六章相关与回归分析

1. E(ε)=0,即误差项ε是一个期望值为0的随 机变量。
• 从平均意义上,总体线性回归方程 E ( y ) =
α+b x
2. ε的方差σ2 相同(对于所有的 x 值); 3. 误差项ε是一个服从正态分布的随机变量,
且相互独立,即ε~N(0,σ2)。
6 - 21

计 学
(总体)回归方程
1. 描述 y 的平均值或期望值如何依赖于 x 的方程 称为(总体的)回归方程;
6 - 27
统 计
回归估计标准差的作用

1. 反映实际观察值在回归直线周围的分散状况; 2. 说明了回归直线的拟合程度(衡量回归方程的
代表性,测定回归估计的精度);
回归估计标准差反映的是因变量各实际值与其 回归估计值之间的平均差异程度;
表明其估计值对各实际值的代表性的强弱,其 值越小,估计值(或回归方程)的代表性越强,用 回归方程估计或预测的结果越准确。
brSy Sx
或 rbSx Sy
6 - 26

计 学
三、回归估计标准误差 Se
(一)回归估计标准误差的概念
实际观察值与回归估计值离差平方的均方 根;
计算公式为(6.5)和(6.6):
n
n
n
n
yiyˆi2
yi2a yi b xiyi
Se i1 n2 i1

等级相关系数

等级相关系数

总体相关系数 ρS 的检验
H 0 : ρS 0; H1 : ρS 0.
H0为真时,
n2 t rs t ( n 2) 2 1 rs
给定显著性水平 α ; 拒绝域为:, t a ( n 2)) ( t a ( n 2), ) (
2 2
计算样本统计量的值 t S ;若落在拒绝域,则可以认 为两变量之间存在相关关系;否则,不存在。
大学 中学 小学 x 37 15 大学 118 130 32 中学 18 9 43 98 小学
ns 55842; nd 6833;
y
G 0.78; Z α 1.96.
2
Z S 14.05.
ຫໍສະໝຸດ Baidu
ns n1 ( n6 n7 n8 n10 n11 n12 ) n2 ( n7 n8 n11 n12 ) n3 ( n8 n12 ) n5 ( n10 n11 n12 ) n6 ( n11 n12 ) n7 n12 nd n4 ( n5 n6 n7 n9 n10 n11 ) n3 ( n5 n6 n9 n10 ) n2 ( n5 n9 ) n8 ( n9 n10 n11 ) n7 ( n9 n10 ) n6 n9
第六章 等级相关系数
从等级的角度研究变量之间的关联程度。 1、Spearmam 等级相关系数 rs 设样本为n对配对样本,即:x1 , y1 ),( x2 , y2 ),,( xn , yn ). ( 将变量x与y的观察值按一定次序(从高到低)排列,

计量经济第六章多重共线性

计量经济第六章多重共线性
的显著性检验可能失去意义
• P108【相关链接】 • P111【经典实例】
up
习题
up
第二节 多重共线性的检验
一、相关系数检验法 二、综合判断法 三、方差膨胀因子法
up
一、相关系数检验法
含义:相关系数检验法是利用解释变量之 间的线性相关程度去判断是否存在严重多 重共线性的一种简便方法。 判断规则:一般而言,如果每两个解释变 量的简单相关系数(零阶相关系数)比较高, 例如大于0.8,则可认为存在着较严重的多 重共线性。
up
二、综合判断法
R (或R )大,F值大;t 值小,说明模型存在多重共线性
2 2
这是因为:R 2和F 值大,表明总离差中95% (假定R 2 0.95) 是由回归解释的,各解释变量对Y的联合线性作用显著。 在此前提下,若各个t值很小,说明各解释变量之间存在共线 性,对Y的独立作用不能分辨,故t检验不显著。
P108【经典实例】 消费支出与 收入、家庭财富的例子 可支配收入与家庭财富之间有明 显的共线性关系,他们的相关系 数高达0.9990.
不存在多重共线性只说明解
释变量之间没有线性关系,而不
排除他们之间存在某种非线性 关系
up
Baidu Nhomakorabea
二、多重共线性的原因
•1、经济变量的共同变化趋势
许多变量在随时间的变化过程中往往 存在共同的变动趋势。例如在经济繁 荣时期,收入、消费、储蓄、投资、 就业都趋向于增长;在经济衰退时期, 都趋向于下降。

第六章序列相关性

第六章序列相关性
而且,在大样本情况下,参数估计量虽然具有一致性,但仍 然不具有渐近有效性。
第二节 序列相关性的来源与后果
(三)变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参 数方差正确估计基础之上的,这只有当随机误差 项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
第二节 序列相关性的来源与后果
e~t e~t 1 t
e~t 1e~t1 2e~t2 t ……
如果存在某一种函数形式,使得方程显著成 立,则说明原模型存在序列相关性。
回归检验法的优点是:(1)能够确定序列相关的形式, (2)适用于任何类型序列相关性问题的检验。
第三节 序列相关性的检验
三、杜宾-瓦森(Durbin-Watson)检验法

E
(

2
t
2 1

2t1 t
t2 )
第一节 序列相关性概念
Var(t ) 2Var(t ) Var( t )
Var(t ) Var( t ) / (1 2 )
Cov(t , t1) E(t t1) E[(t1 t )t1]
(4)回归含有截距项
第三节 序列相关性的检验
D.W. 统计量:
杜宾和瓦森针对原假设:H0: =0, 即不存在一阶
自回归,构如下造统计量:
n (e~t e~t1 ) 2

计量经济学 第六章 自相关性

计量经济学  第六章  自相关性

第六章自相关性

6.1 自相关性:

6.1.1. 非自相关假定

由第2章知回归模型的假定条件之一是,

Cov(u i, u j) = E(u i u j) = 0, (i, j∈T, i≠j), (6.1)

即误差项u t的取值在时间上是相互无关的。称误差项u t非自相关。如果

Cov (u i,u j ) ≠ 0, (i≠j)

则称误差项u t存在自相关。

自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主要是指回归模型中随机误差项u t与其滞后项的相关关系。自相关也是相关关系的一种。

6.1.2.一阶自相关

自相关按形式可分为两类。

(1)一阶自回归形式

当误差项u t只与其滞后一期值有关时,即

u t = f (u t - 1) + v t

称u t具有一阶自回归形式。

(2) 高阶自回归形式

当误差项u t的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即

u t = f (u t– 1, u t– 2 , …u t– p ) + v t

则称u t具有P阶自回归形式。

通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即

u t = α1 u t -1 + v t(6.2)

其中α1是自回归系数,v t 是随机误差项。v t 满足通常假设

E(v t) = 0, t = 1, 2 …,T,

Var(v t) = σv2, t = 1, 2 …,T,

Cov(v i , v j ) = 0, i ≠ j , i , j = 1, 2 …, T , Cov(u t -1, v t ) = 0, t = 1, 2 …, T ,

[数学]第六章回归分析

[数学]第六章回归分析

h
36
二、一元线性回归模型
(一) 回归模型(regression model)
y01x
称为一元线性回归模型.
1. 一元线性回归模型只含有一个自变量 x .
2. 误差项 为随机变量.
3. 一元线性回归模型描述因变量 y 与自变量 x 和误差项
的关系.
4. 0 和 1 称为模型的参数.
h
37
(二)一元线性回归模型的基本假定
完全相关
因变量完全随自变量变动而变动,存在着 严格的依存关系。即变量间的关系为函数 关系。
不完全相关
变量之间存在着不严格的依存关系,即因 变量的变动除了受自变量变动的影响外, 还受其他因素的影响。它是相关关系的主 要表现形式。
完全不相关
自变量与因变量彼此独立,互不影响,其 数量变化毫无联系。。
h
12
时,因变量Y的值随之而减少
(或增加),这样的相关关系就
是负相关,也叫异向相关。
h
9
180
线性正相关
170
身高
160
150
30
40
50
60
70
80
90
体重
h
10
100
线性负相关
80
60
40
非线性相关
20
0
200

第六章 相关与回归分析(2)

第六章  相关与回归分析(2)

ˆ ∑ ( y i − y i)
i i
2
= min
ˆ ∑( y − y ) = 0
第六章 回归分析
SQUARE) 二、 OLS (ORDINARY LEAST SQUARE)估计
根据最小二乘法的要求, 根据最小二乘法的要求,记
ˆ Q = ∑ ei = ∑ ( yi − yi ) = ∑ ( yi − a + bxi ) 2
第六章 回归分析 Square) 二、OLS (Ordinary Least Square)估计
回归参数的估计值为: 回归参数的估计值为:
b=
Λ
n∑ xi yi − ∑ xi ∑ yi
i =1
n
n
n
n∑ xi2 − (∑ xi )2
i =1 i =1
n
i =1 n
i =1
n
n i
ˆ a=
∑y
i =1
b=
Λ
n∑ xy − ∑ x ∑ y n∑ x − (∑ x)
2 2

12 × 600566 − 1167 × 4720 1698552 = =2.2767 2 746043 12 × 175661 − 1167
∑ y − b ∑ x = 4720 − 2.2767 × 1167 =171.9243 a=
二、 用OLS (Ordinary Least Square)估计出回归系数 的值 出回归系数a,b的值 )估计出回归系数 OLS最小二乘法的中心思想 是通过数学模型, 最小二乘法的中心思想, 1、 OLS最小二乘法的中心思想,是通过数学模型,配合一条较为理想的趋 势线。这条趋势线必须满足下列两点要求: 势线。这条趋势线必须满足下列两点要求: 原数列的观测值与模型估计值的离差平方和为最小; (1)原数列的观测值与模型估计值的离差平方和为最小; 原数列的观测值与模型估计值的离差总和为0 (2)原数列的观测值与模型估计值的离差总和为0。

心理统计学第六章

心理统计学第六章

第六章第六章相关量数

课时安排:6课时

教学课型:理论课,课堂同步练习

教学目的要求:理解相关分析的意义与条件;熟练掌握积差相关法的基本思想与分析方法;熟练掌握等级相关、点二列相关、二列相关及φ相关的使用前提与分析方法;能应用各种相关解决实际问题。

教学重点与教学难点:重点——积差相关的意义与应用;难点——各种相关方法的选择应用教学方法、手段、媒介:教科书、板书、多媒体

教学过程与教学内容

第一节相关与相关系数 (1)

第二节积差相关 (3)

第三节等级相关 (6)

第四节质与量的相关 (10)

第五节品质相关——φ相关 (13)

作业题 (13)

第一节第一节相关与相关系数

一、事物的关系与相关量数

事物关系分为三种:一是说明的是事物之间互相依存、互为因果的关系。二是函数关系。三是伴随关系,它既不同于因果关系和函数关系,又不排斥因果关系和函数关系,是事物之间的一种更为复杂关系,相关关系即属这种关系。三者的关系如图6-1所示。

二、相关的种类

(一)方向上——正相关、负相关和零相关

正相关指一列变量由大而小或由小而大变化时,另一列变量亦由大而小或由小而大的变

化,即两列变量是同方向变化的,属“同增共减”的关系。

负相关指一列变量由大而小或由小而大的变化,另一列变量却反由小而大或由大而小的变化,即两列变量的变化方向是相反的,属“此增彼减”的关系。

零相关又称无相关,是一列变量由大而小或由小而大变化时,另一列变量则或大或小的变化,即两列变量的变化看不出一定的趋势,甚至毫无关系。

(二)形状——直线相关和曲线相关

直线相关指两列变量中的一列变量在增加时,另一列变量随之而增加;或一列变量在增加,另一列变量却相应地减少,形成一种直线关系。两列变量的变化在坐标轴上绘制散点图时形成的是长轴或椭圆形图形。

第六章spss相关分析和回归分析

第六章spss相关分析和回归分析

第六章SPSS相关分析和回归分析

第六章

SPSS相关分析与回归分析

6.1相关分析和回归分析概述

客观事物之间的关系大致可归纳为两大类,即

,函数关系:指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。

,相关关系(统计关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。相关关系乂分为线性相关和非线性相关。

相关分析和回归分析都是分析客观事物之间相关关系的数量分析方法。

6. 2相关分析

相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱程度

和形式。6.2. 1散点图

它将数据以点的的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及他们的强弱程度和方向。

6.2.2相关系数

利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:

第一,计算样本相关系数r;

,+1之间,相关系数r的取值在-1

,R>0表示两变量存在正的线性相关关系;r〈0表示两变量存在负的线性相关关

,R,1表示两变量存在完全正相关;r, -1表示两变量存在完全负相关;r, 0表

示两变量不相关

,|r|>0.8表示两变量有较强的线性关系;r <0.3表示两变量之间的线性关系较

第二,对样本来自的两总体是否存在显著的线性关系进行推断。

对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要有

Pearson 简单

,相关系数、Spearman等级相关系数和Kendall相关系数等。

6. 2. 2. 1 Pearson简单相关系数(适用于两个变量都是数值型的数据)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 相关系数检验

一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即)(i Y E =i X βα+或)(i E μ=0。这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。

现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。

6·1、建立相关系数检验方法的基本思路

实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。其基本思路是:建立一种方法(2R ),希望此方法在测定被解释变量Y 的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。下面简要介绍其方法的建立过程:

首先,我们有

Y 的总的变化可表示为 : Y Y y i i -=

回归直线能够解释的部分: Y Y y i

i -=ˆˆ 由此我们可以得到,回归直线没有(或不能)解释的部分为:i i i Y Y e ˆ-= 因而我们有

Y 的总的变差=∑∑∑++=+=)ˆ2ˆ()ˆ(2

2

22

i i i i i i i e e y y e y

y 其中,)(ˆ)ˆ(ˆ)ˆ)(ˆ(ˆ2

22∑∑∑∑∑∑∑-

=-=-=i

i

i i i i i i i i i i i i x

x y x y x x y x x y x e y βββββ

=0

(注意:i i i i x X Y Y y X Y X Y ββαβαβαβαˆˆˆˆˆˆˆ,ˆˆ,ˆˆ=---=-=∴+=∴-= ,另外 i i i i i i i x y y y Y Y e βˆˆˆ-=-=-=)。 所以,我们最终有

Y 的总的变差==∑∑∑∑+=++=+=)ˆ()ˆ2ˆ()ˆ(2

2

2

2

22

i i i i i i i i i e y e e y y e y

y 亦即,

Y 的总的变差=回归直线能够解释的部分部分+回归直线不能够解释的部分

显然这个结论是十分重要的,在计量经济学中已有许多类似的结果。没有这样的结果,我们的方法就建立不起来,也没有什么意义了。我们也应进一步思考,为什么会有这样好的结果呢?这实际上正是线性方法或线性思想的特征或优势所在。

6·2、相关系数的计算和特征

根据建立相关系数的基本思路,我们用2R 表示相关系数,则有

2R =已由解释变量说明的部分÷Y

的总的变差

=∑∑∑∑∑∑-

=--=

222

2221)

()ˆ(ˆi

i

i

i i

i y

e Y Y Y Y y

y

由此可知:

当i i Y Y =ˆ时,2R 达到最大值,即2R =1; 当Y Y i =ˆ时,2R 达到最小值,即2R =0; 所以 102≤≤R 。

2R 还能够写成其它形式,如

i

i x y βˆˆ= ,代入 ∑∑

∑∑=

i

i i

i

y

x y

y 2

222ˆˆβ ,而∑∑=i

i

i x

y

x 2ˆβ

,再代入则有

∑∑∑∑∑∑∑∑∑

∑∑=

=

=

=

)

)(()()()(ˆˆ2

2

2222

2222222

i i i i i

i i i i i

i i

i x y y x y

x x y x y x y

y R β

还可以写成另一个形式

R=

∑∑∑)

)((22i

i

i

i x

y y x , 这时11≤≤-R ,R=-1时,称之为完全负相关,而

R=1时,称之为完全正相关。

除了相关系数外,还有其他相关系数,如偏相关系数和复相关系数,它们都是涉及到多元回归问题的。其中,所谓偏相关系数是指度量在其他所有变量保持不变的条件下,任意两个变量之间的相关程度的系数。而复相关系数是指多个变量的相关系数中,例如 Y ,k X X X ,,,21 ,对于其中的变量Y 的复相关系数是指除Y 以外的其它变量k X X X ,,,21 对Y 的相关程度的度量(具体内容这里略去)。

6·3、相关系数的应用

相关系数的意义主要是在概率意义上反映了解释变量与被解释变量之间的线性相关程度,亦即检验假设

)(i Y E =i X βα+ 或 )(i E μ=0

相关系数最大的不足是不能给出变量之间的因果关系,亦即不能揭示变量之间相互依赖的确切关系。正因为如此,相关系数高的原因是多种多样: (1) Y 和X 分别互为变化的原因; (2) Y 和X 同时互为变化的原因;

(3) 量Y 和X 的变化是由另一个变量W 引起的,而它们之间实际上并无直接

的因果关系; (4) 变量X 、Y 之间的相关可能纯粹是偶然的巧合,实际上并无任何因果关系。

因此,仅仅知道相关系数的结果是不够的,相关系数或相关分析不能给出X 和Y 之间是如何关联的。实际上,变量之间的因果关系的确定只能依赖于经济理论或主观的经济分析。

另外,在实际应用中,人们往往采用相关系数来判断变量之间的相关程度。值得指出地是,相关系数只是说明变量之间相关程度的充分条件,而不是必要条件。例如,相关系数高的确能说明变量之间的相关程度、或线性相关程度高;但如果相关系数低,则不能说明变量之间的相关程度底,而只能说变量之间的线性相关程度底,完全不能够排除变量之间存在重要的非线性相关关系。

一般来说,相关系数低,或回归模型吻合度不好的主要原因有: (1) 模型中各变量之间本来就不存在因果关系; (2) 模型中漏掉了其它重要的变量;

(3) 变量之间关系的数学形式不正确(或成非线性关系)。 在上述原因中,尤其以第三种原因最为重要和突出,其解决的主要方式是回归模型的建立应以经济理论模型为依据,或建立模型前重视理论模型的分析。

第六章

作业

1、简述建立相关系数方法的基本思路,并指出相关系数检验存在的问题。

相关文档
最新文档