第二章 简单线性回归模型(西财教材)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章简单线性回归模型
第一节回归分析与回归方程
一、回归与相关
1、变量之间的关系
①函数关系:)
y=,其中y为应变量,x为自变量。
f
(x
②相关关系或统计关系(双向因果关系):当一个或若干个变量x变化时,y发生相应的变化(可能是不确定的),反之亦然。
③单向因果关系:)
x
y=,其中u为随机变量。单一线性函数要求
f
(u
,
变量具有单向因果关系。
2、函数关系与相关关系的互相转化
3、相关关系的类型
①简单相关;
②复相关或多重相关;
③线性相关;
④非线性相关;
⑤正相关;
⑥负相关;
⑦不相关。
上述相关类型可直观地用(EViews软件)画图形来判断。例如,美国个人可支配收入与个人消费支出之间的相关关系可由下列图形看出,它们为正相关关系。
1500
2000
2500
3000
3500
1500
20002500300035004000
PDI
P C E
其中,PDI 为(美)个人可支配收入,PCE 为个人消费支出。 PROFIT 对STOCK 的折线图为
050
100
150
200
250
50
100
150
STOCK
P R O F I T
其中,STOCK 为(美)公司股票利息,PROFIT 为公司税后利润。
以下是利润与股息分别对时间的序列图(或称趋势图)
050
100
150
200
250
70
72
74
76
78
80
82
84
86
88
90
2040
60
80
100
12014070
72747678808284868890
GDP 对M2的折线图为
020000
40000
6000080000
100000
50000
100000
150000
M2
G D P
其中M2为(中国)广义货币供应量,GDP 为国内生产总值。 LM2对LPP 的曲线图为
10.5
11.0
11.512.0
4.9
5.0 5.1 5.2
5.3
LPP
L M 2
其中,LPP 为(中国)季度物价指数,LM2为季度广义货币供应量,变量前L 表示对变量取了对数。
4、相关关系的度量(相关程度) ① 总体相关系数
ρ=
② 样本相关系数: ()()XY
X X Y Y r --+表达式)
③ 计算相关系数应注意的问题: ●XY YX r r =。
●这里只是说明线性相关。 ●XY r 是ρ的样本估计值。
●相关系数仅反映变量之间的线性相关程度,而不反映它们之间的(单向)因果关系,原因是相关关系反映的是变量之间的双向因果关系。 ④运用EViews 进行相关程度的度量 ●用图形直观地进行判断。 ● 用计算简单相关系数进行判断。 下列表格为PDI 与PCE 之间地简单相关系数,
5、回归的含义
① “回归”的古典解释。●Francis Galton (1886年)。●K Pearson (1903年)。
② 什么是回归分析。依据变量间观测的数据,建立二者变动的具体统计规律,即它们之间的函数形式。
③ 回归分析与相关分析的联系和区别
●联系是回归分析是建立在相关分析基础之上的;而相关分析的相关系数可以通过回归分析得到。
●区别是相关分析中的两个变量有可能都是随机的,而回归分析中两个变量,解释变量是非随机的,应变量是随机的;相关分析是通过计算相关系数来度量变量之间的相关程度,而回归分析是通过解释变量的固定值来计算应变量的平均值;相关分析是对称的,而回归分析是非对称的。
PDI PCE PDI 1 0.997020834
PCE
0.997020834
1
二、总体回归函数
1、一个实例
资料见教材第17页——第18页的表2.1和表2.2。
E(Y︱X i)
12i n
E(Y︱X i)对X的线性回归图
y
X1 X2 ……X n x
Y对X的散点图
2、总体回归函数的建立
当解释变量X 取定各种值时,Y 的条件均值会随着发生相应变动,即 (|)()i i E Y X f X = 如果这种变动的轨迹是一条直线,即 12()i i f X X ββ=+ 则
12(|)i i E Y X X ββ=+ 三、 随机扰动项 1、随机误差项的含义
设个别值Y i 与Y 的条件平均值(|)i E Y X 的差异为i u ,即
(|)i i i u Y E Y X =-
或
(|)i i i Y E Y X u =+ 从而
12i i i Y X u ββ=++
从上述Y i 的表示可以看出,它由两部分组成,一部分为确定性部分12i X ββ+,另一部分为非确定部分i u (即随机误差部分),当随机部分i u 为零时,Y 值就等于它的系统部分。如果确定性部分是影响Y 的主要部分,则随机部分就应相对小,从而用确定性部分(线性)表示Y 才可能成立。
2、产生随机扰动项的原因 ●变量的设定误差。
●模型的设定误差(单一方程模型和联立方程模型)。 ●数据的误差。 ●偶然因素引起的误差。 四、 样本回归函数
1、从总体中随机地抽取两组样本(见教材第21页)。事实上,在重复抽样