第六章 多变量回归分析模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011-6-15
中山大学南方学院经济系
33
Yi = β0 + β1X1 + β2 X2 + ε
ˆ Y = β 0 + β1 X 1 + β 2 X 2
ε = Y i − Yˆi
2011-6-15 中山大学南方学院经济系 34
我们先要对误差取平方和,再加总,然后再 使其平方和最小化。用数学表示就是: Minimize{∑ ε i2 } n 我们将总和设为g,那么
2011-6-15 中山大学南方学院经济系 30
收集样本应注意以下几点
1、在研究经费和时间的容许下,收集到尽 可能多的样本。 2、对于横截面数据,至少要30个样本,如 果少于30个样本,我们对统计结果的准确程 度就没有很大的把握。要保证服从标准的正 态分布。
2011-6-15
中山大学南方学院经济系
s x
2011-6-15
中山大学南方学院经济系
20
实际的模型应该设置为:
Q = β 0 + β1 log( Px ) + β 2Yz + β 3 Py + + β 4T + β 5 G + ε
s x
生产技术水平这个变量并不是一个可以直接观 察到的数据,它是一个综合指数,如是否安 装了新的生产线、是否采用了新的技术专利 等。
在这个公式中,参数A是一个相对固定 的因素,如技术水平,或者土地资源等。我 们可以收集到产量、资本、劳动力的数据, 再用上面的模型对数据作回归分析的处理, 估计出参数。这个公式反映资本的投入和劳 动力的投入对提高产量的正相关的影响。
2011-6-15
中山大学南方学院经济系
25
5、宏观经济问题
我们首先来看这个模型: GDP=C+I+G+EX-IM 这个方程是不是我们的回归方程?
2011-6-15 中山大学南方学院经济系 8
Exercise
=-66.105+0.65 X i R^2=0.94 se=(10.750) ( ) n=20 t=( ) (18.73) p=(0.00125) (0.000009) 以上是我们用一元回归得出的数据。置信度 为99.9%,回答以下问题:
中山大学南方学院经济系
10
根据X和Y的10组观察值得到如下数据。 ∑Yi =1110; ∑Xi =1680;
∑X Y
∑X
2 i
i i
=204200
=315400
∑Y
2 i
=133300
2011-6-15
中山大学南方学院经济系
11
根据最小二乘法,回答以下问题: 1、求出α、β的值。 2、写出回归方程。 3、如何求出α、β的t统计量。 4、计算出该回归方程的判定系数。
2011-6-15 中山大学南方学院经济系 37
解上面的方程就可以得到参数的值。 这些参数对应的标准差为:
SE β 1 =
ε i2 ( N − 3 ) ∑
n

n
2 ( X 1i − X 1 ) 2 (1 − r12 )
SE β 2 =
ε i2 ( N − 3 ) ∑
n

n
2 ( X 2 i − X 2 ) 2 (1 − r12 )
2
s
2011-6-15
∑e =
2 i
N −2
3
中山大学南方学院经济系
统计量
α的t统计量的计算公式为:________; β的t统计量的计算公式为:________; F统计量的计算公式:________; R^2的计算公式: ________。
2011-6-15
中山大学南方学院经济系
4
TSS表示________; RSS表示________; ESS表示________。
2011-6-15 中山大学南方学院经济系 21
政府法规这个变量也是如此,如这个变量只 有0和1这两个值。 在政府的新环保法规出台之前其变量可设为 0,新的环保法规出台之后其变量可设为1. 由此来测试新环保法规对生产供应的影响。
2011-6-15
中山大学南方学院经济系
22
4、道格拉斯生产曲线
企业生产中的资本的投入和劳动力的投入与 产出量是相关的。这个关系可表示如下:
d Qx = β 0 + β1 log(Px ) + β 2Yd + β 3 Pc + β 4 Ps + β 5Ts + β 6 EXP + ε
2011-6-15
中山大学南方学院经济系
19
3、供给曲线
如何建立供给曲线的模型: 作法同需求曲线: 当其他条件都不变的时候,供给与价格与正 相关关系。
Q = β 0 + β1 log( Px )
2011-6-15
中山大学南方学院经济系
7
假设检验的P值判断法 假设检验的 值判断法
当我们作假设检验的时候,我们能过判断 统计量(包括t统计量以及F统计量)的pvalue来进行假设检验。 如果P-value < α(给定的失误率水平) (给定的失误率水平) 则我们拒绝原假设; ,则我们拒绝原假设; 如果P-value >α(给定的失误率水平) 如果 (给定的失误率水平) 则我们接受原假设。 ,则我们接受原假设。
2011-6-15 中山大学南方学院经济系 29
第二节
样本数量的要求
通常的原则是样本数越多越好。自由度等于 样本数量减去回归分析模型中解释变量的个 数再减一(N-K—1)。 如果我们有20个样本,而我们的自变量有 10个,那么我们的自由度就只有9个。那么 对于回归分析来说,自由度太少。 自由度越大,误差就越显出其随机性,回归 分析的结果会越精确、越有统计意义。
Repeat
2011-6-15
中山大学南方学院经济系
1
Least squared
β =

n
( X i − X )( Y i − Y )

n
(X
i
− X )^ 2
=
∑ x y ∑ x
i n 2 i n
i
α = Y − β X
2011-6-15
中山大学南方学院经济系
2
模型的估计方差:
s =
2
ˆ − βX i )2 (Yi − α ˆ ∑ N −2
Yˆ i
Байду номын сангаас
2011-6-15
中山大学南方学院经济系
9
1、完成括号中所空缺的值。 2、方程回归的结果如何,请说明理由。 3、方程中的参数有没有通过检验,请说明 理由。 4、请问在对参数进行假设检验的时候,用 的是单侧检验还是双侧检验,为什么?如果 我们要检验X与Y是否存在正相关关系呢?
2011-6-15
2011-6-15 中山大学南方学院经济系 28
小结
总的来说,当我们在设计回归分析模型的时 候,既要考虑必要性,又要考虑可能性。 必要性,就是该自变量在影响因变量上面的 重要程度。 可能性,就是指是否可以取到样本。 当然,某一自变量从理论上看来非常必要的 因素,但在实际研究的过程中很难取到样本 ,那么我们就要想办法找到一个能够替代该 变量的可取变量。
∂g ∂ = (∑ (Yi − β 0 − β1 X 1i − β 2 X 2i ) 2 ) = 0 ∂β 0 ∂β 0 n ∂g ∂ (∑ (Yi − β 0 − β 1 X 1i − β 2 X 2i ) 2 ) = 0 = ∂β1 ∂β1 n ∂g ∂ 2 = (∑ (Yi − β 0 − β1 X 1i − β 2 X 2i ) ) = 0 ∂β 2 ∂β 2 n
31
3、对于时间序列数据来说,时间(如年度 数据)最少要12年的数据。这样做得出来的 参数估计值就比较可靠了,在作假设检验时 ,我们有足够的信心确认所得出的结论。 4、样本的数量一定要多于模型中的变量数 。
2011-6-15
中山大学南方学院经济系
32
第三节
三变量最小二乘法
多元模型中要估计的是一个平面或超平面。 选取最好“平面”的准则: 拟合值尽可能逼近真值 最小二乘准则:点到拟合平面(通常称为拟 合直线)的距离平方和最小。
g = ∑ ε i2 = ∑ (Yi − β 0 − β1 X 1i − β 2 X 2i ) 2
n n
2011-6-15
中山大学南方学院经济系
35
对线性方程求极小值必须要满足的条件: 一是令其一阶导数等于零; 二是确认其二阶导数大于零。
2011-6-15
中山大学南方学院经济系
36
一阶导数等于零
2011-6-15 中山大学南方学院经济系 17
2、需求曲线
假设我们想要估计一个需求曲线。根据经济 学原理,在其他因素固定不变的情况下,需 求曲线表示价格与需求量之间的负相关关系 。
Q xd = β 0 + β1 log( Px )
2011-6-15
中山大学南方学院经济系
18
但是在现实生活中,需求曲线也会受到其他 因素的影响,如:个人收入、互补产品物价 、替代产品物价、消费偏好、市场状况预测 等等。 那么我们的需求曲线的模型就变为:
2011-6-15 中山大学南方学院经济系 27
6、菲利浦斯曲线
这个曲线指在短期内物价指数与失业率之间 的负相关的关系。 log( Pt ) = β 0 + β1 log( Pt −1 ) + β 2U r + β 3U n + ε 在短期内总供给曲线一般来说是会保持不变 的,在这种情况下,当总需求曲线变化时, 物价指数与失业率之间呈负相关的关系。在 长期中,当总供给曲线变化时,情况就不同 了。
2011-6-15
中山大学南方学院经济系
26
我们可以通过以下模型来估计:
GDPt = β 0 + β1GDPt −1 + β 2 G g + β 3 I f + + β 4WTOt + β 5 Pt + ε t
国内生产总值受到政府政策、外国的直接投 资、加入世界贸易组织、物价水平以及上一 年的国内生产总值的影响。 对于这个模型,我们可以根据我们的经济理 论以及可以收集到的数据来对自变量进行适 当的调整。
2011-6-15
中山大学南方学院经济系
5
Y 在计量经济学的回归模型中, i 表示 ________; Yˆi 表示________;
表示________。 表示________,可以通过________计算 公式得到。
Y e
2011-6-15
中山大学南方学院经济系
6
假设检验
α的t统计量对应的原假设为:________; β的t统计量对应的原假设为:________; F统计量对应的原假设为:________。
2011-6-15
中山大学南方学院经济系
38
这里 r12 是自变量X1与X2的相关系数,可以 用下的公式计算出 r12 :
r12 =
∑(X
n
1i
− X 1 )( X 2i − X 2 )
2
∑(X
n
1i
− X1)
∑(X
n
2i
− X2)
2
2011-6-15
中山大学南方学院经济系
39
然后我们可得到检验“回归模型参数估计值 是否等于零”的统计量t、F。 原则上,F检验不能测定截距是否等于零。 当然,在多变量回归模型中,截距不是一个 重要的参数。我们可能用t来测定这个参数 是否等于零。 从上面的推导可以看出,用最小二乘法估计 两个变量的模型与估计三个变量方式,以及 估计更多个变量的模型是一到的。
Q = AK L ε
α
β
2011-6-15
中山大学南方学院经济系
23
log(Q) = log( A) + α log( K ) + β log( L) + log(ε )
或者:
log(Q) = γ + α log( K ) + β log( L) + e
2011-6-15
中山大学南方学院经济系
24
1、工资水平
我们考虑来分析工资水平这个因变量。 影响工资水平的因素有很多个:性别、学历 、工作经验、专业、职务高低、工作态度、 地区工资差额、工种补贴、工作时间长短、 工作单位分类等等。 要想解决实际问题,我们就必须从这些因素 中选出那种对工资水平的影响有实际意义的 因素作为自变量来进行分析。
2011-6-15 中山大学南方学院经济系 15
我们,可以选择一些最重要的因素,而且比 较容易收集特别是在社会上人们更加关注这 些变量。 我们的模型可以是这样的:
log( ) = β0 +β1Sex β2Edu β3Epr β4Maj β5Pos ε Wage + + + + +
2011-6-15
中山大学南方学院经济系
16
这里,wage=工资水平 Sex =性别 Edu =学历 Epr =工作经验 Maj =专业种类 pos =职务高低 这里我们通过最小二乘法要估计的参数值。 我们对“工资水平”这个变量取对数,为的 是在预测时确保得到正值。
2011-6-15
中山大学南方学院经济系
12
多变量回归分析模型
2011-6-15
中山大学南方学院经济系
13
第一节
变量的选择
在我们的实际回归模型中 ,为了解释一个因量,我们可 能需要选择多个自变量。这就 要根据经济学的理论知识还选 择合适的自变量的个数。
2011-6-15 中山大学南方学院经济系 14
相关文档
最新文档