第2章 双变量回归模型(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、最小二乘估计量的性质
三、利用EXCEL和Eviews回归步骤
四、实例
单方程计量经济学模型分为两大类
线性模型中,变量之间的关系呈线性关系
非线性模型中,变量之间的关系呈非线性关系
直线上各点斜率相同
2 需 1.5 求 1 量 0.5 0 0 0.5 1 价格 1.5 2
15 需 10 求 量 5 0 0 0.5 价格 1
ˆ Yi 380.4791.6418X i
说明:男生的数学分数每增加1 分,平均而言,其词汇将增加1.64 分,-380.479没有什么实际意义。
Coefficients 准误差 t Stat P-value Lower 95%Upper 95% 标 下限 95.0% 限 95.0% 上 Intercept -380.479 63.32969 -6.00791 4.78E-06 -511.817 -249.141 -511.817 -249.141 男生 1.641791 0.126648 12.96341 8.9E-12 1.379139 1.904443 1.379139 1.904443
可支配收入与消费支出的样本图
消费支出Y 3000 2500 2000 1500 1000 500 0 0
ˆ Yi 103.172 0.777 X i
b2
x y x
i 2 i
i
5769300 0.777 7425000
可支配收入X 1000 2000 3000 4000
b1 Y b2 X 1567 0.777 2150 103.172
上式表明:残差是Y的真实值与估计值之差。
步骤
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要求样本回 可支配收入与消费支出的样本图 归函数尽可能好地拟合这组值.
消费支出Y 3000
ˆ Yi b1 b2 X i
2000 1000 0 0 1000 2000 3000 可支配收入X 4000
1、用OLS法得出的样本回归线经过样本均值点,即
Y b1 b2 X
2、残差的均值总为0,即
e e
n
i
0
3、对残差与பைடு நூலகம்释变量的积求和,其值为0,即
e X
i
i
0
三、用EXCEL和Eviews实现最小二乘法
以“美国高年级学生平均智能测试结果”建立词汇分数 与数学分数的关系,用数学分数(X) 来预测词汇分数(Y) 。
1、用“EXCEL实现最小二乘法”步骤
①调出EXCEL中“美国高年级学生平均智能测试”工作表
②利用菜单中“工具→数据分析→回归” 出现如下对话框
③把 “男生词汇成绩送入Y值输入区域”,把 “男生数学成绩 送入X值输入区域”,点中“输出区域”,选择一空白格,选择 线性拟合图选项,出现如下对话框。
男生数学分数(X) 与词汇分数(Y)的回归方程为:
( X i X )(Yi Y ) X iYi nXY b2 ( X i X )2 X i2 nX 2 得b1 , b2的求解公式为: b1 Y b2 X
变形公式
在计量经济学中,往往以小写字母表示对均值的离差。 记
1 2 x (X i X ) X n X i
3500 每 月 消 费 支 出 (元) 3000 2500 2000 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入(元) 每月家庭消费支出Y 条件均值Y* 样本1 预测 样本 样本2 预测 样本2
问题:如何检验?
二、普通最小二乘估计量的一些重要性质
2 n i 1 i 1 2 i
2
问题转化为:在给定的样本观测值下,b1=?,b2=? 时,Q最小?
推导:
Q b 2 (Yi b1 b2 X i ) (1) 0 1 Q 2 (Y b b X ) ( X ) 0 i 1 2 i i b2
估计
样本回归模型 总体回归模型
ˆ Yi b1 b2 X i
Yi E(Y | X i ) ui B1 B2 X i ui
消费Y
▼这就要求:
散点图
3500 3000 2500 2000 1500
设计一”方法”构
造SRF,以使SRF尽可 能”接近”PRF。
SRF
每月家庭消费支出Y
-973 1314090 1822500 947508 -929 975870 1102500 863784 -445 334050 562500 198381 -412 185580 202500 170074 -159 23910 22500 25408 28 4140 22500 762 402 180720 202500 161283 511 382950 562500 260712 1018 1068480 1102500 1035510 963 1299510 1822500 926599 5769300 7425000 4590020
一、参数的普通最小二乘估计(OLS)
建立双变量总体回归模型PRF
P105
Yi B1 B2 X i ui
用下面的样本回归模型SRF来估计它。
Yi b1 b2 X i ei
估计PRF的要求是:
残差
求B1,B2的估计量b1,b2,使得残差ei尽可能小。
ˆ ei 实际的Yi 估计的Yi ˆ Yi Yi Yi b1 b2 X i
条件均值Y*
样本
E(Y | X i ) B1 B2 X i
或都说使bi (i=0,1)
尽可能接近Bi (i=0,1)。
1000 500 0 0 500 1000 1500 2000 2500 3000
PRF
收入X 3500 4000
§2.2 一元线性回归模型的参数估计
一、参数的普通最小二乘估计(OLS)
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
小结:
计量经济学模型有两种类型:一是总体回归模型,另一是 样本回归模型。两类回归模型都具有确定的形式与随机形式两 种: 总体回归模型的确定形式——总体回归函数
EY X B1 B2 X
总体回归模型的随机形式——总体回归模型
很难知道
Y B1 B2 X
样本回归模型的确定形式——样本回归函数
引例分析:利用公式计算回归参数
在上述家庭可支配收入-消费支出例中,对于所抽出的一 组样本数,参数估计的计算可通过下面的表2.2.1进行。
表 2.2.1 参数估计的计算表
xi yi b2 xi2 b1 Y b2 X
Xi
Yi
xi
yi
xi y i
xi2
y i2
X i2
曲线上各点斜率不同
(1)解释变量线性:
(2)参数线性:
EY B1 B X i
2 2
1 E Y B1 B2 Xi
EY B1 B2 X
2 i
非线性
非线性
双变量线性回归模型的特征
只有一个解释变量
Yi B1 B2 X i ui
i=1,2,…,n
Yi为被解释变量,Xi为解释变量,B1与B2为待估参数,ui为 随机干扰项 估计方法有多种,其中最广泛使用的是普通最小二乘法 (ordinary least squares, OLS)。 为保证参数估计量具有良好的性质,通常对模型提出若干 基本假设。(即普通最小二乘法是有条件的,在下一章讲解)
④单击确定,出现如下结果:
SUMMARY OUTPUT 回归统计 Multiple R0.940341 R Square 0.884241 Adjusted R0.878979 Square 标准误差 4.146637 观测值 24 方差分析 df 回归分析 残差 总计 SS MS 1 2889.552 2889.552 22 378.2811 17.1946 23 3267.833 F Significance F 168.05 8.9E-12
Yi 2
1 800 594 -1350 2 1100 638 -1050 3 1400 1122 -750 4 1700 1155 -450 5 2000 1408 -150 6 2300 1595 150 7 2600 1969 450 8 2900 2078 750 9 3200 2585 1050 10 3500 2530 1350 求和 21500 15674 平均 2150 1567
选择的直线处于样本数据的中心位置最合理。怎样用数学 语言描述“处于样本数据的中心位置”? 普通最小二乘法(Ordinary least squares, OLS)给出的判 断标准是: 选择参数b1,b2,使得残差平方和最小。
ˆ Q Yi Yi
i 1 n
Y b b X
2 i 2 2 i
xi yi ( X i X )(Yi Y ) X iYi
xi yi b2 xi2 则 上述参数估计量可以写成: b1 Y b2 X
1 X i Yi n
称为OLS估计量的离差形式(deviation form)。 由于参数的估计结果是通过最小二乘法得到的,故称为普 通最小二乘估计量(ordinary least squares estimators,OLS)。
年份 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 男生 463 464 459 459 454 454 446 447 437 433 431 433 431 428 430 431 430 433 437 437 435 435 434 429 词汇 女生 468 466 466 461 457 452 443 442 431 430 427 425 423 420 418 421 420 420 425 426 425 422 421 419 总计 466 465 463 460 456 453 445 445 434 432 429 429 427 424 424 426 425 427 431 432 430 429 428 424 男生 514 512 513 509 507 505 502 501 495 497 497 494 493 491 492 493 493 495 499 501 500 498 500 499 数学 女生 467 470 470 465 466 461 460 459 449 446 445 444 443 443 443 443 445 449 452 451 453 453 454 455 总计 491 491 492 487 487 483 481 480 472 472 471 469 468 467 468 468 469 472 476 476 477 476 477 477
ˆ Y b1 b 2 X
样本回归模型的随机形式——样本回归模型
Y b1 b2 X e
Y表示“真实 其中带“^”者表示“估计值”。 值”。
用来估计总体 回归模型
表示“误差”。
▼回归分析的主要任务:
根据样本回归函数SRF,估计总体回归函数PRF。
ˆ 即,根据 Yi Yi ei b1 b2 X i ei
因此,由该样本估计的回归方程为:
ˆ Yi 103.172 0.777X i
即可支配收入每上升一个百分点,则消费支出上升0.777个百 分点;截距-103.172表明没有收入是负支出,这里没有经济意义。 另一样本结果
ˆ Yi 99.978 0.757 X i
综合图示
不同可支配收入水平组家庭消费支出的条件分布图
三、利用EXCEL和Eviews回归步骤
四、实例
单方程计量经济学模型分为两大类
线性模型中,变量之间的关系呈线性关系
非线性模型中,变量之间的关系呈非线性关系
直线上各点斜率相同
2 需 1.5 求 1 量 0.5 0 0 0.5 1 价格 1.5 2
15 需 10 求 量 5 0 0 0.5 价格 1
ˆ Yi 380.4791.6418X i
说明:男生的数学分数每增加1 分,平均而言,其词汇将增加1.64 分,-380.479没有什么实际意义。
Coefficients 准误差 t Stat P-value Lower 95%Upper 95% 标 下限 95.0% 限 95.0% 上 Intercept -380.479 63.32969 -6.00791 4.78E-06 -511.817 -249.141 -511.817 -249.141 男生 1.641791 0.126648 12.96341 8.9E-12 1.379139 1.904443 1.379139 1.904443
可支配收入与消费支出的样本图
消费支出Y 3000 2500 2000 1500 1000 500 0 0
ˆ Yi 103.172 0.777 X i
b2
x y x
i 2 i
i
5769300 0.777 7425000
可支配收入X 1000 2000 3000 4000
b1 Y b2 X 1567 0.777 2150 103.172
上式表明:残差是Y的真实值与估计值之差。
步骤
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要求样本回 可支配收入与消费支出的样本图 归函数尽可能好地拟合这组值.
消费支出Y 3000
ˆ Yi b1 b2 X i
2000 1000 0 0 1000 2000 3000 可支配收入X 4000
1、用OLS法得出的样本回归线经过样本均值点,即
Y b1 b2 X
2、残差的均值总为0,即
e e
n
i
0
3、对残差与பைடு நூலகம்释变量的积求和,其值为0,即
e X
i
i
0
三、用EXCEL和Eviews实现最小二乘法
以“美国高年级学生平均智能测试结果”建立词汇分数 与数学分数的关系,用数学分数(X) 来预测词汇分数(Y) 。
1、用“EXCEL实现最小二乘法”步骤
①调出EXCEL中“美国高年级学生平均智能测试”工作表
②利用菜单中“工具→数据分析→回归” 出现如下对话框
③把 “男生词汇成绩送入Y值输入区域”,把 “男生数学成绩 送入X值输入区域”,点中“输出区域”,选择一空白格,选择 线性拟合图选项,出现如下对话框。
男生数学分数(X) 与词汇分数(Y)的回归方程为:
( X i X )(Yi Y ) X iYi nXY b2 ( X i X )2 X i2 nX 2 得b1 , b2的求解公式为: b1 Y b2 X
变形公式
在计量经济学中,往往以小写字母表示对均值的离差。 记
1 2 x (X i X ) X n X i
3500 每 月 消 费 支 出 (元) 3000 2500 2000 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入(元) 每月家庭消费支出Y 条件均值Y* 样本1 预测 样本 样本2 预测 样本2
问题:如何检验?
二、普通最小二乘估计量的一些重要性质
2 n i 1 i 1 2 i
2
问题转化为:在给定的样本观测值下,b1=?,b2=? 时,Q最小?
推导:
Q b 2 (Yi b1 b2 X i ) (1) 0 1 Q 2 (Y b b X ) ( X ) 0 i 1 2 i i b2
估计
样本回归模型 总体回归模型
ˆ Yi b1 b2 X i
Yi E(Y | X i ) ui B1 B2 X i ui
消费Y
▼这就要求:
散点图
3500 3000 2500 2000 1500
设计一”方法”构
造SRF,以使SRF尽可 能”接近”PRF。
SRF
每月家庭消费支出Y
-973 1314090 1822500 947508 -929 975870 1102500 863784 -445 334050 562500 198381 -412 185580 202500 170074 -159 23910 22500 25408 28 4140 22500 762 402 180720 202500 161283 511 382950 562500 260712 1018 1068480 1102500 1035510 963 1299510 1822500 926599 5769300 7425000 4590020
一、参数的普通最小二乘估计(OLS)
建立双变量总体回归模型PRF
P105
Yi B1 B2 X i ui
用下面的样本回归模型SRF来估计它。
Yi b1 b2 X i ei
估计PRF的要求是:
残差
求B1,B2的估计量b1,b2,使得残差ei尽可能小。
ˆ ei 实际的Yi 估计的Yi ˆ Yi Yi Yi b1 b2 X i
条件均值Y*
样本
E(Y | X i ) B1 B2 X i
或都说使bi (i=0,1)
尽可能接近Bi (i=0,1)。
1000 500 0 0 500 1000 1500 2000 2500 3000
PRF
收入X 3500 4000
§2.2 一元线性回归模型的参数估计
一、参数的普通最小二乘估计(OLS)
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
小结:
计量经济学模型有两种类型:一是总体回归模型,另一是 样本回归模型。两类回归模型都具有确定的形式与随机形式两 种: 总体回归模型的确定形式——总体回归函数
EY X B1 B2 X
总体回归模型的随机形式——总体回归模型
很难知道
Y B1 B2 X
样本回归模型的确定形式——样本回归函数
引例分析:利用公式计算回归参数
在上述家庭可支配收入-消费支出例中,对于所抽出的一 组样本数,参数估计的计算可通过下面的表2.2.1进行。
表 2.2.1 参数估计的计算表
xi yi b2 xi2 b1 Y b2 X
Xi
Yi
xi
yi
xi y i
xi2
y i2
X i2
曲线上各点斜率不同
(1)解释变量线性:
(2)参数线性:
EY B1 B X i
2 2
1 E Y B1 B2 Xi
EY B1 B2 X
2 i
非线性
非线性
双变量线性回归模型的特征
只有一个解释变量
Yi B1 B2 X i ui
i=1,2,…,n
Yi为被解释变量,Xi为解释变量,B1与B2为待估参数,ui为 随机干扰项 估计方法有多种,其中最广泛使用的是普通最小二乘法 (ordinary least squares, OLS)。 为保证参数估计量具有良好的性质,通常对模型提出若干 基本假设。(即普通最小二乘法是有条件的,在下一章讲解)
④单击确定,出现如下结果:
SUMMARY OUTPUT 回归统计 Multiple R0.940341 R Square 0.884241 Adjusted R0.878979 Square 标准误差 4.146637 观测值 24 方差分析 df 回归分析 残差 总计 SS MS 1 2889.552 2889.552 22 378.2811 17.1946 23 3267.833 F Significance F 168.05 8.9E-12
Yi 2
1 800 594 -1350 2 1100 638 -1050 3 1400 1122 -750 4 1700 1155 -450 5 2000 1408 -150 6 2300 1595 150 7 2600 1969 450 8 2900 2078 750 9 3200 2585 1050 10 3500 2530 1350 求和 21500 15674 平均 2150 1567
选择的直线处于样本数据的中心位置最合理。怎样用数学 语言描述“处于样本数据的中心位置”? 普通最小二乘法(Ordinary least squares, OLS)给出的判 断标准是: 选择参数b1,b2,使得残差平方和最小。
ˆ Q Yi Yi
i 1 n
Y b b X
2 i 2 2 i
xi yi ( X i X )(Yi Y ) X iYi
xi yi b2 xi2 则 上述参数估计量可以写成: b1 Y b2 X
1 X i Yi n
称为OLS估计量的离差形式(deviation form)。 由于参数的估计结果是通过最小二乘法得到的,故称为普 通最小二乘估计量(ordinary least squares estimators,OLS)。
年份 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 男生 463 464 459 459 454 454 446 447 437 433 431 433 431 428 430 431 430 433 437 437 435 435 434 429 词汇 女生 468 466 466 461 457 452 443 442 431 430 427 425 423 420 418 421 420 420 425 426 425 422 421 419 总计 466 465 463 460 456 453 445 445 434 432 429 429 427 424 424 426 425 427 431 432 430 429 428 424 男生 514 512 513 509 507 505 502 501 495 497 497 494 493 491 492 493 493 495 499 501 500 498 500 499 数学 女生 467 470 470 465 466 461 460 459 449 446 445 444 443 443 443 443 445 449 452 451 453 453 454 455 总计 491 491 492 487 487 483 481 480 472 472 471 469 468 467 468 468 469 472 476 476 477 476 477 477
ˆ Y b1 b 2 X
样本回归模型的随机形式——样本回归模型
Y b1 b2 X e
Y表示“真实 其中带“^”者表示“估计值”。 值”。
用来估计总体 回归模型
表示“误差”。
▼回归分析的主要任务:
根据样本回归函数SRF,估计总体回归函数PRF。
ˆ 即,根据 Yi Yi ei b1 b2 X i ei
因此,由该样本估计的回归方程为:
ˆ Yi 103.172 0.777X i
即可支配收入每上升一个百分点,则消费支出上升0.777个百 分点;截距-103.172表明没有收入是负支出,这里没有经济意义。 另一样本结果
ˆ Yi 99.978 0.757 X i
综合图示
不同可支配收入水平组家庭消费支出的条件分布图