第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
10
200 400 legal income, 1986, $100s
600
11
Plotting narr86 against ptime86 绘图:narr86关于pncv
15 0
0
5Biblioteka Baidu
10
5 10 mos. in prison during 1986
15
12
Adding Quadratic terms to significant Variables 加入重要变量的平方项
One way out: to add quadratic terms of any significant variables to a model and to perform a joint test of significance. 一种方法:向模型加入任何重要变量的二次项,进行一个联 合显著性检验。-加入二次项,对二次项系数联合显著性F检验通
Source | SS df MS Number of obs = 2725 -------------+-----------------------------F( 8, 2716) = 26.47 Model | 145.390104 8 18.173763 Prob > F = 0.0000 Residual | 1864.95705 2716 .686655763 R-squared = 0.0723 -------------+-----------------------------Adj R-squared = 0.0696 Total | 2010.34716 2724 .738012906 Root MSE = .82865 -----------------------------------------------------------------------------narr86 | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------pcnv | -.1332344 .0403502 -3.30 0.001 -.2123546 -.0541141 avgsen | -.0113177 .0122401 -0.92 0.355 -.0353185 .0126831 tottime | .0120224 .0094352 1.27 0.203 -.0064785 .0305233 ptime86 | -.0408417 .008812 -4.63 0.000 -.0581206 -.0235627 qemp86 | -.0505398 .0144397 -3.50 0.000 -.0788538 -.0222258 inc86 | -.0014887 .0003406 -4.37 0.000 -.0021566 -.0008207 black | .3265035 .0454156 7.19 0.000 .2374508 .4155561 hispan | .1939144 .0397113 4.88 0.000 .1160469 .2717818 _cons | .5686855 .0360461 15.78 0.000 .4980048 .6393661 ------------------------------------------------------------------------------
Functional Form misspecification 函数形式误设-讨论模型误设的结果-P289 Using Proxy variables for unobserved explanatory variables 对观测不到的变量使用代理变量-讨论用代理变量来减轻 有偏性 Properties of the OLS Under Measurement Error 有测量误差的OLS性质-推导和解释 Missing Data, Nonrandom Samples, and outliers 数据缺失、非随机样本和离群点-讨论额外的数据问题
P290:2个误设案例,一个是忽略了二次项,一个是忽略了交叉项。
也可能是没有用LOG形式;
回顾第三章 P85 假设3不成立的几种情况, 函数形式误设的后果P290EXP.9.1-阅读
4
Functional Form Misspecification 函数形式误设
A multiple regression model suffers from functional form misspecification when it does not properly account for the relationship between the dependent and the observed explanatory variables. 当一个多元回归模型不能正确地说明被解释 变量和观察到的解释变量之间的关系时, 此模型存在函数形式误设问题。
First, we regress the dependent variables on the independent variables, without any square terms. 首先,我们将被解释变量向解释变量回归,不包含任何平 方项。
8
reg narr86 pcnv avgsen tottime ptime86 qemp86 inc86 black hispan
Multiple Regression Analysis P289 多元回归分析之模型设定和数据问题
y = b0 + b1x1 + b2x2 + . . . bkxk + u Specification and Data Problems 模型设定和数据问题
1
Chapter Outline 本章大纲
2
Functional Form 函数形式
How do we know if we’ve gotten the right functional form for our model?
我们如何知道模型是否得到正确的函数形式 呢?
P289: 1. 异方差的出现可以看成是模型的错误设定,但不影响有偏性和一致性,还 可以通过WLS来减轻;
过时,显示的症状往往是误设,如误将对数模型为水平模型。另外 经济数据中,二次项可以解决大部分非线性问题-P290
6
Example: Modeling Crime 例子:对犯罪建模-P292
Dependent variable: 被解释变量:
解读: 1.为什么加入二次项,因为水平项 T检验很显著; 平变量系数变化很大;同时二次项 联合F显著;
5
Functional Form Misspecification 函数形式误设
Misspecifying the functional form of a model can have serious consequences. We may obtain biased or inconsistent estimators of the partial effects. 误设一个模型的函数形式可能产生严重的后果。我们得到的 局部效应的估计量可能有偏或不一致。
.1542372 .1561177 .0120539 .0092825 .0442582 .0038634 .0173612 .0008037 2.56e-06 .04483 .0394507 .0368353
3.58 -4.68 -1.41 1.29 6.49 -7.66 -0.81 -4.25 2.81 6.52 4.15 13.70
9
Plotting narr86 against pncv 绘图:narr86关于pncv
15 0
0
5
10
.2
.4 .6 proportion of prior conv ictions
.8
1
10
Plotting narr86 against inc86 绘图:narr86关于pncv
15 0
0
3.二次项加入,模型的解读变得困 难,可能有更深刻的实际意义
7
Example: Modeling Crime 例子:对犯罪建模
Explanatory variables 解释变量
Qemp86 # quarters employed, 1986 1986年被雇佣季度数 inc86 legal income, 1986, $100s 1986年合法收入,单位:百美元 black =1 if black 如果是黑人,black=1 hispan =1 if Hispanic 如果是西班牙裔,hispan=1
Narr86, # times arrested, 1986 (1986年被捕次数)
Explanatory Variables: 解释变量: 2.加入变量的二次项后,原先的水
pcnv proportion of prior convictions 以前被定罪比例 avgsen avg sentence length, mos. 平均判刑期限,单位:月 tottime time in prison since 18, mos. 18岁以来的服刑时间,单位:月 Ptime86 mos. in prison during 1986 1986年的服刑时间,单位:月
0.000 0.000 0.158 0.198 0.000 0.000 0.417 0.000 0.005 0.000 0.000 0.000
.2500892 -1.036333 -.0406574 -.0062474 .2006501 -.037183 -.0481366 -.0049912 2.17e-06 .2043916 .0862609 .4323784
2.
3. 4.
本章讨论u与xi的相关性,如果相关,称xi为外生变量,为什么?
当被忽略的自变量为其他变量的函数时,将产生函数形式误设这一问题。 何谓函数形式误设?
3
Functional Form (continued) 函数形式(续)
First, use economic theory to guide you 首先,用经济理论的指导 Think about the interpretation 考虑它的解释 Does it make more sense for x to affect y in percentage (use logs) or absolute terms? x影响y的更合理的方式是百分比的形式(用log形式),还是绝对量的 形式? Does it make more sense for the derivative of x1 to vary with x1 (quadratic) or with x2 (interactions) or to be fixed? x1的系数更合理的形式是随x1变化(二次形式),随x2变化(交互作 用),还是固定不变?
narr86 Coef. Std. Err. t P>|t| [95% Conf. Interval]
pcnv pcnvsq avgsen tottime ptime86 pt86sq qemp86 inc86 inc86sq black hispan _cons
.5525236 -.7302119 -.0170216 .011954 .2874334 -.0296076 -.0140941 -.0034152 7.19e-06 .292296 .1636175 .5046065
.8549579 -.4240903 .0066142 .0301554 .3742166 -.0220321 .0199485 -.0018392 .0000122 .3802004 .240974 .5768347
13
Drawbacks of adding square terms to detect functional form misspecification 取消加入平方项以检测函数形式误设