第9章 Multiple Regression Analysis 多元回归分析之模型设定和数据问题课
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
Functional Form 函数形式
• How do we know if we’ve gotten the right functional form for our model?
我们如何知道模型是否得到正确的函数形式呢?
P289:
1. 异方差的出现可以看成是模型的错误设定,但不影响有偏性和一致性,还 可以通过WLS来减轻;
• A multiple regression model suffers from functional form misspecification when it does not properly account for the relationship between the dependent and the observed explanatory variables.
误设一个模型的函数形式可能产生严重的后果。我们得到的局部效应的估计 量可能有偏或不一致。
• One way out: to add quadratic terms of any significant variables to a model and to perform a joint test of significance.
P290:2个误设案例,一个是忽略了二次项,一个是忽略了交叉项。
也可能是没有用LOG形式;
回顾第三章 P85 假设3不成立的几种情况,
第9章 Multiple Regression Analysis 多元回归分析之模型设
函数形式误设的后果P290EXP.9.1-阅读 定和数据问题
4
Functional Form Misspecification 函数形式误设
6
Example: Modeling Crime 例子:对犯罪建模-P292
• Dependent variable: 被解释变量: 解读:
• Narr86, # times arrested, 1986 • (1986年被捕次数)
1.为什么加入二次项,因为水平项 T检验很显著;
• Explanatory Variables: 解释变量: 2.加入变量的二次项后,原先的水
一种方法:向模型加入任何重要变量的二次项,进行一个联合显著性检验。-
加入二次项,对二次项系数联合显著性F检验通过时,显示的症状往往是误设,如误将对数 模型为水平模型。另外经济数据中,二次项可以解决大部分非线性问题-P290
第9章 Multiple Regression Analysis 多元回归分析之模型设 定和数据问题
• Properties of the OLS Under Measurement Error 有测量误差的OLS性质-推导和解释
• Missing Data, Nonrandom Samples, and outliers 数据缺失、非随机样本和离群点-讨论额外的数据问题
第9章 Multiple Regression Analysis 多元回归分析之模型设 定和数据问题
2. 本章讨论u与xi的相关性,如果相关,称xi为外生变量,为什么?
3. 当被忽略的自变量为其他变量的函数时,将产生函数形式误设这一问题。
4. 何谓函数形式误设?
第9章 Multiple Regression Analysis 多元回归分析之模型设 定和数据问题
3
Functional Form (continued) 函数形式(续)
• pcnv proportion of prior convictions 平变量系数变化很大;同时二次项
以前被定罪比例
联合F显著;
• avgsen avg sentence length, mos. 平均判刑期限,单位:月
1Biblioteka Baidu
Chapter Outline 本章大纲
• Functional Form misspecification 函数形式误设-讨论模型误设的结果-P289
• Using Proxy variables for unobserved explanatory variables 对观测不到的变量使用代理变量-讨论用代理变量来减轻有偏性
• First, use economic theory to guide you
首先,用经济理论的指导
• Think about the interpretation
考虑它的解释
• Does it make more sense for x to affect y in percentage (use logs) or absolute terms?
Multiple Regression Analysis P289 多元回归分析之模型设定和数据问题
y = b0 + b1x1 + b2x2 + . . . bkxk + u
Specification and Data Problems 模型设定和数据问题
第9章 Multiple Regression Analysis 多元回归分析之模型设 定和数据问题
x影响y的更合理的方式是百分比的形式(用log形式),还是绝对量的形式?
•
Does it make more sense for (interactions) or to be fixed?
the
derivative
of
x1
to
vary
with
x1
(quadratic)
or
with
x2
x1的系数更合理的形式是随x1变化(二次形式),随x2变化(交互作用),还是固定不变?
当一个多元回归模型不能正确地说明被解释变量 和观察到的解释变量之间的关系时,此模型存在 函数形式误设问题。
第9章 Multiple Regression Analysis 多元回归分析之模型设 定和数据问题
5
Functional Form Misspecification 函数形式误设
• Misspecifying the functional form of a model can have serious consequences. We may obtain biased or inconsistent estimators of the partial effects.