stata上机实验第八讲 似不相关回归(SUR)
最新7补充专题
Xianghong Shirley Wang
9
表面不相关回归的具体步骤
用OLS法分别估计每个方程,计算和保存 回归中得到的残差; 用这些残差来估计扰动项方差和不同回归 方程扰动项之间的协方差; 上一步估计的扰动项方差和协方差被用于 执行广义最小二乘法,得到各方程系数的 估计值。
Xianghong Shirley Wang
10
表面不相关回归得到的估计值是一致估计值
在下面两种情况下,表面不相关回归 与分别运行OLS回归结果相同:
若各方程的扰动项之间的协方差都等于0; 若各方程的自变量都相同,并且每个自变量的 每个观测值亦相同。
Xianghong Shirley Wang
11
Xianghong Shirley Wang
18
随机影响模型的形式
随机影响模型将所有数据放在一起回归,看上去
很像常规的OLS回归: Y i t 0 i 1 X 1 i t 2 X 2 i t . . . . . . k X k i t u i t
这里没有截距虚拟变量,这使得它的自由度要大 于固定影响模型。应注意的是,上式中截距项与 OLS回归中的截距项不同,这里代表的是截距的 均值,真实的截距随企业或其它横截面个体而变, 企业间截距的差异反映在扰动项中。
固定影响模型与随机影响模型
固定影响模型(fixed effects model,FEM)将横 截面个体之间的差异解释为截距不同,而斜率系 数相同。它处理地区、公司、人员或其它横截面 个体之间差异的思路是允许截距变动,不同的横 截面个体的截距是不同的,但每个产业的截距在 各个时期则保持不变。
stata相关性分析操作(推荐五篇)
stata相关性分析操作(推荐五篇)第一篇:stata相关性分析操作Stata用于进行典型相关分析的命令为canon。
canon(第1组变量)(第2组变量)[, 选择项]注意,两组变量要分别用括号括起来,以示区别。
这里选择项有:lc(#):noconstant level(#)/* 指定显示第几个典型相关系数的线性组合 /* 指定计算相关系数时变量值不减去均数 /* 指定组合系数的可信区间的可信度第二篇:stata学习体会stata学习心得(网络版存盘)2009-03-25调整变量格式:format x1 %10.3f ——将x1的列宽固定为10,小数点后取三位format x1 %10.3g ——将x1的列宽固定为10,有效数字取三位format x1 %10.3e ——将x1的列宽固定为10,采用科学计数法format x1 %10.3fc ——将x1的列宽固定为10,小数点后取三位,加入千分位分隔符 format x1 %10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符format x1 %-10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐合并数据:use “C:Documents and Settingsxks桌面2006.dta”, clear merge using “C:Documents and Settingsxks桌面1999.dta” ——将1999和2006的数据按照样本(observation)排列的自然顺序合并起来use “C:Documents and Settingsxks桌面2006.dta”, clear merge id using “C:Documents and Settingsxks桌面1999.dta” ,unique sort ——将1999和2006的数据按照唯一的(unique)变量id来合并,在合并时对id进行排序(sort)建议采用第一种方法。
Stata软件操作教程 (6)
2 多元回归模型的系数检验 拟合完多元回归模型后,我们可以对系数进行检验。当然,对
这里,括号中的冒号前为方程名,冒号后为被解释变量和解释变量。
2 似不相关回归的预测 拟合完似不相关回归模型之后,进行预测的基本命令为:
predict [type] newvar [if] [in] [, equation(eqno [, eqno]) statistic]
其中,predict是预测的基本命令语句,newvar代表生成的 新变量的名称,type代表新变量的类型,if代表条件语句, in代表范围语句,选项equation()指定要预测的方程, eqno代表方程号或方程名,statistic代表要预测的统计量。 表14.2给出了各statistic统计量方程的拟合值进行预测, 可输入命令:
predict pweight, equation(#1) predict pprice, equation(#2) 其中,第一步是对第一个方程的拟合值进行预测,并将其
命名为pweight;第二步是对第二个方程的拟合值进行预测, 并将其命名为pprice。 下面,我们看一下原序列值和预测值的描述统计量。输入 命令:
主要内容
似不相关回归 多元回归模型 联立方程模型
实验14-1:似不相关回归
实验基本原理
实验内容及数据来源 本书附带光盘data文件夹下的“usaauto.dta”工作文件,
给出了美国汽车产业的横截面数据。主要变量包括: price=汽车的价格,mpg=每加仑油所行驶的英里数, weight=汽车的重量,foreign=是否进口车(0代表是国产 车),length=汽车长度,displacement=内燃机气缸的工 作容积。 利用这些数据,我们拟合两个方程,分析汽车长度、产地 对其重量的影响,以及汽车每加仑油所能行驶的里程、产 地、内燃机气缸的工作容积对其价格的影响。考虑到两个 方程的扰动项可能相关,我们使用似不相关回归模型。
stata笔记
stata笔记1.⼀般检验假设系数为0,t⽐较⼤则拒绝假设,认为系数不为0.假设系数为0,P⽐较⼩则拒绝假设,认为系数不为0.假设⽅程不显著,F⽐较⼤则拒绝假设,认为⽅程显著。
2.⼩样本运⽤OLS进⾏估计的前提条件为:(1)线性假定。
即解释变量与被解释变量之间为线性关系。
这⼀前提可以通过将⾮线性转换为线性⽅程来解决。
(2)严格外⽣性。
即随机扰动项独⽴于所有解释变量:与解释变量之间所有时候都是正交关系,随机扰动项期望为0。
(⼯具变量法解决)(3)不存在严格的多重共线性。
⼀般在现实数据中不会出现,但是设置过多的虚拟变量时,可能会出现这种现象。
Stata可以⾃动剔除。
(4)扰动项为球型扰动项,即随即扰动项同⽅差,⽆⾃相关性。
3.⼤样本估计时,⼀般要求数据在30个以上就可以称为⼤样本了。
⼤样本的前提是(1)线性假定(2)渐进独⽴的平稳过程(3)前定解释变量,即解释变量与同期的扰动项正交。
(4)E(XiXit)为⾮退化矩阵。
(5)gt为鞅差分序列,且其协⽅差矩阵为⾮退化矩阵。
与⼩样本相⽐,其不需要严格的外⽣性和正太随机扰动项的要求。
4.命令稳健标准差回归:reg y x1 x2 x3, robust 回归系数与OLS⼀样,但标准差存在差异。
如果认为存在异⽅差,则使⽤稳健标准差。
使⽤稳健标准差可以对⼤样本进⾏检验。
只要样本容量⾜够⼤,在模型出现异⽅差的情况下,使⽤稳健标准差时参数估计、假设检验等均可正常进⾏,即可以很⼤程度上消除异⽅差带来的副作⽤对单个系数进⾏检验:test lnq=1线性检验:testnl _b[lnpl]=_b[lnq]^25.如果回归模型为⾮线性,不⽅便使⽤OLS,则可以采取最⼤似然估计法(MLE),或者⾮线性最⼩⼆乘法(NLS)6.违背经典假设,即存在异⽅差的情况。
截⾯数据通常会出现异⽅差。
因此检验异⽅差可以:(1)看残差图,但只是直观,可能并不准确。
rvfplot (residual-versus-fitted plot) 与拟合值的散点图rvpplot varname (residual-versus-predictor plot) 与解释变量的散点图扰动项的⽅差随观测值⽽变动,表⽰可能存在异⽅差。
stata 非参数回归
stata 非参数回归【原创版】目录1.介绍 Stata 软件2.非参数回归的概念和应用场景3.Stata 中进行非参数回归的方法和步骤4.实例演示如何使用 Stata 进行非参数回归5.总结非参数回归在 Stata 中的应用优势正文一、介绍 Stata 软件Stata 是一款广泛应用于统计分析、数据管理、绘图等领域的软件,尤其擅长于处理面板数据和复杂数据结构。
Stata 提供了丰富的统计方法和模型,为研究者提供了强大的数据分析工具。
二、非参数回归的概念和应用场景非参数回归是一种不依赖于特定概率分布的回归方法,它不要求对数据的分布形式作出任何假设。
非参数回归适用于数据分布形式未知或偏态分布的情况,以及样本量较小的情况。
非参数回归主要有局部加权回归(Lasso)、岭回归(Ridge)和 Enetrode 回归等方法。
三、Stata 中进行非参数回归的方法和步骤在 Stata 中,可以使用`regress`命令进行非参数回归。
以下是进行非参数回归的基本步骤:1.导入数据:使用`use`、`import`或`insheet`命令将数据文件导入Stata。
2.进行非参数回归:在 Stata 命令行中输入`regress`,后面跟上因变量和自变量,例如:`regress dep_var ind_var1 ind_var2...`。
3.添加非参数回归选项:在`regress`命令后可以添加各种非参数回归选项,如`lasso`、`ridge`、`enetrode`等。
例如:`regress dep_var ind_var1 ind_var2 lasso`。
4.查看回归结果:Stata 会输出回归结果,包括系数估计、标准误差、z 统计量、p 值等。
四、实例演示如何使用 Stata 进行非参数回归假设我们有一个数据集,包含一个因变量(销售额)和多个自变量(广告费用、地区、季节等),我们想要研究这些自变量对销售额的影响。
Stata软件之回归讲解精品PPT课件
40
30
20
10
0
0
5
10
15
20
years of education
Fitted values
hourly wage
三、简单回归分析的Stata软件操作实例
7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样
本。命令如下:
reg wage edu if age<=30 得到以下运行结果,保存该运行结果;
16 0 0 0
1.25
lnwage
1225 1.808352 .5307399 .2231435
第1列:变量名; 第2列:观测数; 第3列:均值; 第4列:标准差; 第5列:最小值; 第6列:最大值。
Max
60 19 50 2500 37.5
3.624341
三、简单回归分析的Stata软件操作实例
edu _cons
.3937442 .0488491 3.584695 .4589088
8.06 0.000 7.81 0.000
.2979069 2.684359
.4895815 4.485031
(2) 表左上方区域为方差分析表。第2列从上到下依次为回归平方和(SSE)、
残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1,
age in years 1:female; 0:male 1:married; 0:unmarried 1:primary; 2:junior; 3:senior;
4:college years of education years of work experience:
age-edu-6 exp^2 1:bad; 2:good; 3:very good 1:migrant worker; 0:local worker hourly wage
具有误差自回归的似乎不相关模型参数的贝叶斯估计
现如今,随着信息化、大数据时代的到来,数据容量大、内容多样、形式复杂、数据间关联性较密集,事物间相关联的研究越来越受到人们的重视,人们已不能用单一独立的视角解释社会、自然界存在的现象.经典的线性回归模型在很多领域已不能较为合理的解释生活中的方方面面.似乎不相关模型的出世打破了人们对误差模型满足高斯马尔科夫假设条件的认识,通过误差扰动项将看似没有关联的模型紧密地联系在一起.后来,学者们对似乎不相关模型的研究已深入到经济、环境、生态、卫生等领域,均说明了该模型具有很好的解释性及广泛的应用前景.针对面板数据的研究,模型的空间效应广受大众关注.若在同一个时间截面,主要研究关于空间地理位置的异质性和区域之间的关联性问题;在特定的地理位置上,观测值会以时间序列的形式Байду номын сангаас现.本文所设定的误差协方差矩阵是表示时间相关性的误差自回归模型,即研究不同时刻同一位置之间的某种相互关系.空间异质性的问题一般用地理加权回归模型来刻画.本文提出具有时间相关性的误差自回归似乎不相关模型与具有误差自回归地理加权似乎不相关回归模型.用该模型更好地刻画解释变量与被解释变量之间关系的动态过程及解决时空异质性、相关性问题.对似乎不相关模型参数的求解问题,国内外学者提供很多种方法:广义最小二乘估计方法、极大似然方法、广义矩方法、线性贝叶斯方法等.本文中,对具有误差自回归似乎不相关模型用线性Bayes估计方法对参数进行估计,并得到该方法的无偏性及有效性证明.在模拟中,用均方误差和绝对偏差均值作为检验指标得出线性Bayes方法较GLS方法的优良性.再根据贝叶斯统计推断及多元参数的有信息先验分布,推导出具有误差自回归地理加权似乎不相关模型参数的后验分布,模拟时结合Gibbs抽样方法得到该模型参数的估计值,并用残差平方和、均方误差和绝对偏差均值作为检验指标,与广义局部加权最小二乘估计方法进行优良性对比,从而说明该模型的良好解释性及估计方法的有效性.
互助问答第15期:似不相关回归模型(SUR)与联立方程相关的Stata操作
互助问答第15期:似不相关回归模型(SUR)与联立方程相关的Stata操作问题1:似不相关回归模型(SUR)与联立方程的主要区别是什么?答案1:SUR模型的方程右边不包含被解释变量,一般每个方程的解释变量相同;而联立方程右边包含被解释变量。
问题2:面板数据若用联立方程组估计,需要用xtdata处理,去除个体效应吗?内生性、截面相关、跨方程约束条件等检验是否都要做,具体涉及到哪些Stata命令?答案2:面板数据使用联立方程估计,有多种做法。
使用xtdata处理的问题是可能会导致标准误的估计错误,从而导致显著性水平更倾向于显著。
此外,对于联立方程模型,一个方程用工具变量法进行估计也是可以的,这样做一方面排除了其他方程的错误设定对于某一个单独方程的一致性的影响,另外一方面可以使用reghdfe等命令很好的处理固定效应,也可以很方便的进行聚类标准误,因而联立方程使用单方程估计是一个比较方便的做法。
当然如果需要做跨方程的假设检验,还是需要联立起来进行估计的。
联立方程模型中存在内生性的时候可以使用reg3命令,命令后面加ireg3选项的好处是迭代的计算协方差矩阵,可以达到理论上的最有效估计,当然这样做是有一定代价的。
具体可以参考Wooldridge的《横截面与面板数据的经济计量分析》相关章节。
补充:一般情况下,联立方程组都能用 2SLS 估计,所以可以考虑使用命令xtivreg。
xtivreg就是处理内生性,截面相关就是在命令后面用cluster。
问题3:若假定为SUR模型,但存在内生性时,能否用3SLS~ireg3命令估计?答案3:SUR的内生性来自遗漏变量和测量误差,不需要使用3SLS。
学术指导:张晓峒老师本期解答人:曹晖老师慧航中关村大街编辑:鹏飞统计小妹 Jensen统筹:芋头技术:知我者。
似不相关回归-PPT
对多方程系统进行联合估计的缺点是,如果某个方 程的误差较大,则系统估计会将这一方程的误差带 入其他方程中,进而污染(contaminate)整个方程 系统。故选择单一方程估计或系统估计,实际上是 在有效性与稳健性之间的权衡。
多方程系统主要分为两类。一类为联立方程组( simultaneous equations),即不同方程之间的变量存 在内在的联系,一个方程的解释变量是另一方程的 被解释变量。
的解释变量,故使用单一方程OLS估计VAR就够了
除了以上两种特殊情形外,通常来说,各方程的扰
动项之间的相关性越大,则GLS所能带来的效率改
进就越大;各方程的数据矩阵X1,X
,
2
,X n 之间
的相关性越小,则GLS所能带来的效率改进也越大
(如果各数据矩阵完全相同,则GLS还原为单一方程
OLS)
然而,在现实中一般是未知的,故首先需要估计
jj
为根据残差计算的扰动项i与
之
j
间的同期相关系数,
n i-1
而
ri2j 为同期相关系数矩阵
i=2 j=1
r11 r12
r21
r22
rn1 rn2
r1n
r2n
主对角线以下各项之平方和
rnn
(该矩阵为对称矩阵)
这两个方程的变量之间貌似没有联系,但由于同一 学生的不可观测因素同时对计量成绩与英语成绩造 成影响,故两个方程的扰动项应该是相关的。如果 将这两个方程同时进行联合估计,则可以提高估计 效率。
二、似不相关回归的假定
似不相关回归模型的假定如下:假设共有n个方程 (n个被解释变量),每个方程共有T个观测值,T>n
一方程OLS的结果完全相同,使用GLS并不会提高
似乎不相关回归模型及其在老年认知功能研究中的应用
3基金项目:山西省高校青年学术带头人基金[晋教科(2004)13]Δ通讯作者:王彤似乎不相关回归模型及其在老年认知功能研究中的应用3山西医科大学卫生统计学教研室(030001) 梁洪川 韩 宏 郎素平 王 彤Δ 【提 要】 目的 探讨似乎不相关回归模型在医学研究中的应用。
方法 利用似乎不相关回归模型对老年人认知功能减退的影响因素进行分析。
结果 特定的非独立结构情形下似乎不相关回归估计方法比传统最小二乘估计方法更合理,并可以提高参数估计的效率。
结论 似乎不相关回归模型在医学科研领域具有良好的应用前景。
【关键词】 似乎不相关回归 非独立数据 老年 认知功能 医学研究实践中常会遇到多个反应变量与多个影响因素同时建模的问题,例如某市不同城区空气污染状况及影响因素研究。
如果根据研究目的,需建立回归方程组反映不同城区空气污染状况与各自影响因素之间的关系,通常可用多元回归(multivariate regres 2sion )方法解决,但此法要求各方程协变量相同,然而现实中各方程协变量可能并不相同,此时多元回归已不适用。
传统的作法是对每个方程分别作最小二乘估计,但存在的问题是:不同城区空气污染状况除不同的人口密度、城市功能分区等因素外,还受相同的气象因素的影响。
因此,不同城区空气污染状况是相关的,对每个方程分别作最小二乘估计显然不合理。
似乎不相关回归(seemingly unrelated regressions ,SU R )由Zellner 于1962年〔1〕提出,合理地考虑了指标(如不同城区)间的相关关系。
该方法已在经济、工业、地质和社会科学等领域得到广泛应用,但国内未见其在医学领域的研究和应用的报道。
原理与方法(一)基本模型考虑m 个似乎不相关回归方程y i =x i βi +e i i =1,…,m(1)其中y i 为(n ×1)向量,对应于y i 的n 个观测值;x i 为(n ×k i )设计矩阵;βi 为(k i ×1)未知参数向量;e i =(e 1i ,e 2i…,e ni )′为(n ×1)随机误差向量;x i ≠x j ,i,j =1,…,m ,当x i =x j 时模型退化为多元回归方程。
如何检验分组回归后的组间系数差异?
如何检验分组回归后的组间系数差异?连玉君;廖俊平【摘要】实证研究中,若检验在不同情况下一个变量对另一变量的影响程度,则需要对样本进行分组检验,进而比较两个子样本的系数差异.然而,单独比较子样本系数的显著性水平可能会存在偏差.为解决这一问题,本文介绍三种较为常见的组间系数差异检验方法的原理及Stata实现.其中,“Chow检验”通过引入交乘项的方式进行检验,该方法假定控制变量的系数不随组别发生变化,适用条件最为严格;“似无相关模型检验”则允许控制变量系数存在差异,且子样本扰动项相关,适用条件较为宽松;“费舍尔组合检验”基于自体抽样思想,通过不断抽样模拟总体特征,适用范围最为广泛.【期刊名称】《郑州航空工业管理学院学报》【年(卷),期】2017(035)006【总页数】13页(P97-109)【关键词】组间系数差异;Chow检验;似无相关模型;费舍尔组合检验;企业金融【作者】连玉君;廖俊平【作者单位】中山大学岭南学院,广东广州510275;中山大学岭南学院,广东广州510275【正文语种】中文【中图分类】F275一、问题的提出实证分析中,经常需要对比分析两个子样本组的系数是否存在差异。
例如,在公司金融领域,研究薪酬激励是否有助于提升业绩时,模型设定为:ROEit=αi+Salaryit-1·β+Controlsit-1·γ+uit关注的重点是系数β。
文献中经常把样本组分成“国有企业(SOE)”和“民营企业(PRI)”两个样本组,继而比较βSOE和βPRI是否存在差异。
通常认为,民营企业的薪酬激励更有效果,即βSOE<βPRI。
如果两个样本组中的模型设定是相同的,则两组之间的系数大小是可以比较的,而且这种比较在多数实证分析中都是非常必要的。
参见Cleary(1999),以及连玉君等(2010)。
下面使用Stata软件自带的一份数据文件(nlsw88.dta),说明此类问题的关键所在。
隐变量模型+SEM结构方程模型
似不相关回归
该模型存在两个问题: (1)原来两个模型随机项的方差未必相等, 如果不等,新模型就可能出现异方差问题; (2)两个模型的误差项在同一时点或者同 一样本上有可能存在相关性。
SUR模型的思想来自于第2个问题
covuat ,ubt ab
似不相关回归
如果存在相关性,一方面是造成了自相 关问题,需要处理,另一方面也为模型 的估计提供了新的信息 通过广义最小二乘,可以实现SUR模型 的估计。 由于利用了看上去不相关方程的误差同 期相关性所提供的信息,一般SUR模型 会提供更好的估计结果。
二、结构方程模型的设定
2.路径用带箭头的线表示:
直的单方向箭头:表示因果关系,箭头所指为果; 双向箭头弧线:表示相关关系; 从自身到自身的双向箭头线:表示变量的方差。
二、结构方程模型的设定
3.在每一条路径上以小写的英文或希腊字 母表示待估计的结构系数或方差,以数字 表示事先确定的固定参数;
4.在图中,凡为因果路径所指者,为内生 变量,凡无如此箭头所指者为外生变量。
一、结构方程模型的形成
路径分析与一般线性模型不同的特色主要体 现在如下四个方面:
1、变量之间的关系必须先根据理论予以设定; 2、以路径图做为描述模型的重要工具; 3、将参数估计建立在变量的相关系数或协方差的基础上; 4、将简单相关系数分解为直接相关系数,间接相关系数。
一、结构方程模型的形成
证实性因子分析
在20世纪二三十年代,由 Wright(1921, 1934)提出,与古典的多元线性回归模型相比, 路径分析是一种更为灵活、有力的多元数据分 析工具。
一、结构方程模型的形成
路径分析与线性回归分析最根本的区别 在于:
STATA-回归估计常见问题及解决方法
STATA 回归估计常见问题及解决方法一、多重共线问题//多重共线性并不会改变OLS估计量BULE的性质,但会使得对系数的估计变得不准确。
//Stata检查是否存在多重共线的方法:estat vif//VIF值越大说明多重共线性问题越严重。
一般认为,最大的VIF不超过10,则不存在明显的多重共线性。
/*解决办法:1.如果只关心方程的预测能力,则在整个方程显著的条件下,可以不必关心具体的回归系数。
2.增加样本容量,剔除导致多重共线性的变量或者修改模型设定形式。
3.对于时间序列样本,通过使用差分模型可以一定程度上消除原模型中的多重共线性。
4.岭回归方法。
二、序列相关问题/*Stata检查是否存在序列相关的方法:1.画图在做完回归之后,先生成残差项escatter e L.e2.BG检验estat bgodfrey(默认滞后阶数为1)3.Ljung-Box Q检验eg: reg y x1 x2 x3predict e,reswntestq e3.DW检验estat dwatson解决办法:1.Newey稳健性标准差newey y x,lag(p) (滞后阶数必选)2.可行广义最小二乘法(FGLS)prais y xprais y x,corc三、异方差问题Stata检查是否存在异方差的方法:1.看残差图【模型回归之后使用即可】rvfplot(残差与拟合值的散点图)rvpplot(残差与解释变量的的散点图)2.怀特(White,1980)检验【模型回归之后使用即可】estat imtest,white(怀特检验)whitetst(外源程序,需下载)3.BP(Breusch and Pagan,1979)检验【模型回归之后使用即可】estat hettest(默认设置使用拟合值y_hat)estat hettest(使用方程邮编的解释变量,而不是y_hat)estat hettest varlist(指定使用某些解释变量)解决办法:1.WLS加权最小二乘法reg y x1 x2 x3 [aw=1/var]eg: reg y x1 x2 x3predict e1,resg e2=e1^2g lne2=log(e2)reg lne2 y,nocpredict lne2fg e2f=exp(lne2f)reg y x1 x2 x3 [aw=1/e2f]2.White(1980)eg: reg y x1 x2 x3,robust3. wls0命令。
stata上机实验第八讲 似不相关回归(SUR)(共12张PPT)
第五页,共12页。
联立方程(lián lì fānɡ chénɡ)组
三阶段(jiēduàn)最小二乘法 翻开数据文件klein.dta 建立如下方程:
C o n s u m p 1 0 1 1 w a g e p r iv 1 2 w a g e g o v t 1 w a g e p r iv 2 0 2 1 C o n s u m p 2 2 g o v t2 3 c a p ita l1 2
这种迭代估计方法必须设定初始值和停止法 那么。初始值的选择对于迅速找到最优解非 常重要。
第七页,共12页。
例1:利用NLS方法估计非线性消费函数〔数 据文件:usmacro〕
csinc u
nl (realcons = {a} + {b}*realgdp^{gamma=1}) 如果(rúguǒ)不给定gamma的初始条件将无法
例1: 使用高中生成绩数据集“hsb2.dta〞,估计一个SUR模
型。第一个方程的被解释变量为read〔阅读(yuèdú)成 绩〕,解释变量为write〔写作成绩〕,math〔数学成 绩〕,science〔科学成绩〕。第二个方程的被解释变 量为socst〔社会实践成绩〕,解释变量为write〔写作 成绩〕,math〔数学成绩〕。
到达收敛。
第八页,共12页。
例2:估计如下生产函数模型。〔数据文件: production〕,不变替代(tìdài)弹性〔CES〕 生产函数:
l n y 0 m /l nK ( 1 ) L u
nl ( lnout={b0}{m=1}/{rho=1}*ln( {delta=0.5}*capital^(-{rho}) +(1-{delta})*labor^(-{rho}) ) )
第23章似不相关回归
r11 r12 r r 21 22 rn1 rn 2
r1n r2 n rnn
主对角线以下各项之平方和(该矩阵为对称矩阵)。
15
10
程包含完全相同的解释变量,故使用单一方程 OLS 估计 VAR。 除了以上两种特殊情形外,各方程的扰动项之间的相关性越大, 则 GLS 所能带来的效率改进就越大; 各方程的数据矩阵 X1 , X 2 , , X n 之间的相关性越小,则 GLS 所能带来的效率改进也越大。
ˆ ,然后进行 FGLS 估计。 现实中,一般首先需要估计
协方差阵 中的第 (i, j ) 个矩阵 (i j ) 为
E( i j ) ij IT
综合以上结果可知
11 IT I 21 T n1 IT
12 IT 1n IT 22 IT 2 n IT
n 2 IT
首先,使用单一方程 OLS 的残差来一致地估计 ij 。
11
假设第 i 个方程的 OLS 残差向量为 ei ,则 ij 的一致估计量为
ˆ ij 1 1 T eie j t 1 eit e jt T T
ˆ12 ˆ11 ˆ 21 ˆ 22 ˆ 因此, ˆ ˆ n2 n1
ˆ1n ˆ 2n ˆ 代入方程可得 I 。将 T ˆ nn
ˆ ˆ 1 y ˆ 1 X ) 1 X ( X SUR ˆ 。 这就是“似不相关估计量”(Zellner,1962),记为 SUR
12
ˆ ˆ ,不断迭代直至系数估 使用 FGLS 后得到新的残差,可再计算 ˆ 收敛为止。 计值 SUR
第八讲 非线性回归PPT课件
400 x1 600
200
0
0
2.00e+11 4.00e+11 6.00e+11 8.00e+11 1.00e+12
y4
20
Y 0 1Xi 2 Xi2 3 Xi3 K rXir ui
选取好最高阶数后,按照下列步骤进行: (1)选定最大的r值并估计r阶多项式回归。 (2)利用t统计量检验Xr的系数ßr为零的假设。 如果拒绝原假设,则Xr应包含在回归中, 故使用r阶多项式。
7
如何决定是用线性还是非线性? 最简单的办法是利用t检验考察二次方的显 著性: 对于方程
我们需要检验income2前的系数β2是否显 著。
8
非线性设定形式中X变化对Y的效应
想知道在固定其他自变量X2、X3…Xk 的情形下,当自变量X1变化∆X时,预期 因变量Y如何变化。当总体回归函数为线 性时,很容易计算这个效应, ∆Y=ß1∆X1 但当回归函数为非线性时,由于Y的预期 变化依赖于自变量的取值,因此其计算 较复杂。
61
在本题中我们还可以求以下数据: 1。低学生/教师比和低英语学习者百分率学区 的样本平均侧试成绩。 2。低学生/教师比和高英语学习者百分率学区 的样本平均侧试成绩。 3。高学生/教师比和低英语学习者百分率学区 的样本平均侧试成绩。 4。高学生/教师比和高英语学习者百分率学区 的样本平均侧试成绩。
38
注意:因为自变量不包含任何对数形式, 所以对数线性模型的拟合图是一条直线。
39
6.6
6.55
6.5
6.45
6.4
0
20
40
60
income
lntestscr
Fitted values
suest-支持面板数据的似无相关检验
suest-支持面板数据的似无相关检验1. 问题背景检验组间系数差异时(详情参见「Stata: 如何检验分组回归后的组间系数差异?」),一种常用的方法是基于似无相关估计的su-test,在 Stata 中可以用 suest 命令快捷地实现。
但 suest 不支持 xtreg 命令,因此无法直接将该方法直接应用于面板数据模型,如 FE 或 RE。
2. 旧方法(手动处理)可以预先手动去除个体效应,继而对变换后的数据执行OLS 估计,步骤如下:•step 1:对于固定效应模型而言,可以使用 center 或 xtdata 命令去除个体效应;对于随机效应模型而言,可以使用 xtdata 命令去除个体效应。
•step 2:按照截面数据的方法对处理后的数据进行分组估计,并执行 suest 估计和组间系数检验。
•举个例子:1.*-SUEST test for panel data2.*-数据概况3.webuse 'nlswork', clear4.xtset idcode year5.xtdes6.*-对核心变量执行组内去心:去除个体效应7.help center //外部命令, 下载命令为 ssc install center, replace8.local y 'ln_wage'9.local x 'hours tenure ttl_exp south'10.bysort id: center `y', prefix(cy_) //组内去心11.bysort id: center `x', prefix(cx_)12.*-分组回归分析13.reg cy_* cx_* i.year if collgrad==0 // 非大学组14.est store Yes15.reg cy_* cx_* i.year if collgrad==1 // 大学组16.est store No17.*-列示分组估计结果18.esttab Yes No, nogap mtitle(Yes_Coll No_Coll) ///19.star(* 0.1 ** 0.05 *** 0.01) s(r2 N)20.*-似无相关估计21.suest Yes No22.*-组间差异检验23.test [Yes_mean]cx_ttl_exp = [No_mean]cx_ttl_exp24.test [Yes_mean]cx_hours = [No_mean]cx_hours3. 新方法: 安装新版 suest 命令目前,可以使用 Federico Belotti. 更新后的 suest.ado 文档替换Stata 官方提供的 suest.ado 文档。
stata回归结果详解-stata回归解释(教学内容)
10.7 27.1
1.7 9.1 2.1 11.2
6 12.7 15.6
8.9 0.6 5.9
5 7.2 16.8 3.8 10.3 15.8 12
x3 5 16 17 10 19 1 17 18 10 14 11 23 14 26 34 15 2 11 4 28 32 10 14 16 10
自变量对其他k-1 个自变量的线性回归的判定系数, 容忍 度越小,多重共线性越严重。方差扩大因子等于容忍度的 倒数,VIF 越大,多重共线性越严重, 一般认为容忍度小 于0.1 、VIF 大于10 时,存在严重的多重共线性。
VIFj
1 容忍度
1
=
1
R
2 j
R2j 为x j对其它自变量进行回归的判决系数
第三列df是自由度(degree of freedom),第一行是回归自由度dfr,等于变量数 目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即 有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例, m=4,n=10,因此,dfr=4,dfe=n-m-1=20,dft=n-1=24。
n
2.SSE ( yi yˆi )2 63.28 i1
合效果越差,y的标准误差即由SSE给出。 3.第三行为总平方和或总变差SST,表示因变量对其平均 值的总偏差。
n
3.SST ( yi y)2 312.65 i 1
4.容易验证249.37+63.28=312.65
4.SSR SSE SST
12
6.回归结果的评价
• (1)通过模型F检验说明线性关系是否成立。 • (2)回归系数符号是否与理论或预期相一致。 • (3) 通过系数t检验说明y 与x关系统计显著性。 • (4)用判定系数说明回归模型在多大程度上
Stata回归简介
Stata回归简介线性回归的命令有:regressyx1x2x3(以y为被解释变量,x1,x2,x3为解释变量做回归;regress 后第一个变量为被解释变量)regressyx1x2x3,robust(regressionwithrobuststandarderrors)regressyx1x2x3[aweight=w](WLS,以变量w为权重)regyx1x2x3,level(99)返回回归报告中99%的置信区间。
setlevel97在以后的回归中都默认返回97的置信区间。
regyx1x2x3,noconstant无常数回归。
xi:regressyx1x2i.catvar*x2(被解释变量为y,解释变量为x1,x2,分类变量catvar生成的虚拟变量与x2的乘积。
xi可以实现很复杂的带虚拟变量的回归。
可使用helpxi命令来了解。
)regressyx1x2(xz)(工具变量回归,工具变量是x和z)regressyx1x2[ifexp][inrange](使用满足[ifexp]和[inrange]的观测做回归)线性回归的典型输出:Stata会报告如下结果:方差分解,整体显著性检验的F统计量及相应的p 值,R平方,调整后的R平方,MSE的平方根(亦即对σ的估计),系数估计,系数估计的标准差,t值,显著性检验的p值,置信区间。
回归后可以对系数做假设检验:对单个参数的检验testamount(检验amount的系数是否显著)testamount=1(检验amount的系数是否为1)对多个参数的检验testamountratio(零假设为amount和ratio的系数都不显著)testamount=ratio(检验amount和ratio的系数是否相等)testamount+ratio=1(检验amount和ratio的系数之和是否为1)回归后一般要做回归分析,检验是否存在异常的观测,以及是否有异方差,自相关,共线性。
第20 章 似不相关回归
第 20 章 似不相关回归
20.1 单一方程估计与系统估计
例(似不相关回归):以研一学生的计量成绩与英语成绩 作为两个被解释变量。这两个方程的变量之间貌似没有联 系,但由于同一学生的不可观测因素同时对计量成绩与英
ε1ε′2 ε2ε′2 "
εnε′2
" " " "
ε1ε′n ε2ε′n "
εnε′n
⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟nT×nT
(20.3)
3
E(εi
ε
′
i
)
=
σ ii
IT
(20.4)
E(εitε js ) = ⎧⎪⎪⎨⎪⎪⎩σ0ij
t=s t≠s
(20.5)
E(εiε′j
)
=
σ ij
IT
(20.6)
∑ σˆij
=
1 T
ei′e j
=
1 T
e e T
t=1 it jt
(20.11)
8
Ωˆ
因此,
=
⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝σσσ"ˆˆˆ12n111
σˆ12 σˆ 22 "
σˆ n 2
" " " "
σˆ1n σˆ 2 n "
σˆ nn
⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
⊗
IT
。将
Ωˆ
代入方程(20.10)可得,
Ω = ⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝σσσ"12n111IIITTT
σ12IT
σ 22
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
use hsb2,clear sureg (read write math science) (socst write
math),corr isure test [read]math=[socst]math
例2:用三家公司的公司投资额对公司市值、 资本存量进行回归。(grunfeld2.dta)
Invest11011mvalue112kstock11 Invest22021mvalue222kstock22 Invest33031mvalue332kstock33
sureg (invest1 = mvalue1 kstock1) (invest2 = mvalue2 kstock2) (invest3 = mvalue3 kstock3)
这种迭代估计方法必须设定初始值和停止法 则。初始值的选择对于迅速找到最优解非常 重要。
例1:利用NLS方法估计非线性消费函数(数 据文件:usmacro)
csinc u
nl (realcons = {a} + {b}*realgdp^{gamma=1}) 如果不给定gamma的初始条件将无法达到收
分位数回归
传统回归模型着重考察解释变量x对被解释变量y的 条件期望的影响,实际上是“均值回归” 。但这种 方法容易产生如下问题:1。无法了解y的整体分布; 2。结果受极端值影响严重。
如果能够估计出条件分布的若干重要的“条件分位 数”(conditional quantiles),比如“中位数” (median)、“分位数”(lower quartile)、“分 位数”(upper quartile),就能对条件分布有更全 面的认识。
4。利用自助法重复100次计算[0.25,0.75]的 分位数回归。
iqreg price weight length foreign, reps(100)
敛。
例2:估计如下生产函数模型。(数据文件: production),不变替代弹性(CES)生产函 数:
l n y 0 m /l nK ( 1 ) L u
nl ( lnout={b0}{m=1}/{rho=1}*ln( {delta=0.5}*capital^(-{rho}) +(1-{delta})*labor^(-{rho}) ) )
1。中位数回归
qreg price weight length foreign 2。0.25分位数回归
qreg price weight length foreign, quantile(0.25)
3。利用自助法重复100次同时计算0.25,0.5, 0.75的分位数回归。
sqreg price weight length eign, q (0.25 0.5 0.75) reps(100)
联立方程组
三阶段最小二乘法 打开数据文件klein.dta 建立如下方程:
C o n s u m p 1 0 1 1 w a g e p r iv 1 2 w a g e g o v t 1 w a g e p r iv 2 0 2 1 C o n s u m p 2 2 g o v t2 3 c a p ita l1 2
reg3 (consump wagepriv wagegovt) (wagepriv consump govt capital1)
非线性回归
非线性最小二乘法的思路是,通过泰勒级数 将均值函数展开为线性模型。即,只包括一 阶展开式,高阶展开式都归入误差项。然后 再进行OLS回归,将得到的估计量作为新的 展开点,再对线性部分进行估计。如此往复, 直至收敛。