stata第二讲【山大陈波】
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中,unemt表示第t期的失业率(%),inft 表示第t期的通货膨胀率(%),infte表示预 期通货膨胀率,µ0表示自然失业率(%)。 按照适应性预期理论,infte = inft-1。 令∆inft=inft - inft-1,上述模型可以简化为:
∆inft = β0 + β1unemt + ut
通过上课的学习我们得到:
ˆ = (X' X)−1 X' y β
习惯上我们用 y_hat = X*b /* 被解释变量的拟合值*/ e = y - y_hat = y - Xb /* 残差 */
建立回归方程
打开系统文件auto,建立如下方程: sysuse auto,clear regress price mpg weight foreign Regress命令详解: regress depvar [indepvars] [if] [in] [weight] [, options]
自己练习:为下列变量增加标签 educ:受教育年限。 exper:工龄。 tenure:现有岗位任期。
为变量值增加标签 例如:为变量marrid添加数值标签marry: 1=married; 0=Unmarried 菜单:Data->Labels->Label values->Define or modify label values Data->Labels->Label values->Assign label values to variable 命令: . label define marry 1 “married” 0 “unmarried" . label values married marry
回归结果解读
系数/标准误差= t值 P值 系数=0的概率为 p值 在5%的水准上显著不为0 否则和0的差异不显著 0 95%下限=估计值-t值*标准误差 95%下限=估计值+t值*标准误差 置信区间: 系数在95%的概率下会落在---之间 跨越0,则与0不显著
模型常用的其他形式: 对数 平方项 n次方 指数 交乘项 虽然对函数形式的选择有检验方法,但最好 还是从“经济意义”角度确定。
例二:打开production reg lny lnl lnk testnl _b[lnl] * _b[lnk] = 0.25 testnl _b[lnl] * _b[lnk] = 0.5
大样本OLS
大样本OLS经常采用稳健标准差估计(robust) 稳健标准差是指其标准差对于模型中可能存 在的异方差或自相关问题不敏感,基于稳健 标准差计算的稳健t统计量仍然渐进分布t分布。 因此,在Stata中利用robust选项可以得到异 方差稳健估计量。
残差点的图形表示
rvfplot:残差拟合值图 可以加参数yline(0) 将e 与ˆy 画在一起 rvpplot x1:残差预测值图 将e 与x1 画在一起 avplot avplots lvr2plot
离群样本点与杠杆样本点
离群样本点:残差值较大的样本点 杠杆样本点:与样本整体(X'X)很不相同的少 数样本点 离群样本点: reg price mpg weight foreign predict e,res List make price e
Βιβλιοθήκη Baidu
约束回归
定义约束条件 constraint define n 条件 约束回归语句 Cnsreg 被解释变量 解释变量, constraints(条 件编号)
约束回归
例一:打开production cons def 1 lnl+lnk = 1 cnsreg lny lnl lnk, c (1) 例二:sysuse auto,clear cons def 1 price = weight cons def 2 displacement = weight cons def 3 gear_ratio = -foreign cnsreg mpg price weight displacement gear_ratio foreign length, c(1-3) (本题没有什么经济意义,只是让大家熟悉这种方法)
矩阵运算
1。手动建立矩阵命令:matrix Matrix input 矩阵变量名=(矩阵) 同一行元素用,分隔 不同行元素用\分割 建立矩阵 : 3 6 8 5 11 7 2 18 16
显示矩阵变量 mat dir 显示矩阵内容 Mat list 矩阵变量
常用矩阵运算: C=A+B A-B A*B Kronecker乘积 :C=A#B 常用矩阵函数: trace(m1) m1的迹 Diag(v1) 向量的对角矩阵 inv(m1) m1的逆矩阵
作业2
陈老师布置的关于美国电力的生产函数
例三:我国某地区1955---1984农产品收购量 sg、库存量kc存放在文件warehouse.dta中 估计如下方程: Sgt=a+b0kct+b1kct-1+u
回归后预测值的获得
Predict 1。拟合值的获得: predict yhat, xb 或者 predict yhat 2。残差的获得 predict e , residuals 或者 predict e, res
Stata上机实验
作业解答
作业1答案 作业2答案
添加标签
1。为整个数据添加标签:例如,将数据命名 为“工资表”。 菜单:Data->Labels->Label dataset 命令:label data “工资表“ 2。为变量增加标签,例如,给变量wage增 加标签“年工资总额” 菜单:Data->Labels->Label variables 命令 label variable wage “年工资总额"
回归的假设检验
Test命令 例一 sysuse auto, clear reg price mpg weight length 1。检验参数的联合显著性 2。分别检验各参数的显著性 3。三个参数对被解释变量的影响相同
例二: use wage2, clear reg lnwage educ tenure exper expersq 1。教育(educ)和工作时间(tenure)对工资的 影响相同。 test educ=tenure 2。工龄(exper)对工资没有影响 test exper 或者 test exper =0 3。检验 educ和 tenure的联合显著性 test educ tenure 或者 test (educ=0) (tenure=0)
1。要求方程省略常数项(自己设置常数项) reg price mpg weight foreign, nocons(hascons) 2。稳健性估计(一般用于大样本OLS) reg price mpg weight foreign, vce(robust) 或者:reg price mpg weight foreign, r 3。设置置信区间(默认95%) reg price mpg weight foreign, level(99)
例三:生产函数production use production,clear reg lny lnl lnk test lnl lnk test (lnl=0.8) (lnk=0.2) test lnk+lnl=1
非线性检验:testnl
例一 . sysuse auto gen weight2 = weight^2 reg price mpg trunk length weight weightsq foreign testnl _b[mpg] = 1/_b[weight] testnl (_b[mpg] = 1/_b[weight]) (_b[trunk] = 1/_b[length])
小样本OLS
小样本OLS假设条件较为严格 假设1: 二者之间存在线性关系 y = a0 + a1*x1 + a2*x2 + ... + ak*xk +ε y = Xb +ε 假设2: X 是满秩的,i.e. rank(X) = k 假设3: 干扰项的条件期望为零(严格外生性) * E[ε| X] = 0
我们可以利用矩阵运算的方法将回归结果展 现的所有统计量都手动计算出来。 大家有兴趣回去做一遍,可以加深你对这些 知识的理解。
逐步回归法
逐步回归法分为逐步剔除和逐步加入。 逐步剔除又分为逐步剔除(Backward selection)和逐步分层剔除 (Backward hierarchical selection) 1。逐步剔除 stepwise, pr(显著性水平): 回归方程 例如:对auto数据 Stepwise,pr(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 2。逐个分层剔除 Stepwise,pr(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 去掉foreign 重新做一遍
例题
例一:利用wage2的数据检验明瑟(mincer)工 资方程的简单形式: Ln(wage)=b0+b1*educ+b2*exper +b3*exper^2+ u
例二:利用phillips的数据拟合预期增强的菲 利普斯曲线为
inft − inft = β1(unemt − µ0 ) + ut
e
4。标准化系数 reg price mpg weight foreign, beta 5。部分数据回归 reg price mpg weight length foreign in 1/30 (为什么foreign被drop掉?) reg price mpg weight length if foreign==0
杠杆样本点: reg price mpg weight foreign predict lev, leverage lvr2plot lvr2plot, mlabel(make)
作业1
考察工资方程(数据文件:cps78-85.dta) Log(wage) = Xb+u X中包括educ=教育、exper=工龄、exper2=工龄平 方、tenure=现有岗位的任期、female=性别(女 =1)、y85=85年、y85educ=交叉积、y85fem=交 叉积。 1。建立回归模型 2。给出各参数的99%置信区间 3。检验H1:educ、tenure对工资影响相同、H2: 教育对收入没有影响4。预测拟合值和残差 5。观测离群值和杠杆值
2。还可以将变量转换为矩阵 mkmat 变量名表,mat(矩阵名) 练习:sysuse auto reg price mpg weight foreign 要求:利用矩阵运算手动计算出参数
gen cons = 1 mkmat price, mat(y) mkmat mpg weight foreign cons, mat(X) mat b = inv(X'*X)*X'*y mat list b mat list y mat list X
逐步加入又分为逐步加入(Forward selection)和逐步分层加 入(Forward hierarchical selection) 1。逐步加入 stepwise, pe(显著性水平): 回归方程 例如:对auto数据 Stepwise,pe(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 2。逐个分层加入 Stepwise,pe(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign