stata上机实验操作
stata上机实验第一讲
添加标签
1。为整个数据添加标签:例如,将数据命名
为“工资表”。 菜单:Data->Labels->Label dataset 命令:label data “工资表“ 2。为变量增加标签,例如,给变量wage增 加标签“年工资总额” 菜单:Data->Labels->Label variables 命令 label variable wage “年工资总额"
1。所有的系统自带数据可以利用sysuse命令
打开。 2。Use命令只能打开 C:\data 或者 D:\data 中的数据。 3。如果需要打开其他文件夹的数据,必须改 变目录(例如,将自己的数据放入D:\abc) cd "D:\abc” 或者直接 file------open
先学习几条最简单的命令
Stata的菜单介绍
最重要的菜单项:
Data菜单 Graphic菜单
Statistics菜单
每执行一个菜单性会自动产生相应的命令。
(以summarize为例)。 我们的讲述尽量兼顾到命令操作和菜单操作 两种方法,以命令方式为主。
安装指南
解压 setup.rar
运行 setup 安装时选择 Stata SE
装到: C:\Program file\stata10 中。 将所用系统自带的一些系统数据、应用程序、 帮助文件安装到 C:\Program file\stata10\ado\base 中 将所有升级程序安装到: C:\Program file\stata10\ado\update 中
Stata数据的录入
1。直接录入。
stata选择实验法
stata选择实验法
Stata是一种统计分析软件,可以用于分析各种数据,包括实验数据。
在使用Stata进行实验法选择时,以下步骤可以作为参考:
1. 数据准备:将实验数据导入Stata中,并确保数据格式正确。
2. 描述性统计:使用Stata的描述性统计功能,对实验数据进行总体特征的描述,包括均值、标准差等。
3. T检验:如果实验中涉及到两个样本之间的比较,可以使用Stata的T检验功能,比较两个样本的均值是否存在显著差异。
4. 方差分析:如果实验中有多个组别,可以使用Stata的方差分析功能,比较不同组别之间的均值是否存在显著差异。
5. 回归分析:如果实验中有多个自变量和一个因变量,可以使用Stata的回归分析功能,探究自变量对因变量的影响,同时进行显著性检验。
6. 实验设计优化:根据实验结果,可以使用Stata的设计优化功能,对实验方案进行调整,以获得更准确和可靠的结果。
以上是使用Stata进行实验法选择的一般步骤,具体分析方法和步骤可能因实验的具体要求而有所不同。
stata上机实验第五讲 工具变量(IV)
究竟该用OLS 还是IV
即解释变量是否真的存在内生性? 假设能够找到方程外的工具变量。 1。如果所有解释变量都是外生变量,则OLS
比IV 更有效。在这种情况下使用IV,虽然估 计量仍然是一致的,会增大估计量的方差。2。 如果存在内生解释变量,则OLS 是不一致的, 而IV 是一致的。
豪斯曼检验(Hausman specification test)原假设: H0 :所有解释变量均为外生变量。 H1:至少有一个解释变量为内生变量。
检验方法: estat firststage 1。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征 值统计量),经验上此数应该大于10。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
使用grilic.dta估计教育投资的回报率。
变量说明:lw80(80年工资对数),s80 (80年时受教育年限),expr80(80年时工 龄),tenure80(80年时在现单位工作年 限), iq(智商),med(母亲的教育年 限),kww(在‘knowledge of the World of Work’测试中的成绩),mrt(婚姻虚拟变量, 已婚=1),age(年龄)。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat overid ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) estat overid
(最新整理)stata上机实验第五讲——面板数据的处理..
• corr(u_i, Xb) 个体效应与解释变量的相关系数,相关 系数为0或者接近于0,可以使用随机效应模型;相 关系数不为0,需要使用固定效应模型。u-i不表示残 差,表示个体效应。
2021/7/26
19
模型选择
• 固定效应还是混合OLS? 可以直接观测F值
• 随机效应还是混合OLS? 先用随机效应回归,然后运行xttest0
• xtgls Panel-data models using GLS
• xtpcse OLS or Prais-Winsten models with panelcorrected standard errors
• xtrchh Hildreth-Houck random coefficients models
计量经济学stata操作指南
计量经济学stata操作指南计量经济学stata操作(实验课)第一章stata基本知识1、stata窗口介绍2、基本操作(1)窗口锁定:Edit-preferences-general preferences-windowing-lock splitter (2)数据导入(3)打开文件:use E:\example.dta,clear(4)日期数据导入:gen newvar=date(varname, “ymd”)format newvar %td 年度数据gen newvar=monthly(varname, “ym”)format newvar %tm 月度数据gen newvar=quarterly(varname, “yq”)format newvar %tq 季度数据(5)变量标签Label variable tc ` “total output” ’(6)审视数据describelist x1 x2list x1 x2 in 1/5list x1 x2 if q>=1000drop if q>=1000keep if q>=1000(6)考察变量的统计特征summarize x1su x1 if q>=10000su q,detailsutabulate x1correlate x1 x2 x3 x4 x5 x6(7)画图histogram x1, width(1000) frequency kdensity x1scatter x1 x2twoway (scatter x1 x2) (lfit x1 x2) twoway (scatter x1 x2) (qfit x1 x2) (8)生成新变量gen lnx1=log(x1)gen q2=q^2gen lnx1lnx2=lnx1*lnx2gen larg=(x1>=10000)rename larg largeg large=(q>=6000)replace large=(q>=6000)drop ln*(8)计算功能display log(2)(9)线性回归分析regress y1 x1 x2 x3 x4vce #显示估计系数的协方差矩阵reg y1 x1 x2 x3 x4,noc #不要常数项reg y1 x1 x2 x3 x4 if q>=6000reg y1 x1 x2 x3 x4 if largereg y1 x1 x2 x3 x4 if large==0reg y1 x1 x2 x3 x4 if ~large predict yhatpredict e1,residualdisplay 1/_b[x1]test x1=1 # F检验,变量x1的系数等于1test (x1=1) (x2+x3+x4=1) # F联合假设检验test x1 x2 #系数显著性的联合检验testnl _b[x1]= _b[x2]^2(10)约束回归constraint def 1 x1+x2+x3=1cnsreg y1 x1 x2 x3 x4,c(1)cons def 2 x4=1cnsreg y1 x1 x2 x3 x4,c(1-2)(11)stata的日志File-log-begin-输入文件名log off 暂时关闭log on 恢复使用log close 彻底退出(12)stata命令库更新Update allhelp command第二章有关大样本ols的stata命令及实例(1)ols估计的稳健标准差reg y x1 x2 x3,robust(2)实例use example.dta,clearreg y1 x1 x2 x3 x4test x1=1reg y1 x1 x2 x3 x4,rtestnl _b[x1]=_b[x2]^2第三章最大似然估计法的stata命令及实例(1)最大似然估计help ml(2)LR检验lrtest #对面板数据中的异方差进行检验(3)正态分布检验sysuse auto #调用系统数据集auto.dtahist mpg,normalkdensity mpg,normalqnorm mpg*手工计算JB统计量sum mpg,detaildi (r(N)/6)*((r(skewness)^2)+[(1/4)*(r(kurtosis)-3)^2]) di chi2tail(自由度,上一步计算值)*下载非官方程序ssc install jb6jb6 mpg*正态分布的三个检验sktest mpgswilk mpgsfrancia mpg*取对数后再检验gen lnmpg=log(mpg)kdensity lnmpg, normaljb6 lnmpgsktest lnmpg第四章处理异方差的stata命令及实例(1)画残差图rvfplotrvfplot varname*例题use example.dta,clearreg y x1 x2 x3 x4rvfplot # 与拟合值的散点图rvfplot x1 # 画残差与解释变量的散点图(2)怀特检验estat imtest,white*下载非官方软件ssc install whitetst(3)BP检验estat hettest #默认设置为使用拟合值estat hettest,rhs #使用方程右边的解释变量estat hettest [varlist] #指定使用某些解释变量estat hettest,iidestat hettest,rhs iidestat hettest [varlist],iid(4)WLSreg y x1 x2 x3 x4 [aw=1/var]*例题quietly reg y x1 x2 x3 x4predict e1,resgen e2=e1^2gen lne2=log(e2)reg lne2 x2,nocpredict lne2fgen e2f=exp(lne2f)reg y x1 x2 x3 x4 [aw=1/e2f](5)stata命令的批处理(写程序)Window-do-file editor-new do-file#WLS for examplelog using E:\wls_example.smcl,replaceset more offuse E:\example.dta,clearreg y x1 x2 x3 x4predict e1,resgen e2=e1^2g lne2=log(e2)reg lne2 x2,nocpredict lne2fg e2f=exp(lne2f)*wls regressionreg y x1 x2 x3 x4 [aw=1/e2f]log closeexit第五章处理自相关的stata命令及实例(1)滞后算子/差分算子tsset yearl.l2.D.D2.LD.(2)画残差图scatter e1 l.e1ac e1pac e1(3)BG检验estat bgodfrey(默认p=1)estat bgodfrey,lags(p)estat bgodfrey,nomiss0(使用不添加0的BG检验)(4)Ljung-Box Q检验reg y x1 x2 x3 x4predict e1,residwntestq e1wntestq e1,lags(p)* wntestq指的是“white noise test Q”,因为白噪声没有自相关(5)DW检验做完OLS回归后,使用estat dwatson(6)HAC稳健标准差newey y x1 x2 x3 x4,lag(p)reg y x1 x2 x3 x4,cluster(varname)(7)处理一阶自相关的FGLSprais y x1 x2 x3 x4 (使用默认的PW估计方法)prais y x1 x2 x3 x4,corc (使用CO估计法)(8)实例use icecream.dta, cleartsset timegraph twoway connect consumption temp100 time, msymbol(circle) msymbol(triangle) reg consumption temp price incomepredict e1, resg e2=l.e1twoway (scatter e1 e2) (lfit e1 e2)ac e1pac e1estat bgodfreywntestq e1estat dwatsonnewey consumption temp price income, lag (3)prais consumption temp price income, corcprais consumption temp price income, nologreg consumption temp l.temp price incomeestat bgodfreyestat dwatson第六章模型设定与数据问题(1)解释变量的选择reg y x1 x2 x3estat ic*例题use icecream.dta, clearreg consumption temp price incomeestat icreg consumption temp l.temp price incomeestat ic(2)对函数形式的检验(reset检验)reg y x1 x2 x3estat ovtest (使用被解释变量的2、3、4次方作为非线性项)estat ovtest, rhs (使用解释变量的幂作为非线性项,ovtest-omitted variable test)*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat ovtestg lnq2=lnq^2reg lntc lnq lnq2 lnpl lnpk lnpfestat ovtest(3)多重共线性estat vif*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat vif(4)极端数据reg y x1 x2 x3predict lev, leverage (列出所有解释变量的lev值)gsort –levsum levlist lev in 1/3*例题use nerlove.dta, clearquietly reg lntc lnq lnpl lnpk lnpfpredict lev, leveragesum levgsort –levlist lev in 1/3(5)虚拟变量gen d=(year>=1978)tabulate province, generate (pr)reg y x1 x2 x3 pr2-pr30(6)经济结构变动的检验方法1:use consumption_china.dta, cleargraph twoway connect c y year, msymbol(circle) msymbol(triangle)reg c yreg c y if year<1992reg c y if year>=1992计算F统计量方法2:gen d=(year>1991)gen yd=y*dreg c y d ydtest d yd第七章工具变量法的stata命令及实例(1)2SLS的stata命令ivregress 2sls depvar [varlist1] (varlist2=instlist)如:ivregress 2sls y x1 (x2=z1 z2)ivregress 2sls y x1 (x2 x3=z1 z2 z3 z4) ,r firstestat firststage,all forcenonrobust (检验弱工具变量的命令)ivregress liml depvar [varlist 1] (varlist2=instlist)estat overid (过度识别检验的命令)*对解释变量内生性的检验(hausman test),缺点:不适合于异方差的情形reg y x1 x2estimates store olsivregress 2sls y x1 (x2=z1 z2)estimates store ivhausman iv ols, constant sigmamore*DWH检验estat endogenous*GMM的过度识别检验ivregress gmm y x1 (x2=z1 z2) (两步GMM)ivregress gmm y x1 (x2=z1 z2),igmm (迭代GMM)estat overid*使用异方差自相关稳健的标准差GMM命令ivregress gmm y x1 (x2=z1 z2), vce (hac nwest[#])(2)实例use grilic.dta,clearsumcorr iq sreg lw s expr tenure rns smsa,rreg lw s iq expr tenure rns smsa,rivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),restat overidivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first estat overidestat firststage, all forcenonrobust (检验工具变量与内生变量的相关性)ivregress liml lw s expr tenure rns smsa (iq=med kww),r *内生解释变量检验quietly reg lw s iq expr tenure rns smsaestimates store olsquietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store ivhausman iv ols, constant sigmamoreestat endogenous (存在异方差的情形)*存在异方差情形下,GMM比2sls更有效率ivregress gmm lw s expr tenure rns smsa (iq=med kww)estat overidivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm*将各种估计方法的结果存储在一张表中quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww)estimates store gmmquietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmmestimates store igmmestimates table gmm igmm第八章短面板的stata命令及实例(1)面板数据的设定xtset panelvar timevarencode country,gen(cntry) (将字符型变量转化为数字型变量)xtdesxtsumxttab varnamextline varname,overlay*实例use traffic.dta,clearxtset state yearxtdesxtsum fatal beertax unrate state yearxtline fatal(2)混合回归reg y x1 x2 x3,vce(cluster id)如:reg fatal beertax unrate perinck,vce(cluster state)estimates store ols对比:reg fatal beertax unrate perinck(3)固定效应xtreg y x1 x2 x3,fe vce(cluster id)xi:reg y x1 x2 x3 i.id,vce(cluster id) (LSDV法)xtserial y x1 x2 x3,output (一阶差分法,同时报告面板一阶自相关)estimates store FD*双向固定效应模型tab year, gen (year)xtreg fatal beertax unrate perinck year2-year7, fe vce (cluster state)estimates store FE_TWtest year2 year3 year4 year5 year6 year7(4)随机效应xtreg y x1 x2 x3,re vce(cluster id) (随机效应FGLS)xtreg y x1 x2 x3,mle (随机效应MLE)xttest0 (在执行命令xtreg, re 后执行,进行LM检验)(5)组间估计量xtreg y x1 x2 x3,be(6)固定效应还是随机效应:hausman testxtreg y x1 x2 x3,feestimates store fextreg y x1 x2 x3,reestimates store rehausman fe re,constant sigmamore (若使用了vce(cluster id),则无法直接使用该命令,解决办法详见P163)estimates table ols fe_robust fe_tw re be, b se (将主要回归结果列表比较)第九章长面板与动态面板(1)仅解决组内自相关的FGLSxtpcse y x1 x2 x3 ,corr(ar1) (具有共同的自相关系数)xtpcse y x1 x2 x3 ,corr(psar1) (允许每个面板个体有自身的相关系数)例题:use mus08cigar.dta,cleartab state,gen(state)gen t=year-62reg lnc lnp lnpmin lny state2-state10 t,vce(cluster state)estimates store OLSxtpcse lnc lnp lnpmin lny state2-state10 t,corr(ar1) (考虑存在组内自相关,且各组回归系数相同)estimates store AR1xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1) (考虑存在组内自相关,且各组回归系数不相同)estimates store PSAR1xtpcse lnc lnp lnpmin lny state2-state10 t, hetonly (仅考虑不同个体扰动性存在异方差,忽略自相关)estimates store HETONL Yestimates table OLS AR1 PSAR1 HETONL Y, b se(2)同时处理组内自相关与组间同期相关的FGLSxtgls y x1 x2 x3,panels (option/iid/het/cor) corr(option/ar1/psar1) igls注:执行上述xtpcse、xtgls命令时,如果没有个体虚拟变量,则为随机效应模型;如果加上个体虚拟变量,则为固定效应模型。
stata入门操作
-1-
任务:按学号录入五个学生的经济学成绩
id
economy
1
40
2
80
3
90
4
70
5Hale Waihona Puke 53操作:在 command 窗口中键入(注:前面的点号不必健入,每完成一行按回车键,黑体为命令,
斜体为变量名或文件名):
• clear
• input id name
• 1 40
• 2 80
• 3 90
• use economy,clear • sum economy • sum • sum economy in 1/2 • sum economy in 1/4 if economy>60
补充: Format 用来控制数据输出的格式
任务 2:生成新的数据 x, (x=1,2,…1000); y=x+100. • clear • set obs 1000 • gen x=_n • gen y=x+100
• 4 70
• 5 53
• end
• save economy
• save economy,replace
• exit,clear 其中后两命令先保存数据,文件名为 economy,然后清除内存中的数据并退出 STATA. 如果重复执行 save economy 回出现错误提示”file economy have already exist”,意味着
pwd
显示当前路径
pwd
dir
列示当前路径文件夹中的所有文件 dir
mkdir
在当前路径下创建一个新的文件夹 mkdir d:/mydata
cd
将 cd 后面的路径设定为当前路径 cd “d:/mydata”
stata上机实验第六讲
不同,其参数估计值并不直接可比。雨宫 (Amemiya)提出:同一个模型的logit和 probit模型大概具有如下关系: Blogit 约等于 1.6*BProbit 但利用mfx计算的两者的边际效应应该大致相 同。
一个综合例子
使用美国妇女就业数据集“womenwork.dta”,
估计决定就业的Probit与Logit模型。被解释 变量为work=1,就业;work=0,不就业。解 释变量为age(年龄), married(婚否), children(子女数), education(教育年限)。
排序选择模型
根据GSS的调查数据,不同的家庭母亲与子 女之间的关系也不同。根据调查显示,有的 家庭母子(女)关系比较紧张,有的比较融 洽。变量包括:warm=关系融洽度(0、1、2、 3);educ=子女接受教育的程度;age=子女 年龄;male=儿子;prst=职业威望;white= 白人;y89=89年调查结果。分析不同因素对 母子(女)关系的融洽程度有何影响。
sysuse auto,clear truncreg price weight length gear_ratio, ll(10000) reg price weight length gear_ratio if price>=10000
截取回归
对于线性模型yi =x’B+εi,如果满足yi ≥ c或者
nbreg daysabs langarts male 命令结果中将提供一个LR 检验, 原假设:不存在过度分散,应该使用泊松回 归。此时alpha=0。 备则假设: alpha<>0,不能使用泊松回归。
受限因变量模型
1。断尾回归
2。截取回归
stata上机实验操作
第六章第二题:1. 建立完成的教育年数(ED )对到最近大学的距离(Dist )的回归:. reg ed dist, robust斜率估计值是:-0.0732. reg ed dist bytest female black hispanic incomehi ownhome dadcoll cue80 stwmfg80,robustDist 对ED 的效应估计是:-0.0323. 系数下降50%,存在很大差异,(1)中回归存在遗漏变量偏差4. di e(r2_a)(可看到调整后的R2)第一问中=0.0074 调整的2R =0.00718796_cons 13.95586 .0378112 369.09 0.000 13.88172 14.02999dist -.0733727 .0134334 -5.46 0.000 -.0997101 -.0470353ed Coef. Std. Err. t P>|t| [95% Conf. Interval]RobustRoot MSE = 1.8074R-squared = 0.0074Prob > F = 0.0000F( 1, 3794) = 29.83Linear regression Number of obs = 3796. reg ed dist , robust2R第二问中=0.2788 2R = 0.27693235可以得到第二问中的拟合效果要优于第一问。
第二问中相似的原因:因为n 很大。
5. Dadcoll 父亲有没有念过大学:系数为正(0.6961324)衡量父亲念过大学的学生接受的教育年数平均比其父亲没有年过大学的学生多。
-.0517777 1)原因:这些参数在一定程度上构成了上大学的机会成本。
2)它们的系数估计值的符号应该如此。
当Stwmfg80增加时,放弃的工资增加,所以大学入学率降低了;因而Stwmfg80的系数对应为负。
计量经济学stata上机教程
计量经济学stata上机教程2014计量经济学上机教程1Stata操作基础主要内容:1. Stata的特点与功能2. Stata的界面管理3. Stata的命令语法4. 数据处理5. 统计描述、制图与输出结果6. log文档与do文档7. 常用函数8. Stata的帮助系统与学习资源9. 课后练习1. Stata的特点与功能, 将统计功能与计量分析完整地结合起来。
不仅可以实现诸多统计分析方法,比如描述统计、假设检验、方差分析、主成分分析等,而且可以实现多种计量经济模型的估计和检验,包括经典单方程回归模型、方程组模型、微观数据模型(离散选择模型、计数模型、截断模型、归并模型等)、时间序列数据模型(ARMA、VAR、GARCH等)以及面板数据分析。
, 强大的数据处理功能。
, 精致的作图功能。
, 丰富的网络资源。
Stata 12有各种版本,其中尤以SE(特殊版)最为常用。
用户可以在命令栏中输入about命令查看所安装的版本信息。
2--per ml sodium hydroxide [c (NaOH) =1.000 mol/L] potassium hydrogen phthalate standard solution of quality g. ... After dilution to 1000mL. 1.1.2 0.000 35mol/L iodine solution: dissolve 20 g of potassium iodide in Cheng You (30~40) 500mL mL water bottle; 5mL iodine stock solution, and then diluted to scale and mix. This solution every other day to prepare. 1.1.3 acetate buffer (PH5.3): dissolve 87g sodium acetate (CH3COONa • 3H2O) 400mL water and 10.5mL in glacial acetic acid is dissolved in a small amount of water. volume and then mixing the two together and add water to 500mL, using regulation to PH5.3. 1.1.40.5mol/L sodium chloride: 14.5 g of sodium chloride dissolved in boiled water, and constant volume to 500mL. 1.1.5 soluble starch: pure before use should determine its value. Accurate said take amount starch (equivalent to dry state 1g) Yu 250mL high type beaker in the, added80~90mL distilled water, Yu asbestos online in constantly mixing Xia quickly heating to boiling, then with fire keep micro-boiling 3min, stamped and cooling to at room temperature, transfer to 100mL capacity bottle in the, into 40 ? water bath in the makes solution reached this temperature, and in 40 ? Shi with distilled water (40 ?) set capacity, this starch solution placed 40 ? thermostat water bath in the for determination samples with. 1.2 the instrument a) constant temperaturewater bath: (40+-0.2) 0C. B) spectrophotometer. 1.3 procedures 1.3.1 preparation of samples: weighing 50mL 10G sample不同的版本对于样本容量、变量个数、矩阵阶数等有着不同的限制,用户可以通过以下命令了解和改变这些设定:memory 显示目前存储空间query memory 查看目前实际设定的存储空间set memory 10m 设定存储空间的大小set matsize 250 设定最大矩阵阶数set maxvar 2500 设定最大变量数(最小设定为2048)help limits 显示Stata的各种极限 2. Stata的界面管理, 首次打开Stata,将会出现一个询问是否进行更新的对话框。
stata上机实验第八讲 似不相关回归(SUR)(共12张PPT)
第五页,共12页。
联立方程(lián lì fānɡ chénɡ)组
三阶段(jiēduàn)最小二乘法 翻开数据文件klein.dta 建立如下方程:
C o n s u m p 1 0 1 1 w a g e p r iv 1 2 w a g e g o v t 1 w a g e p r iv 2 0 2 1 C o n s u m p 2 2 g o v t2 3 c a p ita l1 2
这种迭代估计方法必须设定初始值和停止法 那么。初始值的选择对于迅速找到最优解非 常重要。
第七页,共12页。
例1:利用NLS方法估计非线性消费函数〔数 据文件:usmacro〕
csinc u
nl (realcons = {a} + {b}*realgdp^{gamma=1}) 如果(rúguǒ)不给定gamma的初始条件将无法
例1: 使用高中生成绩数据集“hsb2.dta〞,估计一个SUR模
型。第一个方程的被解释变量为read〔阅读(yuèdú)成 绩〕,解释变量为write〔写作成绩〕,math〔数学成 绩〕,science〔科学成绩〕。第二个方程的被解释变 量为socst〔社会实践成绩〕,解释变量为write〔写作 成绩〕,math〔数学成绩〕。
到达收敛。
第八页,共12页。
例2:估计如下生产函数模型。〔数据文件: production〕,不变替代(tìdài)弹性〔CES〕 生产函数:
l n y 0 m /l nK ( 1 ) L u
nl ( lnout={b0}{m=1}/{rho=1}*ln( {delta=0.5}*capital^(-{rho}) +(1-{delta})*labor^(-{rho}) ) )
stata上机实验第四讲
误差项存在自相关:非主对角线上的元素不
为0 。
2 . n 1
.
2
.. ... ... ...
n2
n2 . 2
n 1
考察英国政府如何根据长期利率(r20)的变
化来调整短期利率(rs),数据集为 ukrates.dta (1)做如下回归:rst r 20t 1 t ,其中:
5,000
国产拟合 整体拟合
1。仅截距发生变化。我们以国产还是进口作为虚
拟变量,为了熟悉虚拟变量的产生过程,这里不用 foreign,而是产生一个新的虚拟变量dummy(虚拟 变量的生成要灵活运用gen语句和replace语句)。 gen dummy = 0 replace dummy = 1 if foreign==1 reg price dummy weight 和前面做的回归比较,dummy反映了进口车和国产 车常数项即截距的差异,斜率基本没有变化。
理论分析:加入虚拟变量后,方程变为
price = b0+b1*dummy+b2*weight +u 国产车,即dummy=0时:
方程变为:price = b0+b2*weight+u 进口车,即dummy=1时: 方程变为:price = (b0+b1)+b2*weight+u 结论:截距变化但斜率未变。
rst rst rst 1 Nhomakorabea归方程为:
r 20t 1 r 20t 1 r 20t 2
use ukrates,clear tsset month reg D.rs LD.r20
stata上机实验第五讲
固定效应模型
对于特定的个体i而言,ai 表示那些不随时间
改变的影响因素,如个人的消费习惯、国家 的社会制度、地区的特征、性别等,一般称 其为“个体效应” (individual effects)。如果 把“个体效应”当作不随时间改变的固定性 因素, 相应的模型称为“固定效应”模型。
固定效应模型
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat firststage
过度识别检验
检验工具变量是否与干扰项相关,即工具变量是否
为外生变量。目前仅限于在过度识别的情况下,进 行过度识别检验。 2SLS根据Sargan统计量进行过度识别检验 ,GMM 使用Hansen J Test进行过度识别检验。 命令均为: estat overid 检验工具变量的外生性 H0:所有工具变量都是外生的。 H1:至少有一个工具变量不是外生的,与扰动项相 关。
xtgls命令xtglsinvestmvaluekstockpanelsiidpooledolsxtglsinvestmvaluekstockpanelhet截面异方差xtglsinvestmvaluekstockcorrar1所有个体具有相同的自相关系数xtglsinvestmvaluekstockcorrpsar1每个个体有自己的自相关系数xtglsinvestmvaluekstockpanelcorr截面间相关且异方差xtglsinvestmvaluekstockpanelcorrcorrar1异方差序列相关和截面相关?2xtpcseinvestmvaluekstockols估计面板稳健性标准差xtpcseinvestmvaluekstockcorrar1praiswinsten估计个体具有共同的自相关系数xtpcseinvestmvaluekstockcorrpsar1每个截面有自己的自相关系数xtpcseinvestmvaluekstockcorrar1hetonly不考虑截面相关xtpcse命令
stata操作指南
计量经济学stata操作(实验课)第一章stata基本知识1、stata窗口介绍2、基本操作(1)窗口锁定:Edit-preferences-general preferences-windowing-lock splitter (2)数据导入(3)打开文件:use E:\example.dta,clear(4)日期数据导入:gen newvar=date(varname, “ymd”)format newvar %td 年度数据gen newvar=monthly(varname, “ym”)format newvar %tm 月度数据gen newvar=quarterly(varname, “yq”)format newvar %tq 季度数据(5)变量标签Label variable tc ` “total output” ’(6)审视数据describelist x1 x2list x1 x2 in 1/5list x1 x2 if q>=1000drop if q>=1000keep if q>=1000(6)考察变量的统计特征summarize x1su x1 if q>=10000su q,detailsutabulate x1correlate x1 x2 x3 x4 x5 x6(7)画图histogram x1, width(1000) frequencykdensity x1scatter x1 x2twoway (scatter x1 x2) (lfit x1 x2)twoway (scatter x1 x2) (qfit x1 x2)(8)生成新变量gen lnx1=log(x1)gen q2=q^2gen lnx1lnx2=lnx1*lnx2gen larg=(x1>=10000)rename larg largeg large=(q>=6000)replace large=(q>=6000)drop ln*(8)计算功能display log(2)(9)线性回归分析regress y1 x1 x2 x3 x4vce #显示估计系数的协方差矩阵reg y1 x1 x2 x3 x4,noc #不要常数项reg y1 x1 x2 x3 x4 if q>=6000reg y1 x1 x2 x3 x4 if largereg y1 x1 x2 x3 x4 if large==0reg y1 x1 x2 x3 x4 if ~largepredict yhatpredict e1,residualdisplay 1/_b[x1]test x1=1 # F检验,变量x1的系数等于1test (x1=1) (x2+x3+x4=1) # F联合假设检验test x1 x2 #系数显著性的联合检验testnl _b[x1]= _b[x2]^2(10)约束回归constraint def 1 x1+x2+x3=1cnsreg y1 x1 x2 x3 x4,c(1)cons def 2 x4=1cnsreg y1 x1 x2 x3 x4,c(1-2)(11)stata的日志File-log-begin-输入文件名log off 暂时关闭log on 恢复使用log close 彻底退出(12)stata命令库更新Update allhelp command第二章有关大样本ols的stata命令及实例(1)ols估计的稳健标准差reg y x1 x2 x3,robust(2)实例use example.dta,clearreg y1 x1 x2 x3 x4test x1=1reg y1 x1 x2 x3 x4,rtestnl _b[x1]=_b[x2]^2第三章最大似然估计法的stata命令及实例(1)最大似然估计help ml(2)LR检验lrtest #对面板数据中的异方差进行检验(3)正态分布检验sysuse auto #调用系统数据集auto.dtahist mpg,normalkdensity mpg,normalqnorm mpg*手工计算JB统计量sum mpg,detaildi (r(N)/6)*((r(skewness)^2)+[(1/4)*(r(kurtosis)-3)^2])di chi2tail(自由度,上一步计算值)*下载非官方程序ssc install jb6jb6 mpg*正态分布的三个检验sktest mpgswilk mpgsfrancia mpg*取对数后再检验gen lnmpg=log(mpg)kdensity lnmpg, normaljb6 lnmpgsktest lnmpg第四章处理异方差的stata命令及实例(1)画残差图rvfplotrvfplot varname*例题use example.dta,clearreg y x1 x2 x3 x4rvfplot # 与拟合值的散点图rvfplot x1 # 画残差与解释变量的散点图(2)怀特检验estat imtest,white*下载非官方软件ssc install whitetst(3)BP检验estat hettest #默认设置为使用拟合值estat hettest,rhs #使用方程右边的解释变量estat hettest [varlist] #指定使用某些解释变量estat hettest,iidestat hettest,rhs iidestat hettest [varlist],iid(4)WLSreg y x1 x2 x3 x4 [aw=1/var]*例题quietly reg y x1 x2 x3 x4predict e1,resgen e2=e1^2gen lne2=log(e2)reg lne2 x2,nocpredict lne2fgen e2f=exp(lne2f)reg y x1 x2 x3 x4 [aw=1/e2f](5)stata命令的批处理(写程序)Window-do-file editor-new do-file#WLS for examplelog using E:\wls_example.smcl,replaceset more offuse E:\example.dta,clearreg y x1 x2 x3 x4predict e1,resgen e2=e1^2g lne2=log(e2)reg lne2 x2,nocpredict lne2fg e2f=exp(lne2f)*wls regressionreg y x1 x2 x3 x4 [aw=1/e2f]log closeexit第五章处理自相关的stata命令及实例(1)滞后算子/差分算子tsset yearl.l2.D.D2.LD.(2)画残差图scatter e1 l.e1ac e1pac e1(3)BG检验estat bgodfrey(默认p=1)estat bgodfrey,lags(p)estat bgodfrey,nomiss0(使用不添加0的BG检验)(4)Ljung-Box Q检验reg y x1 x2 x3 x4predict e1,residwntestq e1wntestq e1,lags(p)* wntestq指的是“white noise test Q”,因为白噪声没有自相关(5)DW检验做完OLS回归后,使用estat dwatson(6)HAC稳健标准差newey y x1 x2 x3 x4,lag(p)reg y x1 x2 x3 x4,cluster(varname)(7)处理一阶自相关的FGLSprais y x1 x2 x3 x4 (使用默认的PW估计方法)prais y x1 x2 x3 x4,corc (使用CO估计法)(8)实例use icecream.dta, cleartsset timegraph twoway connect consumption temp100 time, msymbol(circle) msymbol(triangle) reg consumption temp price incomepredict e1, resg e2=l.e1twoway (scatter e1 e2) (lfit e1 e2)ac e1pac e1estat bgodfreywntestq e1estat dwatsonnewey consumption temp price income, lag (3)prais consumption temp price income, corcprais consumption temp price income, nologreg consumption temp l.temp price incomeestat bgodfreyestat dwatson第六章模型设定与数据问题(1)解释变量的选择reg y x1 x2 x3estat ic*例题use icecream.dta, clearreg consumption temp price incomeestat icreg consumption temp l.temp price incomeestat ic(2)对函数形式的检验(reset检验)reg y x1 x2 x3estat ovtest (使用被解释变量的2、3、4次方作为非线性项)estat ovtest, rhs (使用解释变量的幂作为非线性项,ovtest-omitted variable test)*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat ovtestg lnq2=lnq^2reg lntc lnq lnq2 lnpl lnpk lnpfestat ovtest(3)多重共线性estat vif*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat vif(4)极端数据reg y x1 x2 x3predict lev, leverage (列出所有解释变量的lev值)gsort –levsum levlist lev in 1/3*例题use nerlove.dta, clearquietly reg lntc lnq lnpl lnpk lnpfpredict lev, leveragesum levgsort –levlist lev in 1/3(5)虚拟变量gen d=(year>=1978)tabulate province, generate (pr)reg y x1 x2 x3 pr2-pr30(6)经济结构变动的检验方法1:use consumption_china.dta, cleargraph twoway connect c y year, msymbol(circle) msymbol(triangle)reg c yreg c y if year<1992reg c y if year>=1992计算F统计量方法2:gen d=(year>1991)gen yd=y*dreg c y d ydtest d yd第七章工具变量法的stata命令及实例(1)2SLS的stata命令ivregress 2sls depvar [varlist1] (varlist2=instlist)如:ivregress 2sls y x1 (x2=z1 z2)ivregress 2sls y x1 (x2 x3=z1 z2 z3 z4) ,r firstestat firststage,all forcenonrobust (检验弱工具变量的命令)ivregress liml depvar [varlist 1] (varlist2=instlist)estat overid (过度识别检验的命令)*对解释变量内生性的检验(hausman test),缺点:不适合于异方差的情形reg y x1 x2estimates store olsivregress 2sls y x1 (x2=z1 z2)estimates store ivhausman iv ols, constant sigmamore*DWH检验estat endogenous*GMM的过度识别检验ivregress gmm y x1 (x2=z1 z2) (两步GMM)ivregress gmm y x1 (x2=z1 z2),igmm (迭代GMM)estat overid*使用异方差自相关稳健的标准差GMM命令ivregress gmm y x1 (x2=z1 z2), vce (hac nwest[#])(2)实例use grilic.dta,clearsumcorr iq sreg lw s expr tenure rns smsa,rreg lw s iq expr tenure rns smsa,rivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),restat overidivregress 2sls lw s expr tenure rns smsa (iq=med kww),r firstestat overidestat firststage, all forcenonrobust (检验工具变量与内生变量的相关性)ivregress liml lw s expr tenure rns smsa (iq=med kww),r*内生解释变量检验quietly reg lw s iq expr tenure rns smsaestimates store olsquietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww)estimates store ivhausman iv ols, constant sigmamoreestat endogenous (存在异方差的情形)*存在异方差情形下,GMM比2sls更有效率ivregress gmm lw s expr tenure rns smsa (iq=med kww)estat overidivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm*将各种估计方法的结果存储在一张表中quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww)estimates store gmmquietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmmestimates store igmmestimates table gmm igmm第八章短面板的stata命令及实例(1)面板数据的设定xtset panelvar timevarencode country,gen(cntry) (将字符型变量转化为数字型变量)xtdesxtsumxttab varnamextline varname,overlay*实例use traffic.dta,clearxtset state yearxtdesxtsum fatal beertax unrate state yearxtline fatal(2)混合回归reg y x1 x2 x3,vce(cluster id)如:reg fatal beertax unrate perinck,vce(cluster state)estimates store ols对比:reg fatal beertax unrate perinck(3)固定效应xtreg y x1 x2 x3,fe vce(cluster id)xi:reg y x1 x2 x3 i.id,vce(cluster id) (LSDV法)xtserial y x1 x2 x3,output (一阶差分法,同时报告面板一阶自相关)estimates store FD*双向固定效应模型tab year, gen (year)xtreg fatal beertax unrate perinck year2-year7, fe vce (cluster state)estimates store FE_TWtest year2 year3 year4 year5 year6 year7(4)随机效应xtreg y x1 x2 x3,re vce(cluster id) (随机效应FGLS)xtreg y x1 x2 x3,mle (随机效应MLE)xttest0 (在执行命令xtreg, re 后执行,进行LM检验)(5)组间估计量xtreg y x1 x2 x3,be(6)固定效应还是随机效应:hausman testxtreg y x1 x2 x3,feestimates store fextreg y x1 x2 x3,reestimates store rehausman fe re,constant sigmamore (若使用了vce(cluster id),则无法直接使用该命令,解决办法详见P163)estimates table ols fe_robust fe_tw re be, b se (将主要回归结果列表比较)第九章长面板与动态面板(1)仅解决组内自相关的FGLSxtpcse y x1 x2 x3 ,corr(ar1) (具有共同的自相关系数)xtpcse y x1 x2 x3 ,corr(psar1) (允许每个面板个体有自身的相关系数)例题:use mus08cigar.dta,cleartab state,gen(state)gen t=year-62reg lnc lnp lnpmin lny state2-state10 t,vce(cluster state)estimates store OLSxtpcse lnc lnp lnpmin lny state2-state10 t,corr(ar1) (考虑存在组内自相关,且各组回归系数相同)estimates store AR1xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1) (考虑存在组内自相关,且各组回归系数不相同)estimates store PSAR1xtpcse lnc lnp lnpmin lny state2-state10 t, hetonly (仅考虑不同个体扰动性存在异方差,忽略自相关)estimates store HETONL Yestimates table OLS AR1 PSAR1 HETONL Y, b se(2)同时处理组内自相关与组间同期相关的FGLSxtgls y x1 x2 x3,panels (option/iid/het/cor) corr(option/ar1/psar1) igls注:执行上述xtpcse、xtgls命令时,如果没有个体虚拟变量,则为随机效应模型;如果加上个体虚拟变量,则为固定效应模型。
stata上机实验第二讲
例二: use wage2, clear reg lnwage educ tenure exper expersq 1。教育(educ)和工作时间(tenure)对工资的
影响相同。 test educ=tenure 2。工龄(exper)对工资没有影响 test exper 或者 test exper =0 3。检验 educ和 tenure的联合显著性 test educ tenure 或者 test (educ=0) (tenure=0)
在的异方差或自相关问题不敏感,基于稳健 标准差计算的稳健t统计量仍然渐进分布t分布。 因此,在Stata中利用robust选项可以得到异 方差稳健估计量。
约束回归
定义约束条件
constraint define n 条件 约束回归语句
Cnsreg 被解释变量 解释变量, constraints(条
对数 平方项 n次方
指数 交乘项 虽然对函数形式的选择有检验方法,但最好 还是从“经济意义”角度确定。
例题
例一:利用wage2的数据检验明瑟(mincer)工
资方程的简单形式: Ln(wage)=b0+b1*educ+b2*exper +b3*exper^2+ u
例二:利用phillips的数据拟合预期增强的菲
自己练习:为下列变量增加标签
educ:受教育位任期。
为变量值增加标签 例如:为变量marrid添加数值标签marry:
1=married; 0=Unmarried 菜单:Data->Labels->Label values->Define or modify label values Data->Labels->Label values->Assign label values to variable 命令: . label define marry 1 “married” 0 “unmarried" . label values married marry
计量经济学stata上机命令整理
计量经济学上机命令整理实验一edit 打开数据编辑器browse 打开数据浏览器rename 对变量重新命名labelsavedescribe 对数据集简要描述sort 排序例如:list in -10/-1list 显示变量的数值Generate 缩小:gen 生成新的变量后面可以接if条件句Replace 替换append 覆盖Summarize 缩写:su 总结后面可以接if条件句实验二twoway (scatter y x)(connected ey_x x) 在该散点图上,做出条件均值点sc y x||lfit y x 画出线图和散点图Reg y x 做出回归Rename ** y **指原变量名用于修改变量名字graph twoway scatter y x 画出y x 的二维散点图Line y x 做出y x 的线条图egen Ey_x=mean(y),by(x) 求在同一x水平下,求y的均值实验三Regress y x1 x2 ........做多元回归Precict e,re 预测方差Sort e 按照方差排序Cor y x 测试y与x的相关程度Pwcorr y x 也是测试y与x的相关程度Set obs 90 (90为任意一个数字),增加一个或者多个样本值Replace x=980 in 90 为第90个样本值赋值(980为任意一个数字)Predict yhat 预测y的估计值Display invttail(n,p) n为自由度;p为概率(一般为0.025)。
用来求t分布的t 值Display ttail(n,t)知道t值求T<t的右端概率Destring (变量名,可省略),replace ignore("-$") 将其他类型的数据转化为数值型Hist e残差直方图hist e,norm加了一条正态分布线Two connected y x 二维图连线Two connected y x,yline(0) 在y=0处画一条线(也可x=0)Kdensity e,normal 对残差画出密度图Sktest e 利用e的偏锋度做是否符合正态分布的检验gen low=yhat-t*se gen high=yhat+t*se 预测置信区间Twoway lfitci y x 置信区间与回归之间作图实验四(第五章)Gen lny=log(y)生成y的对数Gen lnx=log(x)生成x的对数Drop y或者x 删除变量Predict se,stdp 预测所有的标准误实验五(第六章)虚拟变量Tab quarter,gen(d) quarter代表变量,对变量quarter生成虚拟变量d Gen d1_x=d1*x 或者是(d2,d3,d4与x2,x3,x4)生成交互作用的虚拟变量Reg y x1 x2...d2 d3 d4.....(d1通常省略,常数项)Egen ybar=mean(y) 生成y的均值实验六(第八章:多重共线性)Gen t=0Replace t=1 if x<(或>或>=或<=)数值Test (t=0)(t_x=0)做假设联合检验,求出新的F值Test (lnx2+lnx3=1) 求出新的F检验统计量Cor lnx2-lnx6 求lnx2与lnx3到Lnx6之间的相关程度,找出是否存在多重共线性问题Pcorr lnx2 lnx3-lnx6 也是测量变量之间的相关程度Estat vif 估计方差膨胀因子(方差膨胀因子越大,说明两个此变量与y的共线性越高,应该考虑删除)实验七八(第九十章)Predict e,reGen e2=e^2Est store m1 记录原回归的内容Est tab m1 m2 展示上述记录过的回归内容并作出比较Est tab m1 m2.....,seEstat imtest 怀特检验Estat hettest BP检验Regress y x2 x3...,robust 校正后的怀特检验自相关检验Regress y x...Est store m1Predict e,reSc e obs,yline(0)Tsset obs或者其他变量,用来表示时间变化Dwstat 进行DW检验并查表得出自相关程度Gen rho=1-d/2 rho 代表ρ估计Prais y x,corc (one,two...)括号可接可不接表示从OLS残差中估计ρ Gen dy1=y-l.y*ρ1Gen dx1=y-l.y*ρ1Gen dy2=y-l.y*ρ2Gen dx2=y-l.y*ρ2 (rho=ρ)Replace dy1=sqrt(1-rho^2)*y if ......补充第一个样本值比如ifobs==1958 Replace dx1=sqrt(1-rho^2)*x if .......。
计量经济学stata上机教程
计量经济学stata上机教程2014计量经济学上机教程1Stata操作基础主要内容:1. Stata的特点与功能2. Stata的界面管理3. Stata的命令语法4. 数据处理5. 统计描述、制图与输出结果6. log文档与do文档7. 常用函数8. Stata的帮助系统与学习资源9. 课后练习1. Stata的特点与功能, 将统计功能与计量分析完整地结合起来。
不仅可以实现诸多统计分析方法,比如描述统计、假设检验、方差分析、主成分分析等,而且可以实现多种计量经济模型的估计和检验,包括经典单方程回归模型、方程组模型、微观数据模型(离散选择模型、计数模型、截断模型、归并模型等)、时间序列数据模型(ARMA、VAR、GARCH等)以及面板数据分析。
, 强大的数据处理功能。
, 精致的作图功能。
, 丰富的网络资源。
Stata 12有各种版本,其中尤以SE(特殊版)最为常用。
用户可以在命令栏中输入about命令查看所安装的版本信息。
2--per ml sodium hydroxide [c (NaOH) =1.000 mol/L] potassium hydrogen phthalate standard solution of quality g. ... After dilution to 1000mL. 1.1.2 0.000 35mol/L iodine solution: dissolve 20 g of potassium iodide in Cheng You (30~40) 500mL mL water bottle; 5mL iodine stock solution, and then diluted to scale and mix. This solution every other day to prepare. 1.1.3 acetate buffer (PH5.3): dissolve 87g sodium acetate (CH3COONa • 3H2O) 400mL water and 10.5mL in glacial acetic acid is dissolved in a small amount of water. volume and then mixing the two together and add water to 500mL, using regulation to PH5.3. 1.1.40.5mol/L sodium chloride: 14.5 g of sodium chloride dissolved in boiled water, and constant volume to 500mL. 1.1.5 soluble starch: pure before use should determine its value. Accurate said take amount starch (equivalent to dry state 1g) Yu 250mL high type beaker in the, added80~90mL distilled water, Yu asbestos online in constantly mixing Xia quickly heating to boiling, then with fire keep micro-boiling 3min, stamped and cooling to at room temperature, transfer to 100mL capacity bottle in the, into 40 ? water bath in the makes solution reached this temperature, and in 40 ? Shi with distilled water (40 ?) set capacity, this starch solution placed 40 ? thermostat water bath in the for determination samples with. 1.2 the instrument a) constant temperaturewater bath: (40+-0.2) 0C. B) spectrophotometer. 1.3 procedures 1.3.1 preparation of samples: weighing 50mL 10G sample不同的版本对于样本容量、变量个数、矩阵阶数等有着不同的限制,用户可以通过以下命令了解和改变这些设定:memory 显示目前存储空间query memory 查看目前实际设定的存储空间set memory 10m 设定存储空间的大小set matsize 250 设定最大矩阵阶数set maxvar 2500 设定最大变量数(最小设定为2048)help limits 显示Stata的各种极限 2. Stata的界面管理, 首次打开Stata,将会出现一个询问是否进行更新的对话框。
计量经济学stata上机教程
计量经济学stata上机教程计量经济学stata上机教程2014计量经济学上机教程1Stata操作基础主要内容:1. Stata的特点与功能2. Stata的界面管理3. Stata的命令语法4. 数据处理5. 统计描述、制图与输出结果6. log文档与do文档7. 常用函数8. Stata的帮助系统与学习资源9. 课后练习1. Stata的特点与功能, 将统计功能与计量分析完整地结合起来。
不仅可以实现诸多统计分析方法,比如描述统计、假设检验、方差分析、主成分分析等,而且可以实现多种计量经济模型的估计和检验,包括经典单方程回归模型、方程组模型、微观数据模型(离散选择模型、计数模型、截断模型、归并模型等)、时间序列数据模型(ARMA、VAR、GARCH等)以及面板数据分析。
, 强大的数据处理功能。
, 精致的作图功能。
, 丰富的网络资源。
Stata 12有各种版本,其中尤以SE(特殊版)最为常用。
用户可以在命令栏中输入about命令查看所安装的版本信息。
2--per ml sodium hydroxide [c (NaOH) =1.000 mol/L] potassium hydrogen phthalate standard solution of quality g. ... After dilution to 1000mL. 1.1.2 0.000 35mol/L iodine solution: dissolve 20 g of potassium iodide in Cheng You (30~40) 500mL mL water bottle; 5mL iodine stock solution, and then diluted to scale and mix. This solution every other day to prepare. 1.1.3 acetate buffer (PH5.3): dissolve 87g sodium acetate (CH3COONa ? 3H2O) 400mL water and 10.5mL in glacial acetic acid is dissolved in a small amount of water. volume and then mixing the two together and add water to 500mL, using regulation to PH5.3.1.1.40.5mol/L sodium chloride: 14.5 g of sodium chloride dissolved in boiled water, and constant volume to 500mL. 1.1.5 soluble starch: pure before use should determine its value. Accurate said take amount starch (equivalent to dry state 1g) Yu 250mL high type beaker in the, added80~90mL distilled water, Yu asbestos online in constantly mixing Xia quickly heating to boiling, then with fire keep micro-boiling 3min, stamped and cooling to at room temperature, transfer to 100mL capacity bottle in the, into 40 ? water bath in the makes solution reached this temperature, and in 40 ? Shi with distilled water (40 ?) set capacity, this starch solution placed 40 ? thermostat water bath in the for determination samples with. 1.2 the instrument a) constant temperaturewater bath: (40+-0.2) 0C. B) spectrophotometer. 1.3 procedures 1.3.1 preparation of samples: weighing 50mL 10G sample不同的版本对于样本容量、变量个数、矩阵阶数等有着不同的限制,用户可以通过以下命令了解和改变这些设定:memory 显示目前存储空间query memory 查看目前实际设定的存储空间set memory 10m 设定存储空间的大小set matsize 250 设定最大矩阵阶数set maxvar 2500 设定最大变量数(最小设定为2048)help limits 显示Stata的各种极限 2. Stata的界面管理, 首次打开Stata,将会出现一个询问是否进行更新的对话框。
stata 上机
使用已保存的Stata数据 1 use “c:\myfile\mydata.dta”, clear 2 sysuse auto (录入系统数据) 3 webuse sorghum (录入网络数据) 手动录入 Input [type] varname [[type] varname]…… Input str10 name age Name age 1. mike 22 2. bruce 28 …… end
命令格式2: clustermat singlelinkage matname [,options] 比如: cluster singlelinkage x1 x2 x3, name(l2slnk) cluster single a1-a60, measure(matching) name(slink) cluster s x*, measure(L(1.5)) clustermat singlelinkage D, clear 其中,clear(将内存信息替换为聚类信息)
如果多个变量为同一类型,可以用括号括起来 Input str10 (name class) double score 从其他文件拷贝和粘贴 Excel或其他数据表直接copy和paste 从其他文件导入 Insheet [varlist] using filename [,option] Insheet using c:\data1.txt
webuse metabolic manova y1 y2 = group test group1 versus group2,3,4 manovatest, showorder matrix c1= (3,-1,-1,-1,0) manovatest, test(c1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章第二题:1. 建立完成的教育年数(ED )对到最近大学的距离(Dist )的回归:. reg ed dist, robust斜率估计值是:-0.0732. reg ed dist bytest female black hispanic incomehi ownhome dadcoll cue80 stwmfg80,robustDist 对ED 的效应估计是:-0.0323. 系数下降50%,存在很大差异,(1)中回归存在遗漏变量偏差4. di e(r2_a)(可看到调整后的R2)第一问中=0.0074 调整的2R =0.00718796_cons 13.95586 .0378112 369.09 0.000 13.88172 14.02999dist -.0733727 .0134334 -5.46 0.000 -.0997101 -.0470353ed Coef. Std. Err. t P>|t| [95% Conf. Interval]RobustRoot MSE = 1.8074R-squared = 0.0074Prob > F = 0.0000F( 1, 3794) = 29.83Linear regression Number of obs = 3796. reg ed dist , robust2R第二问中=0.2788 2R = 0.27693235可以得到第二问中的拟合效果要优于第一问。
第二问中相似的原因:因为n 很大。
5. Dadcoll 父亲有没有念过大学:系数为正(0.6961324)衡量父亲念过大学的学生接受的教育年数平均比其父亲没有年过大学的学生多。
.0232052-.0517777 1)原因:这些参数在一定程度上构成了上大学的机会成本。
2)它们的系数估计值的符号应该如此。
当Stwmfg80增加时,放弃的工资增加,所以大学入学率降低了;因而Stwmfg80的系数对应为负。
而当Cue80增加时,人们会发现找工作很困难,这降低上大学的机会成本,所以平均的大学入学率就会增加;因而Cue80的系数对应为正。
7.带入计算即可(14.75)8.同7.(14.69)第七章第二题1. . reg course_eval beauty,robust95%置信区间见上表。
2.2R_cons 3.998272 .0253493 157.73 0.000 3.948458 4.048087beauty .1330014 .0323189 4.12 0.000 .0694908 .1965121course_eval Coef. Std. Err. t P>|t| [95% Conf. Interval]RobustRoot MSE = .54545R-squared = 0.0357Prob > F = 0.0000F( 1, 461) = 16.94Linear regression Number of obs = 463Linear regression Number of obs = 463 F( 7, 455) = 14.43 Prob > F = 0.0000 R-squared = 0.1556 Root MSE = .51377Robustcourse_eval Coef. Std. Err. t P>|t| [95% Conf. Interval]age -.0019545 .0026218 -0.75 0.456 -.0071068 .0031978 beauty .1592092 .0306846 5.19 0.000 .098908 .2195104 minority -.1694282 .067891 -2.50 0.013 -.3028471 -.0360093 female -.1832345 .0521947 -3.51 0.000 -.2858071 -.0806619 onecredit .633 .1077655 5.87 0.000 .4212201 .8447798 intro .0079488 .0565469 0.14 0.888 -.1031766 .1190742 nnenglish -.2438402 .0958959 -2.54 0.011 -.432294 -.0553863 _cons 4.16853 .1390349 29.98 0.000 3.8953 4.44176由P值得出age 及intro 变量均不显著。
所以应该去掉。
Source SS df MS Number of obs = 463F( 5, 457) = 16.71Model 21.9857702 5 4.39715404 Prob > F = 0.0000Residual 120.25285 457 .263135339 R-squared = 0.1546Adj R-squared = 0.1453Total 142.23862 462 .307875801 Root MSE = .51297course_eval Coef. Std. Err. t P>|t| [95% Conf. Interval]minority -.1647853 .0756893 -2.18 0.030 -.3135275 -.0160431female -.1741755 .049113 -3.55 0.000 -.2706909 -.0776601onecredit .6413254 .1063165 6.03 0.000 .4323955 .8502554beauty .1660434 .0306266 5.42 0.000 .1058569 .2262299nnenglish -.2480077 .1052349 -2.36 0.019 -.4548121 -.0412033_cons 4.072006 .032976 123.48 0.000 4.007203 4.13681变量均显著合理的置信区间应为(0 .1058569 0.2262299)第八章第二题:1.reg course_eval beauty intro onecredit female minority nnenglish,r2. gen age2=age*age. reg course_eval age age2,beauty intro onecredit female minority nnenglish ,r由age 与age2 的p值可看出均大于0.05,因此不能拒绝原假设,即没有充分的证据显示age 对course_eval的效应是非线性的,也没有证据显示Age对Course_Eval 有影响。
3.生成交互项:generate a= female* beauty.regress course_eval beauty intro onecredit female minority nnenglish fb,robustfemale与Beauty的交互作用的变量后,其P值为0.000变量是显著的,即有充分证据表明性别不同时,Beauty的效应之差存在。
4.. sum beautyVariable Obs Mean Std. Dev. Min> Max>beauty 463 4.75e-08 .7886477 -1.450494> 1.970023可知:手术前的beauty为-0.7886,术后为0.7886,上升了0.231 * (2 * 0.79) = 0.37.课程提高的95%置信区间为(0.231*1.96*0.048) *(2 *0.79) ,即(0.22 ,0.51)5.计算略第八章第四题:keep if country_name != "Malta"reg growth tradeshare yearsschool //回归1est store m1gen ly=ln( yearsschool )reg growth tradeshare lyest store m2gen lr=ln( rgdp60)reg growth tradeshare ly rev_coups assasinations lrest store m3gen tly= tradeshare* lyreg growth tradeshare ly rev_coups assasinations lr tlyest store m4gen t2= tradeshare* tradesharegen t3= tradeshare* t2reg growth tradeshare t2 t3 ly rev_coups assasinations lrest store m5outreg2 [m1 m2 m3 m4 m5] using myfile , word replace see或者分步:首先drop in 651.. reg growth tradeshare yearsschoolSource SS df MS Number of obs = 64 F( 2, 61) = 5.84 Model 33.3764711 2 16.6882356 Prob > F = 0.0048 Residual 174.431689 61 2.85953588 R-squared = 0.1606 Adj R-squared = 0.1331 Total 207.80816 63 3.29854222 Root MSE = 1.691growth Coef. Std. Err. t P>|t| [95% Conf. Interval]tradeshare 1.897823 .9360473 2.03 0.047 .0260808 3.769565 yearsschool .2429753 .083702 2.90 0.005 .0756027 .4103478 _cons -.1222363 .6626687 -0.18 0.854 -1.447324 1.2028522.. gene ly=ln( yearsschool ). reg growth tradeshare lySource SS df MS Number of obs = 64F( 2, 61) = 12.29Model 59.6761976 2 29.8380988 Prob > F = 0.0000Residual 148.131962 61 2.42839283 R-squared = 0.2872Adj R-squared = 0.2638Total 207.80816 63 3.29854222 Root MSE = 1.5583growth Coef. Std. Err. t P>|t| [95% Conf. Interval]tradeshare 1.748979 .8599768 2.03 0.046 .0293485 3.468608ly 1.016292 .2230901 4.56 0.000 .5701953 1.462388_cons -.185739 .5642853 -0.33 0.743 -1.314097 .94261913. gen lr=ln( rgdp60). reg growth tradeshare ly rev_coups assasinations lrSource SS df MS Number of obs = 64F( 5, 58) = 9.61Model 94.1730235 5 18.8346047 Prob > F = 0.0000Residual 113.635136 58 1.95922649 R-squared = 0.4532Adj R-squared = 0.4060Total 207.80816 63 3.29854222 Root MSE = 1.3997growth Coef. Std. Err. t P>|t| [95% Conf. Interval]tradeshare 1.10353 .8331579 1.32 0.191 -.5642168 2.771277ly 2.161291 .3626545 5.96 0.000 1.435359 2.887223rev_coups -2.299537 1.004465 -2.29 0.026 -4.310193 -.2888816assasinations .2277195 .4336512 0.53 0.602 -.6403278 1.095767lr -1.621135 .3985046 -4.07 0.000 -2.418829 -.8234416_cons 11.74591 2.919804 4.02 0.000 5.901285 17.590534. gen tly= tradeshare* ly. reg growth tradeshare ly rev_coups assasinations lr tlySource SS df MS Number of obs = 64F( 6, 57) = 8.00Model 94.9878003 6 15.8313001 Prob > F = 0.0000Residual 112.82036 57 1.97930455 R-squared = 0.4571Adj R-squared = 0.3999Total 207.80816 63 3.29854222 Root MSE = 1.4069growth Coef. Std. Err. t P>|t| [95% Conf. Interval]tradeshare 1.882807 1.475292 1.28 0.207 -1.071415 4.837029ly 2.524742 .6736203 3.75 0.000 1.175841 3.873644rev_coups -2.35021 1.012683 -2.32 0.024 -4.378073 -.3223463assasinations .2242049 .435902 0.51 0.609 -.6486738 1.097084lr -1.641397 .4017843 -4.09 0.000 -2.445956 -.8368374tly -.6900855 1.075573 -0.64 0.524 -2.843883 1.463712_cons 11.49852 2.959949 3.88 0.000 5.57132 17.425715.gen t2= tradeshare* tradeshare. gen t3= tradeshare* t2. regress growth tradeshare t2 t3 ly rev_coups assasinations lrSource SS df MS Number of obs = 64 F( 7, 56) = 7.13 Model 97.8981719 7 13.9854531 Prob > F = 0.0000 Residual 109.909988 56 1.96267836 R-squared = 0.4711 Adj R-squared = 0.4050 Total 207.80816 63 3.29854222 Root MSE = 1.401growth Coef. Std. Err. t P>|t| [95% Conf. Interval]tradeshare -5.701945 9.755116 -0.58 0.561 -25.24379 13.8399 t2 8.487876 17.43505 0.49 0.628 -26.43872 43.41448 t3 -2.759735 9.249782 -0.30 0.767 -21.28927 15.76981 ly 2.133188 .3669534 5.81 0.000 1.398092 2.868284 rev_coups -2.035454 1.025946 -1.98 0.052 -4.09067 .0197616 assasinations .1021111 .4435059 0.23 0.819 -.7863379 .9905601 lr -1.584348 .4079428 -3.88 0.000 -2.401556 -.7671405 _cons 12.92906 3.098466 4.17 0.000 6.722087 19.136031.散点图----------twoway (scatter growth yearsschool)2.预测growth回归1预测Growth 的增长为0.243×(6-4)=0.486回归2预测Growth 的增长为1.016×(ln6-ln4)=0.412。