计量经济学Stata软件应用2---【Stata软件之回归分析】--2次课
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结果显示“工资方程1.dta”数据文件包含1225个样本和11个 变 量;11个变量的定义及说明见第3列。
三、简单回归分析的Stata软件操作实例
3、变量的描述性统计分析。对于定量变量,使用summarize 命令:su age edu exp expsq wage lnwage,得到以下运行结 果,保存该运行结果;
三、简单回归分析的Stata软件操作实例
Contains data from D:\´²¿Î×ÊÁÏ\ÖÜÝíµÄÉÏ¿Î×ÊÁÏ\Êý¶Ý\¡¶ÖØÒª¡¿\¡¶µÆÁ¿¶µÃѧÈíµþÑ¦Ñ > ÿεþ¡¿\10649289\stata10\¹¤×Ê·´³Ð1.dta obs: 1,225 vars: 11 25 Aug 2009 08:38 size: 58,800 (99.4% of memory free) variable name age female married edulevel edu exp expsq health migrant wage more storage type float float float float float float float float float float display format %9.0g %9.0g %9.0g %9.0g %9.0g %9.0g %9.0g %9.0g %9.0g %9.0g value label variable label age in years 1:female; 0:male 1:married; 0:unmarried 1:primary; 2:junior; 3:senior; 4:college years of education years of work experience: age-edu-6 exp^2 1:bad; 2:good; 3:very good 1:migrant worker; 0:local worker hourly wage
Variable age edu exp expsq wage lnwage Obs 1225 1225 1225 1225 1225 1225 Mean 36.79755 8.992653 21.8049 613.9776 7.1255 1.808352 Std. Dev. 10.67631 2.719068 11.77443 548.3072 4.766828 .5307399 Min 16 0 0 0 1.25 .2231435 Max 60 19 50 2500 37.5 3.624341
三、简单回归分析的Stata软件操作实例
实验 1 简单回归分析:教育对工资的影响 劳动经济学中经常讨论的一个问题是劳动者工资的决定。不 难想象,决定工资的因素有很多,例如能力、性别、工作经验、 教育水平、行业、职业等。在这里仅考虑其中一种因素:教育 水平,建立如下计量模型: wage 0 1edu u,,,,,,,,,,,,,,,,,, ,,,,,,, (3.1) 其中,wage 为被解释变量,表示小时工资,单位为元;edu 为解释变量,表示受教育年限,即个人接受教育的年数,单 位为年;u为随机误差项。假定模型(3.1)满足简单回归模型的 ˆ ˆ 全部5条基本假定,这样 0 , 1 的OLS估计量 0 , 1 将是最佳线性 无偏估计量。请根据表S-2中给出的数据采用Stata软件完成上 述模型的估计等工作。
(0.4589) (0.0488)
即如果受教育年限增加1年,平均来说小时工资会增加0.39元。
三、简单回归分析的Stata软件操作实例
Source Model Residual Total wage edu _cons SS 1402.97461 26409.5445 27812.5191 Coef. .3937442 3.584695 df 1 1223 1224 MS 1402.97461 21.5940675 22.7226463 t 8.06 7.81 P>|t| 0.000 0.000 Number of obs = F( 1, 1223) Prob > F R-squared Adj R-squared Root MSE = = = = = 1225 64.97 0.0000 0.0504 0.0497 4.6469
三、简单回归分析的Stata软件操作实例
5、生成新变量 z 为上一个回归的拟合值,生成新变量 u 为 上一个回归的残差;然后根据 u 对数据进行从小到大的排 序,并列出 u 最小的5个观测。 命令如下: predict z (生成拟合值) predict u, residual ( 生成残差 ) sort u (根据 u 对数据从小到大排序) list wage z u in 1/5 (列出 u 最小的5个观测值以及对应的实
40 0
0
10
20
30
5
10 years of education Fitted values
15
20
hourly wage
三、简单回归分析的Stata软件操作实例
7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样 本。命令如下: reg wage edu if age<=30 得到以下运行结果,保存该运行结果;
二、简单回归分析的Stata基本命令
regress y x 以 y 为被解释变量,x 为解释变量进行普通最小二乘 (OLS)回归。regress命令可简写为横线上方的三个字 母reg。 regress y x, noconstant y 对 x 的回归,不包含截距项 (constant),即过原点回归。 predict z 根据最近的回归生成一个新变量 z,其值等于每一个观测 ˆ 的拟合值(即 yi)。 predict u, residual 根据最近的回归生成一个新变量 u,其值等于每一个观测 ˆ 的残差(即 ei yi yi )。
三、简单回归分析的Stata软件操作实例
1、打开数据文件。直接双击“工资方程1.dta”文件;或者点 击Stata窗口工具栏最左侧的Open键,然后选择“工资方程 1.dta”即可;或者先复制Excel表S-2中的数据,再点击Stata 窗口工具栏右起第4个Data Editor键,将数据粘贴到打开的 数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左 起第二个Save键保存数据,保存时需要给数据文件命名。 2、给出数据的简要描述。使用describe命令,简写为: des 得到以下运行结果;
第1列:变量名; 第2列:观测数; 第3列:均值; 第4列:标准差; 第5列:最小值; 第6列:最大值。
三、简单回归分析的Stata软件操作实例
4、wage对edu的OLS回归。使用regress命令: reg wage edu,得到以下运行结果,保存该运行结果;
Source Model Residual Total wage edu _cons SS 1402.97461 26409.5445 27812.5191 Coef. .3937442 3.584695 df 1 1223 1224 MS 1402.97461 21.5940675 22.7226463 t 8.06 7.81 P>|t| 0.000 0.000 Number of obs = F( 1, 1223) Prob > F R-squared Adj R-squared Root MSE = = = = = 1225 64.97 0.0000 0.0504 0.0497 4.6469
Std. Err. .0488491 .4589088
[95% Conf. Interval] .2979069 2.684359 .4895815 4.485031
(2) 表左上方区域为方差分析表。第2列从上到下依次为回归平方和(SSE)、 残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1, n-k-1=1225-1-1=1223,n-1=1225-1=1224;第4列为均方和(MSS),由各项 平方和除以相应的自由度得到。 (3) 表右上方区域给出了样本数(Number of obs)、判定系数(R-squared)、 调整的判定系数(Adj R-squared)、F统计量的值、回归方程标准误或均方 根误(Root MSE, ˆ 或 S.E.) 以及其他一些统计量的信息。 上述回归分析的菜单操作实现:Statistics→Linear models and related→ Linear regression→弹出对话框,在Dependent Variable选项框中选择或键 入wage,在Independent Variables选项框中选择或键入edu→点击OK即可
计量经济软件应用
——Stata软件实验之一元、 多元回归分析
内容概要
一、实验目的 二、简单回归分析的Stata基本命令 三、简单回归分析的Stata软件操作实例 四、多元回归分析的Stata基本命令 五、多元回归分析的Stata软件操作实例
一、实验目的:
掌握运用Stata软件进行简单回归分析以及 多元回归分析的操作方法和步骤,并能看懂 Stata软件运行结果。
际样本观测值和拟合值)
wage 1. 2. 3. 4. 5. 2.455357 1.785714 3 2.380952 1.25 edu 14 11 14 12 9 z 9.097115 7.915882 9.097115 8.309626 7.128393 u -6.641757 -6.130167 -6.097114 -5.928673 -5.878393
Source Model Residual Total wage edu _cons SS 369.712827 6786.63095 7156.34378 Coef. .4145793 2.760707 df 1 363 364 MS 369.712827 18.695953 19.6602851 t 4.45 2.85 P>|t| 0.000 0.005 Number of obs = F( 1, 363) Prob > F R-squared Adj R-squared Root MSE = = = = = 365 19.78 0.0000 0.0517 0.0490 4.3239
Std. Err. .0488491 .4589088
[95% Conf. Interval] .2979069 2.684359 .4895815 4.485031
(1) 表下方区域为基本的回归结果。第1列依次为被解释变量wage,解释 变量edu,截距项constant;第2列回归系数的OLS估计值;第3列回归系 数的标准误;第4列回归系数的 t 统计量值; 写出样本回归方程为: wage 3.5847 0.3937edu ˆ
即对于观测 1,小时工资的实际观测值(wage)为2.46,拟合值(z)为 9.10,残差(u)为-6.64。
三、简单回归分析的Stata软件操作实例
6、画出以wage为纵轴,以edu为横轴的散点图,并加入样本 回归线。命令如下: graph twoway lfit wage edu || scatter wage edu 得到以下运行结果,保存该运行结果;
二、简单回归分析的Stata基本命令
简单线性回归模型 ( simple linear regression model ) 指 只有一个解释变量的回归模型。如: y 0 1 x u
其中,y 为被解释变量,x 为解释变量,u 为随机误差项, 表示除 x 之外影响 y 的因素; 1称为斜率参数或斜率系 数,0 称为截距参数或截距系数,也称为截距项或常数项。 简单线性回归模型的一种特殊情况: y 1x u 即假定截距系数 0 0 时,该模型被称为过原点回归;过 原点回归在实际中有一定的应用,但除非有非常明确的理 论分析表明 0 0 ,否则不宜轻易使用过原点回归模型。