Stata软件之回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

wage
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
edu _cons
.3937442 .0488491 3.584695 .4589088
8.06 0.000 7.81 0.000
.2979069 2.684359
.4895815 4.485031
(2) 表左上方区域为方差分析表。第2列从上到下依次为回归平方和(SSE)、
第3页,共39页。
二、简单回归分析的Stata基本命令
简单线性回归模型 ( simple linear regression model ) 指
只有一个解释变量的回归模型。如:
y 0 1x u 其中,y 为被解释变量,x 为解释变量,u 为随机误差项, 表数,示除称x为之截外距影参响数y或的截因距素系;数,称也为1称斜为率截参距数项或或斜常率数系项。 简单线0性回归模型的一种特殊情况:
Contains data from D:\½²¿Î×ÊÁÏ\ÖÜÝíµÄÉÏ¿Î×ÊÁÏ\Êý¾Ý\¡¾ÖØÒª¡¿\¡¾¼ÆÁ¿¾­¼ÃѧÈí¼þÓ¦Ó
> ÿμþ¡¿\10649289\stata10\¹¤×Ê·½³Ì1.dta
obs:
1,225
vars:
11
25 Aug 2009 08:38
predict u, residual ( 生成残差 )
sort u (根据 u 对数据从小到大排序) list wage z u in 1/5 (列出 u 最小的5个观测值以及对应的实 际样本观测值和拟合值)
wage edu
z
u
1. 2.455357
14 9.097115 -6.641757
2. 1.785714
26409.5445 1223 21.5940675
27812.5191 1224 22.7226463
Number of obs =
F( 1, 1223) =
Prob > F
=
R-squared
=
Adj R-squared =
Root MSE
=
1225 64.97 0.0000 0.0504 0.0497 4.6469
调整的判定系数(Adj R-squared)、F统计量的值、回归方程标准误或均方
根 误上(R述oo回t 归M分SE析,的菜或ˆ 单S操.E.作) 以实及现其:S他ta一tis些tic统s→计Li量nea的r m信od息els。and related→
Linear regression→弹出对话框,在Dependent Variable选项框中选择或键
Root MSE
=
365 19.78 0.0000 0.0517 0.0490 4.3239
wage
Coef.
edu
.4145793
写出样本_回con归s 方程2.为760:707
Std. Err.
.0932286 .9687986
t
4.45 2.85
P>|t|
0.000 0.005
[95% Conf. Interval]
残差平方和(SSR)和总离差平方和(SST);第3列为自由度,分别为k=1,
n-k-1=1225-1-1=1223,n-1=1225-1=1224;第4列为均方和(MSS),由各项
平方和除以相应的自由度得到。
(3) 表右上方区域给出了样本数(Number of obs)、判定系数(R-squared)、
的残差(即
)。
ei yi yˆi
第5页,共39页。
三、简单回归分析的Stata软件操作实例
实验 1 简单回归分析:教育对工资的影响 劳动经济学中经常讨论的一个问题是劳动者工资的决定。不
难想象,决定工资的因素有很多,例如能力、性别、工作经验、 教育水平、行业、职业等。在这里仅考虑其中一种因素:教育 水平,建立如下计量模型:
size:
58,800 (99.4% of memory free)
storage display variable name type format
value label
variable label
age female married edulevel
edu exp
expsq health migrant wage
11 7.915882 -6.130167
3.
3
14 9.097115 -6.097114
4. 2.380952
12 8.309626 -5.928673
即对于5观. 测 1,1.2小5 时工9 资7的.1实283际93 观测-5.值878(3w93age)为2.46,拟合值(z)为
9.10,残差(u)为-6.64。
窗口工具栏右起第4个Data Editor键,将数据粘贴到打开的 数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左 起第二个Save键保存数据,保存时需要给数据文件命名。
2、给出数据的简要描述。使用describe命令,简写为: des 得到以下运行结果;
第7页,共39页。
三、简单回归分析的Stata软件操作实例
入wage,在Independent Variables选项框中选择或键入edu→点击OK即可
第11页,共39页。
三、简单回归分析的Stata软件操作实例
5、生成新变量 z 为上一个回归的拟合值,生成新变量 u 为 上一个回归的残差;然后根据 u 对数据进行从小到大的排
序,并列出 u 最小的5个观测。 命令如下: predict z (生成拟合值)
Source
Model Residual
Total
SS
df
MS
1402.97461
1 1402.97461
26409.5445 1223 21.5940675
27812.5191 1224 22.7226463
Number of obs =
F( 1, 1223) =
Prob > F
=
R-squared
1225 1225 1225 1225 1225
36.79755 8.992653
21.8049 613.9776
7.1255
10.67631 2.719068 11.77443 548.3072 4.766828
16 0 0 0
1.25
lnwage
1225 1.808352 .5307399
第1列:变量名; 第2列:观测数;
第3列:均值; 第4列:标准差;
第5列:最小值; 第6列:最大值。
.2231435
Max
60 19 50 2500 37.5
3.624341
第9页,共39页。
三、简单回归分析的Stata软件操作实例
4、wage对edu的OLS回归。使用regress命令:
reg wage edu,得到以下运行结果,保存该运行结果;
第8页,共39页。
三、简单回归分析的Stata软件操作实例
3、变量的描述性统计分析。对于定量变量,使用summarize 命令:su age edu exp expsq wage lnwage,得到以下运行结
果,保存该运行结果;
Variable
Obs
Mean Std. Dev.
Min
age edu exp expsq wage
其中,wage 为被解释w变a量ge,表0示小1时ed工u 资u,,,单,,,位,,,为,,元,,,;,,,e,d,,u,,,,,, (3.1)
为解释变量,表示受教育年限,即个人接受教育的年数,单
位为年;u为随机误差项。假定模型(3.1)满足简单回归模型的
全部5条基本假定,这样 的OLS估计量 将是最佳线性
母reg。
➢ regress y x, noconstant
y 对 x 的回归,不包含截距项 (constant),即过原点回归。
➢ predict z
根据最近的回归生成一个新变量 z,其值等于每一个观测
的拟合值(即 )。
➢ predict u, residyuˆai l
根据最近的回归生成一个新变量 u,其值等于每一个观测
第12页,共39页。
三、简单回归分析的Stata软件操作实例
6、画出以wage为纵轴,以edu为横轴的散点图,并加入样本 回归线。命令如下:
graph twoway lfit wage edu || scatter wage edu 得到以下运行结果,保存该运行结果;
40
30
20
10
0
0
5
10
15
wagˆe 3.5847 0.3937edu
即如果受教育年限增加1年,平均来说(0小.4时58工9资) (会0增.0加4808.3)9元。
第10页,共39页。
三、简单回归分析的Stata软件操作实例
Source
Model Residual
Total
SS
df
MS
1402.97461
1 1402.97461
即假定截距系数
时,y该模型1x被称u 为过原点回归;过
原点回归在实际中有一0 定0的应用,但除非有非常明确的理
论分析表明
,否则不宜轻易使用过原点回归模型。
0 0
第4页,共39页。
二、简单回归分析的Stata基本命令
➢ regress y x
以 y 为被解释变量,x 为解释变量进行普通最小二乘
(OLS)回归。regress命令可简写为横线上方的三个字
无偏估计量。请根据表S-2中给0, 出1 的数据采用Stataˆ软0 , 件ˆ1 完成上 述模型的估计等工作。
第6页,共39页。
三、简单回归分析的Stata软件操作实例
1、打开数据文件。直接双击“工资方程1.dta”文件;或者点 击Stata窗口工具栏最左侧的Open键,然后选择“工资方程 1.dta”即可;或者先复制Excel表S-2中的数据,再点击Stata
more
float float float float
%9.0g %9.0g %9.0g %9.0g
float %9.0g float %9.0g
float float float float
%9.0g %9.0g %9.0g %9.0g
age in years 1:female; 0:male 1:married; 0:unmarried 1:primary; 2:junior; 3:senior;
=
Adj R-squared =
Root MSE
=
1225 64.97 0.0000 0.0504 0.0497 4.6469
wage
பைடு நூலகம்
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
edu
.3937442 .0488491
8.06 0.000
.2979069
_cons
3.584695 .4589088
7.81 0.000
2.684359
(1) 表下方区域为基本的回归结果。第1列依次为被解释变量wage,解释
变量edu,截距项constant;第2列回归系数的OLS估计值;第3列回归系
数的标准误;第4列回归系数的 t 统计量值;
写出样本回归方程为:
.4895815 4.485031
20
years of education
Fitted values
hourly wage
第13页,共39页。
三、简单回归分析的Stata软件操作实例
7、wage对edu的OLS回归,只使用年龄小于或等于30岁的样 本。命令如下:
reg wage edu if age<=30
得到以下运行结果,保存该运行结果;
计量经济软件应用
——Stata软件实验之一元、 多元回归分析
第1页,共39页。
内容概要
一、实验目的
二、简单回归分析的Stata基本命令
三、简单回归分析的Stata软件操作实例
四、多元回归分析的Stata基本命令 五、多元回归分析的Stata软件操作实例
第2页,共39页。
一、实验目的:
掌握运用Stata软件进行简单回归分析以及 多元回归分析的操作方法和步骤,并能看懂 Stata软件运行结果。
4:college years of education years of work experience:
age-edu-6 exp^2 1:bad; 2:good; 3:very good 1:migrant worker; 0:local worker hourly wage
结果显示“工资方程1.dta”数据文件包含1225个样本和11个变 量;11个变量的定义及说明见第3列。
Source
Model Residual
Total
SS
369.712827 6786.63095
7156.34378
df
MS
1 369.712827 363 18.695953
364 19.6602851
Number of obs =
F( 1, 363) =
Prob > F
=
R-squared
=
Adj R-squared =
相关文档
最新文档