计量经济学Stata软件应用3---【【Stata软件回归分析应用之模型预测】】--1次课
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
值;并且进行样本外预测,加入stdf、ci 等选项后可得到样
本外预测值的标准误和置信水平为95%的置信区间。
键入命令:adjust attend=90 homework=90 entry=90, stdf ci
. adjust attend=90 homework=90 entry=90,stdf ci
All
xb
57.6662
Key: xb = Linear Prediction
结果被解释变量学生英语期末成绩 (final) 的预测值为 57.6662。
Stata软件操作实例
2、预测。如果想得到attend=90、homework=90、entry=90
的学生的期末成绩,须在adjust命令中指定各解释变量的取
模型的预测问题
区间预测:区间预测方法就是预测 Y0 基本上是
(以 1 a 95%或99% 的可能性)在一个区间范围内取值,该
区间就称为Y0的置信区间(预测区间),置信区间是以Y0的 点预测值 Yˆ0 为中心的一个区间,表示为:
Yˆ0 ta S(e0 ) Y0 Yˆ0 ta S(e0 )
对于多元线性回归模型:
y 0 1x1 2x2 k xk u
regress y x1 x2…xk
y 对 x1, x2, …, xk 的回归。regress命令可简写为reg;
adjust [ x1 x1 x2 x2 xk xk] [, option] 根据最近的回归得到当解释变量取特定值(即 x1 x1,x2 x2, xk xk ) 时被解释变量的预测值。如果不指定解释变量的取值,表示 根据最近的回归得到在所有解释变量均等于其样本均值时被 解释变量的预测值。Option是选择项,可根据需要选择。常用 的选择项有:stdf 表示显示样本外预测的标准误;ci 表示显示 预测值的置信区间;level( ) 用于指定置信区间的置信水平,如 level(90) 表示90%置信水平,level(99) 表示99%置信水平,如果 仅输入ci 而未指定置信水平,则缺省表示指定95%置信水平。
Number of obs = 674
F( 3, 670) = 47.47
Prob > F
= 0.0000
R- squa red
= 0.1753
Adj R-squared = 0.1716
Root MSE
= 12.901
fin al
atte nd ho mewo rk
ent ry _co ns . adjust
区间预测方法就是预测y0基本上是的可能性在一个区间范围内取值该区间就称为y0的置信区间预测区间置信区间是以y0的点预测值为中心的一个区间表示为
计量经济软件应用
——Stata软件实验回归分析应 用之模型预测
实验目的:
掌握回归模型预测的方法及相应 的Stata软件操作方法。
知识点:
模型的预测问题 已建立二元线性回归模型:
Key: xb
= Linear Prediction
std f
= Standard Error (forecast)
[lb , ub] = [95% Prediction Interval]
结果显示,满足上述条件的学生期末成绩的点预测值为
70.683,样本外预测误差的标准误为12.9617,置信水平为
2
2
其中预测误差 e0 的样本标准差为:
(对于一元线性回归模型)
S (e0 )
ˆ
2
1
1 n
(X0 X )2
i
(Xi
X
)2
(对于多元线性回归模型)
S (e0 ) ˆ 2 1 X 0 ( X X )1 X 0
回归模型预测的Stata基本命令
95%的置信(预测)区间为[45.2326, djust命令后加入选项level,并 在括号内注明置信水平,如 level(99) 表示99%的置信水 平,level(90) 表示90%的置信水平等。
End
回归模型预测的Stata基本命令
predict z 根据最近的回归生成一个新变量 z ,其值等于每一个观测
的拟合值或预测值 (Yˆi );
predict u, residual 根据最近的回归生成一个新变量 u,其值等于每一个观测 的残差。
Stata软件操作实例
实验 1 模型预测:学习努力程度对大学英语成绩的影响
Yˆi ˆ0 ˆ1X1i ˆ2 X2i
若给定样本以外的解释变量的观测值(X10, X20), 通过以上方程我们就可以对被解释变量Y0的取值 进行预测。 点预测: 直接将(X10, X20)代入方程,可得到被解释变 量Y0 的点预测值 Yˆ0 ˆ0 ˆ1X10 ˆ2 X20
Stata软件操作实例
. reg final attend homework entry
So urce
SS
df
MS
Mod el Re sidu al
23705.2964
3 7901.76545
111516.592 670 166.442675
Total 135221.889 673 200.924055
本例继续使用数据文件“大学英语成绩.dta”。考虑模型:
final 0 1attend 2homework 3entry u
其中final 为英语期末考试成绩,entry为学校组织的英语 入学考试成绩,attend 为英语课的出勤率(百分数), homework 为课后作业的完成率(百分数); 1、打开数据文件。直接双击“大学英语成绩.dta”文件;或 点击Stata窗口工具栏最左侧的Open键,然后选择“大学英语 成绩.dta”即可; 2、预测。估计以上模型,如果想要预测一个上课出勤率 (attend)、作业完成率 (homework) 以及入学成绩 (entry) 均为 样本均值的学生的期末成绩 (final),可在回归分析完成后使 用 adjust 命令,结果为:
Dependent variable: final
Command: regress
Covariates set to value: attend = 90, homework = 90, entry = 90
All
xb
st df
lb
ub
70.683 (12.9617) [45.2326 96.1333]
Coef .
.1225748 .067421
.5277705 6.084002
Std. Err.
t
.0388468 .0330947 .0480319 4.475446
3.16 2.04 10.99 1.36
P> |t|
0.002 0.042 0.000 0.174
[95% Conf. Interval]
.0462988 .0024392 .4334593 -2.703585
.1988509 .1324028 .6220818 14.87159
Dependent variable: final
Command: regress
Variables left as is: attend, homework, entry
本外预测值的标准误和置信水平为95%的置信区间。
键入命令:adjust attend=90 homework=90 entry=90, stdf ci
. adjust attend=90 homework=90 entry=90,stdf ci
All
xb
57.6662
Key: xb = Linear Prediction
结果被解释变量学生英语期末成绩 (final) 的预测值为 57.6662。
Stata软件操作实例
2、预测。如果想得到attend=90、homework=90、entry=90
的学生的期末成绩,须在adjust命令中指定各解释变量的取
模型的预测问题
区间预测:区间预测方法就是预测 Y0 基本上是
(以 1 a 95%或99% 的可能性)在一个区间范围内取值,该
区间就称为Y0的置信区间(预测区间),置信区间是以Y0的 点预测值 Yˆ0 为中心的一个区间,表示为:
Yˆ0 ta S(e0 ) Y0 Yˆ0 ta S(e0 )
对于多元线性回归模型:
y 0 1x1 2x2 k xk u
regress y x1 x2…xk
y 对 x1, x2, …, xk 的回归。regress命令可简写为reg;
adjust [ x1 x1 x2 x2 xk xk] [, option] 根据最近的回归得到当解释变量取特定值(即 x1 x1,x2 x2, xk xk ) 时被解释变量的预测值。如果不指定解释变量的取值,表示 根据最近的回归得到在所有解释变量均等于其样本均值时被 解释变量的预测值。Option是选择项,可根据需要选择。常用 的选择项有:stdf 表示显示样本外预测的标准误;ci 表示显示 预测值的置信区间;level( ) 用于指定置信区间的置信水平,如 level(90) 表示90%置信水平,level(99) 表示99%置信水平,如果 仅输入ci 而未指定置信水平,则缺省表示指定95%置信水平。
Number of obs = 674
F( 3, 670) = 47.47
Prob > F
= 0.0000
R- squa red
= 0.1753
Adj R-squared = 0.1716
Root MSE
= 12.901
fin al
atte nd ho mewo rk
ent ry _co ns . adjust
区间预测方法就是预测y0基本上是的可能性在一个区间范围内取值该区间就称为y0的置信区间预测区间置信区间是以y0的点预测值为中心的一个区间表示为
计量经济软件应用
——Stata软件实验回归分析应 用之模型预测
实验目的:
掌握回归模型预测的方法及相应 的Stata软件操作方法。
知识点:
模型的预测问题 已建立二元线性回归模型:
Key: xb
= Linear Prediction
std f
= Standard Error (forecast)
[lb , ub] = [95% Prediction Interval]
结果显示,满足上述条件的学生期末成绩的点预测值为
70.683,样本外预测误差的标准误为12.9617,置信水平为
2
2
其中预测误差 e0 的样本标准差为:
(对于一元线性回归模型)
S (e0 )
ˆ
2
1
1 n
(X0 X )2
i
(Xi
X
)2
(对于多元线性回归模型)
S (e0 ) ˆ 2 1 X 0 ( X X )1 X 0
回归模型预测的Stata基本命令
95%的置信(预测)区间为[45.2326, djust命令后加入选项level,并 在括号内注明置信水平,如 level(99) 表示99%的置信水 平,level(90) 表示90%的置信水平等。
End
回归模型预测的Stata基本命令
predict z 根据最近的回归生成一个新变量 z ,其值等于每一个观测
的拟合值或预测值 (Yˆi );
predict u, residual 根据最近的回归生成一个新变量 u,其值等于每一个观测 的残差。
Stata软件操作实例
实验 1 模型预测:学习努力程度对大学英语成绩的影响
Yˆi ˆ0 ˆ1X1i ˆ2 X2i
若给定样本以外的解释变量的观测值(X10, X20), 通过以上方程我们就可以对被解释变量Y0的取值 进行预测。 点预测: 直接将(X10, X20)代入方程,可得到被解释变 量Y0 的点预测值 Yˆ0 ˆ0 ˆ1X10 ˆ2 X20
Stata软件操作实例
. reg final attend homework entry
So urce
SS
df
MS
Mod el Re sidu al
23705.2964
3 7901.76545
111516.592 670 166.442675
Total 135221.889 673 200.924055
本例继续使用数据文件“大学英语成绩.dta”。考虑模型:
final 0 1attend 2homework 3entry u
其中final 为英语期末考试成绩,entry为学校组织的英语 入学考试成绩,attend 为英语课的出勤率(百分数), homework 为课后作业的完成率(百分数); 1、打开数据文件。直接双击“大学英语成绩.dta”文件;或 点击Stata窗口工具栏最左侧的Open键,然后选择“大学英语 成绩.dta”即可; 2、预测。估计以上模型,如果想要预测一个上课出勤率 (attend)、作业完成率 (homework) 以及入学成绩 (entry) 均为 样本均值的学生的期末成绩 (final),可在回归分析完成后使 用 adjust 命令,结果为:
Dependent variable: final
Command: regress
Covariates set to value: attend = 90, homework = 90, entry = 90
All
xb
st df
lb
ub
70.683 (12.9617) [45.2326 96.1333]
Coef .
.1225748 .067421
.5277705 6.084002
Std. Err.
t
.0388468 .0330947 .0480319 4.475446
3.16 2.04 10.99 1.36
P> |t|
0.002 0.042 0.000 0.174
[95% Conf. Interval]
.0462988 .0024392 .4334593 -2.703585
.1988509 .1324028 .6220818 14.87159
Dependent variable: final
Command: regress
Variables left as is: attend, homework, entry