eviews基本操作、49页实例、上海股票分析说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
九、用eviews4估计教材34页实例:/jjxqy/SPSS.htm 。
Dependent Variable: Y Method: Least Squares Date: 03/17/06 Time: 22:22 Sample: 1978 2000 Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
变量 系数估计值 系数标准差:小好 T 检验值:大好 概率(越小越好) C 201.118931268 14.8840158247 13.5124104702 7.91810838658e-12
0ˆβ
ˆ
S β
=
ˆ00ˆ/t S β
β= @coefs(1)或c(1) @stderrs(1) @tstats(1)
X
0.386180285276 0.0072217370506 53.474708726 6.25074728232e-24
1ˆβ
1
ˆS β
=
1
ˆ11ˆ/t S β
β= R-squared
0.992709711586 Mean dependent var
905.330434783
(拟合优度2
R )/ESS TSS =1-(RSS/TSS) :大好 (因变量均值)Y -
=
22ˆ()/()i
i y
y y y --∑∑@R2 @mean(y)
Adjusted R-squared 0.992362554995 S.D. dependent var 380.63340683
(调优)1-(/(1))/(/(1))RSS t k TSS n ---:大好 (Y
@RBAR2 @sqr(@var(y)*n/(n-1)),var(y)2
()/i Y Y n =-∑
@sddep (被解释变量的标准差)
S.E. of regression 33.2644961843 Akaike info criterion 9.9297996268
2
/(2)i
e
n -=∑115.7670^2=13402
(回归标准差)
µμσ= 赤池信息准则2
2(1)ln i e k AIC n n ⎛⎫+=+ ⎪ ⎪⎝⎭
∑) Sum squared resid 23237.0608343 Schwarz criterion 10.028*******
(残差平方和)2
i RSS e =
∑
(施瓦兹信息准则21
ln ln i e k SC n n n ⎛⎫+=+ ⎪ ⎪⎝⎭
∑):小好
@sumsq(resid)
Log likelihood -112.192695708 F-statistic 2859.54447333 (对数似然估计值) (总体F 检验值):大好 @F Durbin-Watson stat 0.550636299883 Prob(F-statistic) 0 (D-W 检验值)@DW ( F 检验概率):小好
49页实例:令Y =人均居民消费支出:元,X =人均GDP :元。
X 因,Y 果。
(1)无数据:file/new/workfile ,输入数据;若有word 表格数据或excel 数据,直接粘贴;若有数据eviews ,用load 调入。
(2)data y x :输入数据(也可data y ,然后data x )。
(3)ls y c x :执行OLS 。
Dependent Variable: Y Method: Least Squares
Date: 03/17/06 Time: 22:22 Sample: 1978 2000 数据范围
Included observations: 23样本容量
Variable Coefficient Std. Error t-Statistic Prob. 变量 系数估计值 系数标准差:小好 T 检验值:大好 概率(越小越好)
C (0
ˆβ)201.118931268 µ0
()S β=14.88402 13.51241 6 0.0000 @coefs(1)或c(1) @stderrs(1) @tstats(1)
X (1
ˆβ)0.386180285276 µ1
()S β=0.007222 53.47471 0.0000
@coefs(2)或c(2) @stderrs(2) @tstats(2) R-squared 0.992710 Mean dependent var 905.3304 (拟合优度r 2)
/ESS TSS =1-(RSS/TSS) :大好 (因变量均值)Y -
=
22ˆ()/()i
i y
y y y --∑∑@R2 @mean(y)
Adjusted R-squared 0.992363
S.D. dependent var
380.6334
(调优)1-(/(1))/(/(1))RSS t k TSS n ---:大好 (Y
@RBAR2 @sqr(@var(y)*n/(n-1)),var(y)2
()/i Y Y n =-∑
@sddep (被解释变量的标准差) S.E. of regression 33.26450 Akaike info criterion 9.929800
(回归标准差)
µμσ
= 赤池信息准则 22(1)
ln i e k AIC n n ⎛⎫+=+ ⎪ ⎪⎝⎭
∑) Sum squared resid 23237.06:小好
Schwarz criterion 10.02854
(残差平方和)2
i RSS e =∑ 施瓦兹信息准则21ln ln i e k SC n n n ⎛⎫+=+
⎪ ⎪⎝⎭
∑:小好 @sumsq(resid)
Log likelihood -112.1927 F-statistic 2859.544 (对数似然估计值) (总体F 检验值):大好 @F
Durbin-Watson stat 0.550636 Prob(F-statistic) 0.0000 (D-W 检验值) ( F 检验概率):小好 @DW
于是回归方程为:ˆi
Y = 201.1189313 + 0.3861802853i X
@REGOBS :返回观察值的个数23。
@ncoef :估计系数总个数2。
下面一一详细解释其中的含义,解决具体计算问题:
模型:011122(...)i i i m m Y X b x b x b x ββμμ=++=+++,样本(,i i X Y ),1,2,...,i n = 假设:
i E μ=,
2
()i Var μμσ=,
(,)0i j Cov μμ=,(,)0i i Cov x μ=,2
(0,)
i N μμσ:。
1.系数:1
ˆβ=2i i
i
x y
x
∑∑=0.3861802853,0ˆβ=1
ˆY X β-=201.1189313。
于是回归方程为:ˆi
Y = 201.1189313 + 0.3861802853i X 其实要计算1ˆβ、0
ˆβ,也可如下计算: genr b1=@cross (x-@mean(x),y-@mean(y))/@sumsq(x-@mean(x))
@cross 计算交叉乘积和,@mean 计算均值,@sumsq 计算平方和。
genr b0=@mean(y)-b1*@mean(x)。
打开两个序列b1和b0,可以看到结果一样。
2.1
ˆβ的方差:2
2
11ˆ()/()n
i i Var x μ
βσ==∑
1ˆβ的方差
估计值为2
ˆμσ
=
2
1
/(2)n
i i e n =-∑,
22
ˆ()E μμ
σσ=,以ˆμσ代替其中的μσ,得
1
ˆS β
=
=0.007222(STD. ERROR 系数标准差:越小越好)=@stderrs(2)。
µ0
β的方差:2
2201
1ˆ()(/)n
i i Var X x n μβσ==+∑=2221/()n i i i X n x μσ=∑∑
,标准差:2ˆμσ=21
/(2)n
i i e n =-∑,22ˆ()E μμσσ=,以ˆμσ代替μσ,得0
ˆS β
=
=14.88402(STD. ERROR 系数标准差或记做0
ˆ()se β)=@stderrs(1). 3.1β的
t
检验:1t =
1
ˆ1ˆ/S β
β
=
1
ˆ/β=
0.386180/0.007222=53.4727222376073=c(2)/@stderrs(2)=@tstats(1)>>2。
0t =0
ˆ
0ˆ/S ββ
=0
ˆ/β=201.1189/14.88402=13.5124045788705=
genr t0=c(1)/@stderrs(1)=@tstats(1)>2。
t-Statistic Prob.
T 检验值 概率(越小越好) c :13.51241 0.0000
x :53.47471 0.0000
((||||)i
P t t p >=)
第一类错误:原假设H0符合实际情况,而检验结果把它否定了,这称为弃真假设。
第二类错误:原假设H0不符合实际情况,而检验结果把它肯定下来了,这称为取伪假设
有了(||||)i
P t t p >=值,一方面不需要从t 分布表查临界值,只要取α>p ,一般t
就显著,使t 检验更加方便;另一方面也可以知道拒绝原假设H01
0β=的最低显著水平,
如p =0.06时即最低显著水平应取0.06,但若主观地将显著水平取为0.05<0.06,则认为对x 犯第一类错误的概率极大。
所以p 值使t 检验更加客观、灵活。
但本例因采集数据较少,真实总体截距的p =0.658值却比较大,故犯第一类错误的概率很大。
然而我们通常不注重截距项。
4.2
2211
ˆ1()/()n n
i i i i ESS RSS R Y Y Y Y TSS TSS ====-=--∑∑=0.992710=@R2 2/(1)(1)
11/(1)(1)
RSS n k RSS n R TSS n TSS n k ---=-
=----=0.992363(k =1,符合22R R ≤)=@RBAR2
5.S.E. of regression
(回归标准差)ˆμσ
=33.26450=@se=@sddep
(被解释变量的标准差)
6.Sum of squared resid (残差平方和)2
i
RSS e =∑=23237.06=@sumsq(resid)
7.(对数似然估计值)Log likelihood
-112.1927:一般变量多L 大。
8.Durbin-Watson stat (D-W 检验值)
2
1
2
21
()n
i
i i n
i
i e e
d e
-==-=
∑∑=0.550636=@dw 。
9.Mean of dependent var 905.3304(因变量均值)Y =@mean(y) 10.S.D. of dependent var (因变量Y
380.6334=
@sqr(@var(y)*n/(n-1))=@meandep (被解释变量标准差)。
11.Akaike info criterion (赤池信息准则 22(1)
ln i e k AIC n n ⎛⎫+=+
⎪ ⎪⎝⎭∑)=9.929800 Schwarz criterion (施瓦兹信息准则21
ln ln i e k SC n n n ⎛⎫+=+ ⎪ ⎪⎝⎭
∑)=10.02854
这两个指标用来比较含有不同解释变量个数模型的拟合优度好坏,显然,两个值越小表
明拟合优度越高。
12.F-statistic (总体F 检验值)/1
/(2)ESS F RSS n =-=2859.544=@F 。
13.( F 检验概率或相伴概率)Prob(F-statistic)=0.000000:类似t 检验理解。
若α取值低于这里的p 值,则易犯第一类错误。
14.1β区间估计:1/2,21ˆˆ()n t S αββ-±
=1
/2,2ˆn t αβ-±,
1
ˆβ=0.2234191,给定显著水平α=5%,则置信水平为1-α=95%,查表得/2,2n t α-=2.571(/2α=0.025%,n-2=5),下限:c(2)-2.571*@stderrs(2)=0.1951738,上限:
c(2)+2.571*@stderrs(2)=0.2516644。
或由前面的
2.知道,1β的标准差1ˆ()S β
=
=0.0109861,所
以,0.2234191-2.571×0.0109861,我们有95%的可能性说真值1β落在(0.1951738,0.2516644)内。
注:eviews 中,输入“=0.2234191-2.571*0.0109861”回车得计算结果。
15.已知0x 求0y 及0y 区间估计:¶00ˆ()Var y y -=22
10
21
1(1)(2)n
i i n
i
i e x n n x ==++-∑∑&&,
区间估计$
/2,0n y t α-±
=0/2,ˆn y
t α-±
0/2,2ˆˆn y
t ασ-=±。
假设0x =9800,0ˆy
=c(1)+c(2)*9800=2219.55905806,5%α
=时,
n =7,查表得/2,2n t α-=2.571,ˆμσ=@se =55.061602838,2
x &=(9800-@mean(x))^2=18490000,2
1
n
i i x =∑&=@sumsq(x-@mean(x))=25119644。
2219.55905806-2.571*55.061602838*(1+1/7+18490000/25119644)^0.5
=2025.51214370846(下限)。
2219.55905806+2.571*55.061602838*(1+1/7+18490000/25119644)^0.5 =2413.60597241154(上限)。
简单方法:
(1)ls y c x ,使得内存中存在方程$i y =30.052368+0.2234191i x 。
(2)假设0x =9800
,0/2,2ˆˆn y
t αμσ-±下限:genr xx=c(1)+c(2)*9800-
2.571*@se*@sqr(1+1/7+(9800-@mean(x))^2/@sumsq(x-@mean(x))) = 2025.51214371
上限:genr sx=c(1)+c(2)*9800+
2.571*@se*@sqr(1+1/7+(9800-@mean(x))^2/@sumsq(x-@mean(x))) =241
3.60597241
故y0的预测区间为:(2025.512,2413.606)
麻烦但是容易掌握的计算0ˆy 的方法:(1)ls y c x ,使得内存中存在方程$i y =
30.052368+0.2234191i x 。
(2)假设0x =9800,如何计算0ˆy
?执行ls y c x 后①扩展工作区间:expand 1991 1998;②确定预测值的起止日期:smpl 1998 1998;③data x ,在1998年输入0x =9800;④执行forcst z ;⑤show z ,1998年的z 的值就是我们要得到的预测值$0y =2219.559;⑥恢复起止日期smpl 1991 1997。
结论:有95%的可能性0y 落在(2025.51,2413.61)内。
16.几个常用命令:(1)Cov x y :cov(,)()()/i
i
x y x x y y n =--∑协方差矩
阵。
Cor x y
:co (,)()()i i r x y x x y y =
--∑相
关矩阵。
(2)plot x y :出现趋势分析图,观察两个变量的变化趋势或是否存在异常值。
双击图形可改变显示格式。
(3)scat x y :观察变量间相关程度、相关类型(线性、非线性)。
仅显示两个变量。
如果有多个变量,可以选取每个自变量和因变量两两观察,虽然得到切面图,但对函数形式选择有参考价值。
17.descriptive stats (描述统计):双击x ,然后在x 的变量窗口选择view/descriptive stats ,可以得到x 的各个数字特征:均值mean 、中位数median 、最大值max 、最小值min 、反映
变量离散程度的标准差std.Dev 、偏态系数(S )和峰态系数(K )(33
()/i S x x ns =-∑,
44
()/i K x x ns =-∑,s 即标准差
2
()
/(1)i
x x n --∑。
对于对称分布,S =0;S>0
表明存在
右偏态;对于正态分布,K =3,当K>3时,分布比较陡峭)、
Jarque-Bera 统计量用于检验变量是否服从正态分布(2
2
6(3)/4/JB S K n ⎡⎤=+-⎣⎦:在变量服从正态分布的原假设
下,JB 统计量服从自由度为2的卡方分布(因此如果JB 统计量大于卡方分布的临界值,或对应概率值较小,则拒绝该变量服从正态分布的假设)。
还可看到histogram 取值频率直方图(34页本例中:x 取值3000-4000的有两个,所以直方图较高;偏态系数S =0.33>0出现右偏, 峰态系数K<3与正态分布相比比较平缓;JB =0.55,JB 的相伴概率=0.75,说明我们有25%的概率说X 服从正态分布,若取显著水平<0.25,则易犯第一类错误)。
18.预测问题:首先执行load ; ls y c x ; 在方程窗口点击才procs/forecast ,eviews
将产生一个新的对话框,点击确定后生成一个以原因变量y 名+f 的y 的预测值yf ,实际上,yf
=ˆi y
;同时还得到一张预测图形:图中实线是因变量y 的预测值,上下两条虚线给出的是近似95%的置信区间,图形右边的附表提供了一系列对模型的评价指标,从上依次为:①预测变量名yf ;②原变量名y ;③样本区间1991-1997;④包括7个样本点;⑤绝对指标RMSE 均方
400
800
12001600200024001991
1992
1993
1994
1995
1996
1997
YF
Forecast: YF Actual: Y
Forecast sample: 1991 1997Included observations: 7Root Mean Squared Error 46.53555Mean Absolute Error 40.96350Mean Abs. Percent Error 3.372889Theil Inequality Coefficient 0.017514 Bias Proportion 0.000000 Variance Proportion 0.003004 Covariance Proportion
0.996996
根误差21
1ˆ()n
i i RMSE y y n =-∑,其大小取决
于因变量的绝对数值和预测值:验证genr
z=@sqr(@sumsq(yf-y)/7)=46.53555;⑥绝对指标MAE
平均绝对误差1
1ˆ||n
i i MAE y y n =-∑,其大小取决于因变量的绝对数值和预测值:验证genr
z=@sum(@abs(yf-y))/7=40.96350;⑦常用的相对指标MAPE 平均绝对百分误差
1ˆ1|100|n i i i
y
y MAPE n y -=⨯∑,验证genr z=@sum(@abs(yf-y)*100/y)/7=3.372889,
若MAPE 的值小于10,则认为预测精度较高;⑧希尔不等系数
21
2211
1ˆ()11ˆn
i i n
n
i i
y y n Theil IC y y n n -=
+∑∑∑,验证genr
z=@sqr(@sumsq(yf-y)/7)/( @sqr(@sumsq(yf)/7)+@sqr(@sumsq(y)/7))=0.017514,希尔
不等系数总是介于0-1之间,数值越小,表明拟合值和真实值间的差异越小,预测精度越高;
⑨均方误差MPE 可分解为21
1ˆ()n i i y y n -∑22
ˆˆˆ()()2(1)y y y y y y r σσσσ=-+-+-,
其中ˆy
是预测值ˆy 的均值,y 是实际序列的均值,ˆ,y y σσ分别是预测值和实际值的标准差,r 是它们
的相关系数,于是可定义偏差率、方差率和协变率
三个相互联系的指标,其取值范围都在0-1之间,并且这三项指标之和等于1,计算公式是:偏差率
221
ˆ()1
ˆ()n
i i y
y BP y y n -=
-∑(OLS 中ˆy y =,
故BP =0)、方差率2
ˆ2
1
()
1ˆ()y y n
i i
VP y y n σσ-=-∑、协变率ˆ212(1)1ˆ()y y
n i i r CP y y n σσ-=-∑1BP VP =--。
BP 反映了预测值均值和实际值均值间的差异,VP 反映它们标准差的差异,CP 则衡量了剩余的误差。
当预测比较理想时,均方误差大多数集中在协变率CP 上,其余两项较小。
本例预测结果:平均绝对百分误差MAPE=3.37<10、希尔不等系数=0.0175非常小、CP
值较大(BP 、VP 较小),说明预测精度好。
西方经济学177页三、问答题3.生产函数如何用eviews 计算?
练习:动手编写一元回归计算软件,尽量包括所有计算过程、检验。
2.1.将34页例题按上面的步骤做出所有的计算结果。
2.2.(日78页)日本在1981-1994年的14年间,家庭实际可支配收入x 与家庭实际最终消费支出y 的数据:
说明:采用1990年价格;数据来自经济企划厅国民经济计算年报。
(1)设横轴x ,纵轴y ,做出散点图;(2)进行最小二乘估计;(3)计算2
r ;(4)求y
的理论值ˆy 和残差ˆi e ;(5)利用(2)中估计出来的宏观消费函数,对家庭实际可支配收入
在270兆日元(内插预测:interpolation ,x =270在212-304之间)和320兆日元(外插预测:extrapolation )时,家庭实际最终消费支出分别进行预测。
2.3 (日88页)表中反映了日本物价上涨率P 与失业率U 之间的关系。
(1)设横轴是U ,纵轴是P ,画出数据的散点图;(2)对下面的菲利普斯曲线,进行OLS 估计
(/)P U αβμ=++;
(3)计算决定系数2
r 。
2.4 通过下例观察计量分析软件eviews,看看好不好?
X 1 2 3 4 5 6 7 8 9
Y 2 4 6 8 10 12 14 16 18
执行ls y c x;再执行ls y x。
分别分析计算结果。
注意:对大型数据库操作时,需要一些特殊的命令(如处理上海股市所有股票的数据时):
1.拷贝数据:当数据库里面非数据类型而是诸如“- ”时,无法正常拷贝,只能拷贝到出现“- ”之前的数据。
所以,对20050418收盘的上海股市股票进行了删除:删除了当日没有开盘的股票和2004年收益没有公布的股票。
2.排序:在workfile窗口,执行主菜单上的procs/sort series,可选择升序或降序:Sort x:则y随之移动,即不破坏对应关系。
3.在workfile窗口,可以使用选择菜单上的sample,出现窗口,下面的条件处,可以选择待处理数据所满足的条件:如zuixin<=5,zuixin<=5 or zuoxin>=10,zuixin>=10 and shouyi04>-0.5,liutonygu/zongguben>=0.5,liutonygu/zongguben<=0.9 or liutonygu/zongguben>=0.1等,这样可以处理相关数据。
然后计算ls zuixin c meigushouyi04,可以观察不同的估计结果。
要灵活运用。
4.由于大型数据库你有一定的想法,但是很难控制,可以采用程序解决。
注意:按F1终止程序。
首先load shanghaigushi20050418,然后就可执行程序。
程序1:将股票按04年收益按降序排列,然后定义smpl 1 10,smpl 1 11,…,查看收益较好的股票拟合优度较高的smpl值。
smpl @all ' :重新定义数据范围,如果修改过,现在改回。
“'”后面的东西不执行,仅仅解释程序语句。
sort(d) meigushouyi04 ':按04年每股收益按降序排序,注意所有的其它变量值都会随之相应移动。
matrix(10,1) b ' :定义一个矩阵b(10,1)。
!R=0 ':变量前面要加!。
for !i=10 to 591 step 1 ' :步长为1;变量前面要加!。
smpl 1 !i
ls zuixin c meigushouyi04 ':执行最小二乘法。
if @R2>!R then ' :若R2>R,执行endif前语句。
若否,不执行。
!R=@R2
output a ' :输出结果到文件。
b.fill @!i,
@r2,@ssr,@coefs(1),@tstats(1),@coefs(2),@tstats(2),@rbar2, @f,@dw ' :填写i和RSS等到矩阵b当中。
endif ' :中止IF。
!s=0 ' :下面目的是执行加法计算,可以起到延迟时间的作用。
for !j=1 to 1 ' :想延迟时间长,to 1改为to 10000;不延迟改为1。
!s=!s+!j ' :累加。
next ' :上面第二个FOR的中止。
Next ' :上面第一个FOR的中止。
smpl @all
计算结果:591只股票拟合优度=0.295163最高。
程序2:将股票按04年收益按升序排列,然后定义smpl 1 10,smpl 1 11,…,查看收益较差的股票拟合优度较高的smpl值。
只需将“sort(d) meigushouyi04”改为“sort(a) meigushouyi04”即可。
结果发现:591只股票放在一起拟合优度最大为0.452744。
说明绩优拟合不好、线性关系不明显,绩差的也是如此。
所以投资绩优、绩差股都有较大风险,可能有较大收益。
程序3:计算流通股占总股本的比例,将此比例按降序排列,然后定义smpl 1 10,smpl 1 11,…,查看流通股占总股本比例较高的股票拟合优度较高的smpl值。
smpl @all ' :重新定义数据范围,如果修改过,现在改回。
'后面的东西不执行,仅仅解释程序语句。
matrix(10,1) b ' :定义一个矩阵b(10,1)。
genr liutongbili=liutonygu/zongguben ':计算流通股占总股本的比例序列。
sort(d) liutongbili ':将流通股占总股本的比例按降序排序,注意所有的其它变量值都会随之相应移动。
!R=0 ':变量前面要加!。
for !i=10 to 591 step 1 ' :步长为1;变量前面要加!。
smpl 1 !i
ls zuixin c meigushouyi04 ':执行最小二乘法。
if @R2>!R then ' :若R2>R,执行endif前语句。
若否,不执行。
!R=@R2
output a ' :输出结果到文件。
b.fill @!i, @r2,@ssr,@coefs(1),@tstats(1),@coefs(2),@tstats(2),@rbar2, @f,@dw ' :填写i和RSS等到矩阵b当中。
endif ' :中止IF。
!s=0 ' :下面目的是执行加法计算,可以起到延迟时间的作用。
for !j=1 to 1 ' :想延迟时间长,to 1改为to 10000;不延迟改为1。
!s=!s+!j ' :累加。
next ' :上面第二个FOR的中止。
Next ' :上面第一个FOR的中止。
smpl @all
结果发现:前31只股票放在一起拟合优度最大为0.600599。
程序4:计算流通股占总股本的比例,将此比例按升序排列,然后定义smpl 1 10,smpl 1 11,…,查看流通股占总股本比例较低
的股票拟合优度较高的smpl值。
只需将sort(d) liutongbili修改为sort(a) liutongbili 即可。
结果发现:前371只股票放在一起拟合优度最大为0.489711。
说明流通股占总股本比例较小的、较大的拟合优度较高,相对来说股价与每股收益拟合较好,线性关系较好,因果关系显著。
说明投资风险相对较好,股价能够较好地反映股票的收益。
国有股减持的重点应当放在中间的股票上,流通股比例居中的股票由于任何一方不占有绝对优势,往往导致股权不甚清晰、不明了,股价不能正确反映其收益情况。
因此,国家应当在一些行业上保持一定的控股,同时也应放弃一些行业的控股地位,这将利于股市的平稳运行。
371>31(但拟合优度反之)说明什么问题呢?。