第三章 一元线性回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 一元线性回归模型
一、预备知识
(一)相关概念
对于一个双变量总体,若由基础理论,变量和变量之间存在因果
),(i i x y x y 关系,或的变异可用来解释的变异。

为检验两变量间因果关系是否存在、
x y 度量自变量对因变量影响的强弱与显著性以及利用解释变量去预测因变量
x y x ,引入一元回归分析这一工具。

y 将给定条件下的均值
i x i y
i i i x x y E 10)|(ββ+=(3.1)
定义为总体回归函数(Population
Regression
Function,PRF )。

定义
为误差项(error
term ),记为,即,这样
)|(i i i x y E y -i μ)|(i i i i x y E y -=μ,或
i i i i x y E y μ+=)|(
i i i x y μββ++=10(3.2)(3.2)式称为总体回归模型或者随机总体回归函数。

其中,称为解释变量
x (explanatory variable )或自变量(independent variable );称为被解释
y 变量(explained variable )或因变量(dependent variable );误差项解释
μ了因变量的变动中不能完全被自变量所解释的部分。

误差项的构成包括以下四
个部分:
(1)未纳入模型变量的影响
(2)数据的测量误差
(3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间
可能是非线性关系
(4)纯随机和不可预料的事件。

在总体回归模型(3.2)中参数是未知的,是不可观察的,统计计
10,ββi μ量分析的目标之一就是估计模型的未知参数。

给定一组随机样本
,对(3.1)式进行估计,若的估计量分别记
n i y x i i ,,2,1),,( =10,),|(ββi i x y E 为,则定义3.3式为样本回归函数
^
1^0^
,,ββi y ()
i i x y ^
1^
0^ββ+=n i ,,2,1 =(3.3)
注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,
^
1^
0,ββ它们的随机性是由于的随机性(同一个可能对应不同的)与的变异共
i y i x i y x 同引起的。

定义为残差项(residual term ),记为,即,
^
i i y y -i e ^
i i i y y e -=这样,或
i i i e y y +=^
()
i i i e x y ++=^
1^
0ββn i ,,2,1 =(3.4)
(3.4)式称为样本回归模型或者随机样本回归函数。

样本回归模型中残差项
可视为总体回归模型中误差项的估计量。

i e i μ(二)参数估计:普通最小二乘法
如何估计总体参数的估计量,或如何获得样本回归函数呢?在
10,ββ^
1^
0,ββ回归分析中,使用最广泛的方法是最小二乘法,一般称为普通最小二乘法
(Ordinary Least Squares,OLS )1。

OLS
求解未知参数的估计量,
10,ββ^1^
0,ββ使残差平方和最小。


∑∑∑===--=-=n i i i n i i i n i i
x y y y e Minimize 1
2^
1^
012
^
1
2
)()(ββ(3.5)
求解(3.5)式可得

∑∑==---=
n i i
n i i i
x x
y y x x
1
2
1
^
1)()((βx y ^
1^
0ββ-=(3.6)
其中,,。

∑==n i i x n x 11∑==n
i i y n y 1
1(三)古典线性回归模型
统计推断除了包括参数估计外还包括假设检验,在根据样本回归函数检验
假设时,需要对误差项的生成过程做一些假定。

i μ假定1 回归模型是参数线性的,但可以不是变量线性的。

假定2 解释变量与随机误差项不相关。


i x i μ1
之所以称为普通最小二乘法,是因为还有一种方法称为广义最小二乘法,普通最小二乘法是广义最小二乘法的特例。

0),cov(=i i x μ如果解释变量是非随机的,则该假设自动满足。

i x 假定3 零均值假定。


)(=i E μ假定4 同方差假定。


2
)var(σμ=i 假定5 无自相关假定。

即两个误差项之间不相关
0),cov(=j i μμj
i ≠假定6 回归模型是正确设定的。

假定7 正态性假定。


~i μ)
,0(2σN 满足以上假定的回归模型称为古典线性回归模型(Classical
Line
Regression Model,CLRM )。

(四)高斯-马尔科夫定理
如果古典线性回归模型的基本假定成立,则OLS 估计是最优线性无偏估计
量(Best Linear Unbiased Estimators,BLUE )。

(五)预测原理
回归分析的目的之一是利用回归模型预测因变量。

比如,金融决策经常涉
及一个长期的资源承诺(a long-term commitment of resources ), 决策的收
益将取决于将来发生的事情。

假设双变量总体的回归模型为(3.2),即
i i i x y μββ++=10(3.2)
在一组随机样本下,利用OLS 求得样本回归函数为(3.3)
n i x y i i ,,2,1),,( = ()
i i x y ^
1^
0^
ββ+=n i ,,2,1 =(3.3)
给定样本外一点,则因变量的点预测为
f x f y
f f x y ^
1^
0^ββ+=(3.7)
点预测的标准误为^
f y
∑=--++=n
i i
f f x x x x n
y se 1
2
2
^
^
)()(1
1)(σ
(3.8)
因变量的置信度为的区间预测为
f y α-1
[, ]
)()2(^
^
f f y se n t y --α)()2(^
2^
f f y se n t y -+α(3.9)
二、案例
[案例1] 经济形势对人们工作意愿的影响
根据劳动经济学理论,经济形势对人们工作意愿的影响存在两个互相独立
的效应:受挫工人效应和增加工人效应。

用失业率度量(UNR)经济形势,用劳动
力参与率(LFPR)度量人们的工作意愿。

受挫工人假说认为当经济形势恶化时,
许多失业工人就业意愿降低,放弃寻找工作并退出劳动力市场,从而劳动力参
与率下降;增加工人假说认为当经济形势恶化时,许多尚未进入劳动力市场的
后备工人,比如带孩子的母亲,可能会由于养家的人失去工作而决定进入劳动
力市场,即使这些工作的报酬很低,只要可以弥补由于养家的人失去工作而造
成的损失即可,从而劳动参与率上升。

劳动参与率的增加或减少取决于增加工人效应和受挫工人效应的强弱对比。

如果增加工人效应占主导,则LFPR 将升高;相反,如果受挫工人效应占主导,
则LFPR 将会下降。

因此,劳动参与率是上升还是下降,是一个实证问题。

表3-1给出了美国1980-2002年城市劳动参与率(CLFPR)和城市失业率
(CUNR)数据,城市失业率是指城市失业人口占城市劳动力的百分比。

表3-1 1980-2002美国城市劳动力参与率、城市失业率与实际平均每小时国内工资
year
CLFPR(%)
CUNR(%)
AHE82($)
1980
63.87.17.78198163.97.67.69198264.09.77.68198364.09.67.79198464.47.57.80198564.87.27.77198665.37.07.81198765.6 6.27.73198865.9 5.57.69198966.5 5.37.64199066.5 5.67.52199166.2 6.87.45199266.47.57.41199366.3 6.97.391994
66.6
6.1
7.40
199566.6 5.67.40 199666.8 5.47.43 199767.1 4.97.55 199867.1 4.57.75
1999 200067.1
67.2
4.2
4.0
7.86
7.89
200166.9 4.87.99
200266.6 5.88.14
注:AHE82代表以1982年价计算的平均每小时工资。

资料来源:参考文献[1],3-5。

三、实验目的
[案例1] 经济形势对人们工作意愿的影响
1、用Eviews软件绘制CUNR与CLFPR之间的散点图,观察两变量之间的线性关系;
2、根据劳动经济学理论以及散点图分析,为研究经济形势对人们工作意愿的影响,建立一元线性回归模型;
3、根据劳动经济学理论,对回归系数的符号进行预期并加以解释;
4、利用表3-1提供的数据,利用OLS法对问题2中建立的回归方程进行估计;
5、在Word文件中报告回归结果并对回归结果进行解释;
6、显示因变量的实际值、拟合值,残差表(残差图);
7、绘制回归残差的直方图,并对残差进行正态性检验;
8、计算CUNR的估计系数置信度为0.95的置信区间,该区间包括零吗?
9、利用1980-1999年的数据为样本,再次估计问题2中建立的回归模型,并利用估计的结果,给出2000-2002年clfpr的点预测和区间预测(置信度为
0.95)。

四、实验步骤
[案例1] 经济形势对人们工作意愿的影响
1、⑴建立工作文件workfile clfpr-cunr a 1980 2002
⑵录入数据data cunr clfpr
⑶绘制散点图打开包含序列cunr和clfpr组对象,点击View/Graph,在出现的Graph Options窗口的Specifi选项中选择Scatter,在Fit Lines中选择Regression Line,点击确定。

图3-1 城市劳动参与率与城市失业率的散点图
从图3-1可以观察到城市劳动参与率与城市失业率存在较明显的负相关关
系。

另外,也可通过计算两变量之间的简单相关系数,判断两变量之间线性关
系的方向和程度。

在命令窗口键入cor cunr clfpr ,在随后出现的相关系数矩阵
中显示cunr 与 clfpr 之间的相关系数为-0.843967。

尽管用简单相关系数可以很方便地判断两变量之间线性相关的方向和程度,
但散点图依然不可替代。

有时自变量与因变量之间并非线性关系,但通过一定
的变量变换可转化为线性关系,而散点图可以为选择何种变换提供直观的帮助。

2、根据劳动经济学理论以及散点图分析,为研究经济形势对人们工作意愿的影
响,建立一元线性回归模型如下:
t
t t cunr clfpr μββ++=10这里,人们的工作意愿是我们的研究对象,经济形势是影响因素。

故clfpr
是因变量或被解释变量,cunr 是自变量或解释变量。

3、从理论上分析,回归系数表示cunr 对clfpr 的边际影响,其符号取决于增
1β加工人效应和受挫工人效应的强弱对比。

如果增加工人效应大于受挫工人效应,
则为正值;相反,如果增加工人效应小于受挫工人效应,则为负值。

1β1β从实证角度分析,由图3-1的散点图可知,cunr 与clfpr 负相关关系,即
为负值,表示cunr 每提高1个百分点,clfpr 将下降个百分点。

1β1β4、在对象目录窗口点击object/new object ,在出现的对象类型中选择equation,在对象名中填写eq1,点击OK ,出现图3-2对话框
图3-2 方程的设定
方程的设定有两种方式,一种方式是列表法,即在Equation specification 窗口依次列出被解释变量、常数项、自变量,变量之间用空格隔开,如图3-2所示。

另一种方式是公式法,比如clfpr= c(1) + c(2)*cunr,EViews会在方程中添加一个随机附加扰动项。

点击方程对象窗口中的View/Representation将会看到如上形式的方程。

在估计方法中选择最小二乘法,样本范围填写1980到2002。

设定完毕后点击确定。

出现图3-3。

图3-3 方程估计结果
下面结合案例1对方程估计的输出结果进行解释。

回归系数(Coeffient):系数度量的是它所对应的解释变量对预测的贡献。

常数项C的估计值表示所有其他解释变量取零时预测的基础水平,一般情况下可不予解释。

回归系数的计算公式参见式(3.6),本例中cunr的系数为-
0.646948,表示城市失业率每上升1个百分点,城市劳动参与率将下降
0.646948个百分点。

标准误差(Std.Error ):主要用来衡量回归系数的统计可靠性。

标准误差越大,回归系数估计值越不可靠。

回归系数方差和标准差的计算公式如下:

2
2
22
^
0()var(^
σσ
ββ∑∑-=
=x n x i
i ∑-=
=2
2
2
^
1()var(^
1
x
i
σσ
ββ , (3.7))var()(^0^0ββ=se )var()(^
1^
1ββ=se 由公式可见,回归系数的变异来源于因变量的变异(:同一个可能对2σi x 应不同的)和自变量的变异。

i y t 统计量(t-Statistic ):t 统计量用来检验某个系数是否为零,即检验该变量是
否应该存在于回归模型中。

t 统计量的计算公式为
(3.8)
)(^
^ββse t =本例中的t 统计量的值为t=-0.646948/0.094566=-6.841253<-^
1β2.07=@qtdist(0.025,21),故在0.05的显著性水平下,显著异于零,即城^
1β市失业率对城市劳动参与率有显著影响。

概率值(Prob.):又称边际显著性水平(marginal significance level )。

该列显示t 统计量大于前一列t 统计量值的概率(如果t 统计量值为正值),或者小于前一列t 统计量值的概率(如果t 统计量值为负值)。

概率值的计算可采用如下Eviews 命令:
scalar p= @ctdist(-6.841253,21)=0.0000<0.025(注意,这里的检验为双侧检验)
通过概率值可以方便地判断是拒绝还是接受系数真值为零的假设。

如果概率值小于给定的显著性水平就拒绝系数真值为零的原假设,否则就接受。

本例概率值为0.0000小于0.025,故在0.05的显著性水平下,显著异于零,即^
1β城市失业率对城市劳动参与率有显著影响。

可决系数(R-Squared ):R 2衡量的是在样本范围内用回归来预测被解释变量的好坏程度,是被解释变量能够被解释变量所解释的部分,因此一般越大越好。

本例中R 2的值为0.690278。

可决系数的计算公式为
TSS RSS ESS R -==12(3.9)
RSS ESS TSS +=(3.10)
,,∑-=2
)(y y TSS i ∑-=2
^
)(y y ESS i ∑∑=-=2
2^)(i i i e y y RSS 其中, TSS (Total Sum of Squares )称为总平方和;
ESS (Explained Sum of Squares )称为解释平方和或者回归平方和;
RSS (Residual Sum of Squares )称为残差平方和。

(3.10)式称为方差分解
调整的可决系数(Adjusted R-Sq uared ):计算公式为
1
1
)
1(1)1()1(122
-----=----
=k n n R n TSS k n RSS R 由公式可见,调整的可决系数是指对残差平方和与总平方和经过自由度调整的可决系数。

一般来说,在回归模型中增加解释变量的个数,可决系数会增加,但调整的可决系数不一定会增加,这为是否应该向模型中添加一个新变量提供了一个判别依据。

在回归报告中通常报告调整的可决系数,而不报告可决系数。

另外,调整的可决系数小于可决系数。

本例调整的可决系数为0.675529。

回归的标准误差(S.E.of regression ):回归标准误是一个对预测误差大小的
总体度量指标。

计算公式为
k
n RSS
k
n e
i
-=
-=
∑2
^
σ(3.11)
式中,n 表示样本容量,k 表示估计参数的个数,n-k 表示自由度,本例n=23,k=2,n-k=21,RSS=9.307010,可通过Eviews 命令求解:
=@sqrt(9.307010/21)=0.665725883815,与方程的输出结果0.665726一致。

残差平方和(Sum squared resid ):如上,本例的残差平方和为∑=2i e RSS 9.307010。

对数似然估计值(Log likelihood ):可以通过观察方程的约束式和非约束式的对数似然的差异来进行似然比检验。

F 统计量(F-Statistic ):这是对回归方程的所有系数均为零(不包括常数项)的假设检验。

如果F 统计量超过了临界值,那么至少有一个系数可能不为零。

)
1(--=
k n RSS k ESS F 这里,k 为解释变量的个数。

本例F 统计量的值为46.80275。

显著性水平为0.05的临界值为@qfdist(0.95,1,21)=4.3248<46.80275,故模型中的解释变量城市失业率对被解释变量劳动参与率有显著影响。

F 统计量的概率值(Prob.(F-statistic)):类似于T 统计量的概率值,表示F 统计量的边际显著性水平,F 统计量值越大,概率值越小,当概率值小于给定的显著性水平时,拒绝所有系数都为零的原假设。

本例概率值为0.000001=1-@cfdist(46.80275,1,21)=1-0.999999,小于0.05的显著性水平。

因变量样本均值(Mean dependent var ):,本例因变量clfpr 的
n Y Y i ∑=样本均值为65.89565。

因变量样本标准差(S.D. dependent var ):本例因变量clfpr 的样本标准差
为1.168713,计算公式如下
∑--=
2)(1
1
..Y Y n D S i 赤池信息准则(Akaike info criterion ):赤池信息准则简记为AIC,计算公式为[2]205
n
k n RSS Log AIC /)1(2)(++=式中,Log 表示自然对数,k 表示解释变量的个数,不包括常数项。

AIC 被用来
检验回归模型中是否应该添加一个新的解释变量,或者为时间序列模型中滞后
项数的选择提供指导,添加一个新变量在提高了拟合优度的同时,也降低了自
由度和增加了方程的复杂性,AIC 小者为优。

2(k+1)/n 被称为惩罚因子。

施瓦兹准则(Schwarz Criterion ):
)(1
)(n Log n
k n RSS Log SC ++
=施瓦兹准则与AIC 类似,它们具有基本相同的解释。

汉南-奎因准则(Hannan-Quinn criter.):
))
((2)(n Log Log n
k
n RSS Log HQ +=比较而言,施瓦兹准则的惩罚项比赤池信息准则更严厉,汉南-奎因准则对
新增变量的惩罚介于两者之间(参考文献[3],p233)。

HQ 准则仅仅用于二元选
择模型、排序模型、审查回归模型和计数模型。

DW 统计量(Durbin-Watson stat.):用来对序列相关性进行检验。

5、在方程窗口点击View/Representations 按钮,出现图3-4
图3-4 回归结果报告
可以根据图3-4的最后一行或根据图3-3,并对系数保留两位小数,报告回归结果如下:
cunr clfpr 65.096.69^
-= se= (0.094566)t= (-6.841253)=0.675529 n=23(1980-2002)2R 由上面的回归报告的t 统计量的值可知(也可直接观察t 统计量的概率值),
经济形势对城市劳动参与率有显著影响,城市失业率每上升1个百分点,城市
劳动参与率下降0.65个百分点,即受挫工人效应大于增加工人效应。

6、在方程窗口点击View/Actual,Fitted,Residual/ Actual,Fitted,Residual Table,或View/Actual,Fitted,Residual/ Actual,Fitted,Residual Graph,分别出现图3-5和图3-6。

图3-5 实际值、拟合值和残差表 图3-6 实际值、拟合值和残差图7、在方程窗口点击View/Residual Tests/ Histogram-Normality Test ,出现图3-7。

图3-7 直方图与正态性检验
图3-7的左边是残差序列的直方图。

右边是残差序列的描述性统计量,其中JB 统计量的值为2.04213<5.99=@qchisq(0.95,2),其中@qchisq(0.95,2)是自由度为2,显著性水平为0.05的卡方分布的单侧分位数;或者由最后一行的概率值1-@cchisq(2.043213,2)=0.360016>0.05,所以不能拒绝残差序列为正态分布的原假设。

8、在误差正态性假设下
~^1β))var(,(^11ββN ~)
(^11
^1βββse -)1,0(N 但计算时,需要知道总体标准差。

在未知时,用回归标准误差替
)(^1βse σσ^σ代时,上述分布不再是标准正态分布,而是t 分布,即~)(^11
^1βββse -)
2(-n t 当显著性水平为时,
α,
αβββαα-=-<-<--1))2()()2((2^11
^12n t se n t P 或者
α
βββββαα-=*-+<<*--1))()2()()2((^
12^11^1^1se n t se n t P 所以,的置信系数为的置信区间为1βα-1)]
()2(),()2([^
12^1^12^1ββββααse n t se n t *-+*--Eviews 的操作步骤①计算置信区间的上界,在命令窗口输入以下命令
Scalar CI_beta1_HIGH=eq1.@coefs(2)+(@qtdist(0.975,(eq1.@regobs-eq1.@ncoef)))*eq1.@stderrs(2)并回车,双击工作文件窗口中的图标CI_beta1_HIGH ,可以看到在屏幕左下角的状态栏出现Scalar CI_beta1_HIGH=-0.4503.
②计算置信区间的下界,在命令窗口输入
Scalar CI_beta1_low=eq1.@coefs(2)-(@qtdist(0.975,(eq1.@regobs-eq1.@ncoef)))*eq1.@stderrs(2)并回车,双击工作文件窗口中的图标CI_beta1_low ,可以看到在屏幕左下角的状态栏出现Scalar CI_beta1_low=-0.8436.
所以,回归系数置信度为0.95的置信区间为[-0.8436, -0.4503],该系数不包
括零。

通过计算回归系数在一定置信度下的置信区间,观察其是否包含零,是对系数进行显著性检验的另一种方法。

9、在问题4中,我们已经利用了1980-2002年的数据,对问题2中建立的回归方程进行了估计。

现在为了预测,首先利用1980-1999年的数据对回归方程进行估计,然后利用估计的方程对2000-2002年的劳动参与率进行点估计和区间估计。

⑴点预测
打开Eviews工作文件clfpr-cunr.wfl,点击主菜单Quick/Equation Estimation,在Equation Specification窗口输入clfpr c cunr,将样本范围改变为1980-1999,点击确定。

在方程窗口的工具条中,点击Name,在Name to identify object窗口输入eq2,点击确定。

在eq2窗口的工具条中选择Forecast,在Forecast name中输入clfprf,表示预测值序列;在s.e.(optional)中输入seclfprf,表示预测标准误;在Sample range to forecast中输入2000-2002,点击确定。

出现图3-8。

图3-8 城市劳动参与率在2000-2002年的预测值
在预测期内的差别,
表3-2 实际值与预测值为了观察clfprf和clfpr
的差别。

图3-9 城市劳动参与率的实际值与预测值
(2)区间预测
下面以2000年为例,2001与2002年的方法相同。

根据(3.9)式,为求预测区间,需要给出三个值:
①clfpr 在2000年的点预测值,这可由表3-2获得,即67.38931;=2000clfprf ②点预测的标准差,可由seclfprf 序列获得,即0.751246;=2000sec lfprf ③t 统计量的临界值,这里,在命令窗口输入)2(2-n t α,05.0=α20=n Scalar t=@qtdist(0.975,(eq2.@regobs-eq2.@ncoef))可得t=2.10092204024。

这样就可以求得预测区间为:
[,]
2000025.02000sec *)18(lfprf t clfprf -2000025.02000sec *)18(lfprf t clfprf +即[65.8110,68.9676]。

注:也可通过公式(3.8)计算:
2000sec lfprf ∑=--++=n i i f f x x
x x n y se 12
2
^^)()(11)(σ由方程EQ2窗口可观察到=0.685562
^σ由序列的描述性统计量可知解释变量cunr 的均值为6.51,解释变量的离差平方和的计算可通过以下两个命令实现。

Genr cunrdevsq=(cunr-@mean(cunr))^2
scalar sumdevsq=@sum(cunrdevsq)在工作文件目录窗口点击标量sumdevsq 图标,左下角显示41.778。

所以 =0.7512462000sec lfprf 778.41)51.64(20
11685562.02-++=从以上预测标准差的计算可知,预测误差有两个来源:一是残差的不确定性,即公式(3-8)的第一项,本例为=0.685562;二是系数的不确定性,
^
σ^σ即公式(3-8)的第二项平方根,本例为1.09581。

六、作业
1、实际工资对人们工作意愿的影响
根据表3-1的1980-2002美国城市劳动力参与率与实际平均每小时国内工资数据,完成以下问题
⑴查阅文献资料和书籍,学习实际工资对劳动参与率的理论影响,据此建立一元线性回归模型;
⑵用Eviews 软件绘制ahe82与CLFPR 之间的散点图,观察两变量之间的线性关
系;
⑶根据劳动经济学理论,对回归系数的符号进行预期并加以解释;
⑷利用表3-1提供的数据,利用OLS 法估计所建立的回归方程;
⑸在Word 文件中报告回归结果并对回归结果进行解释;
⑹显示因变量的实际值、拟合值,残差表(残差图);
⑺绘制回归残差的直方图,并对残差进行正态性检验;
⑻计算回归系数置信度为0.95的置信区间,该区间包括零吗?
2、身高对体重的影响
表3-2 身高与体重序号
身高(Height )体重(Weight )性别(Gender )
1
2
…注:性别填写中,女=0,男=1,身高以厘米(cm )为单位,体重以公斤(kg )为单位。

根据表3-2的数据,完成以下问题
⑴以身高为横坐标、体重为纵坐标绘制身高与体重的散点图,观察两变量之间
的线性关系;⑵建立体重对身高的一元线性回归模型;
⑶用OLS 估计总体回归方程,并据以报告回归结果;
⑷解释回归结果系数的含义;
⑸检验身高系数在0.05的水平下是否显著?
⑹求解身高系数置信度为0.95的置信区间,该置信区间是否包括零?⑺在0.05的显著性水平下,检验残差是否服从正态分布?
3、The capital asset pricing model (CAPM) can be written as
(*)])([)(f m i f i R R E R R E -+=βThe first step in using the CAPM is to estimate the stock’s beta using the market model. The market model can be written as
(**)it mt i i it R R μβα++=Where is the excess return for security i at time t,is the excess return on it R mt R a proxy for the market portfolio at time t, and is an iid random disturbance t μterm. The cofficient beta in this case is also the CAPM beta for security i.
Suppose that you had estimated (**) and found that the estimated value of beta for a stock, was 1.147. The standard error associated with this ^
βcoefficient SE() is estimated to be 0.0548. ^β
(1)A city analyst has told you that this security closely follows the market, but that it is no more risky, on average, than the market. This can be tested by the null hypotheses that the value of beta is one. The model is estimated over 62 daily observations. Test this hypothesis against a one-sided alternative that the security is more risky than the market, at the 5% level. Write down the null and alternative hypothesis. What do you conclude? Are the analyst’s claims empirically verified?
(2)The analyst also tells you that shares in Chris Mining PLC have no systematic risk, in other words that the returns on its shares are completely unrelated to movements in the market. The value of beta and its standard error are calculated to be 0.214 and 0.186, respectively. The model is estimated over 38 quarterly observations.
Write down the null and alternative hypotheses. Test this null hypothesis against a two-sided alternative.
(3)Form and interpret a 95% and a 99% confidence interval for beta using the figures given in question (1).
(4)Are hypotheses tested concerning the actual values of the coefficients (i.e.β) or their estimated values (i.e.) and why?^。

相关文档
最新文档