统计学实验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、一元回归分析
实例分析(2):
选取中国1978~2002年中国研究经费与中国GDP 之间的数量关系,建立的一元回归模型如下:
i i i x y εβα++=
其中,y i 是中国GDP ,x i 是中国研究经费 线性回归分析的基本步骤及结果分析:
①绘制散点图
图1
②简单相关分析
表1
分析:从表1中可得到两变量之间的皮尔逊相关系数为0.928,双尾检验概率p 值尾0.000<0.05,故变量之间显著相关。根据“中国研究经费”与“中国GDP ”之间的散点图与相关分析显示,“中国研究经费”与“中国GDP ”之间存在显著的正相关关系。
在此前提下进一步进行回归分析,建立一元线性回归方程。 ③线性回归分析
(1)表2给出了回归模型的拟和优度(R Square )、调整的拟和优度(Adjusted R Square )、估计标准差(Std. Error of the Estimate )以及Durbin -Watson 统计量。
从结果来看,回归的可决系数和调整的可决系数分别为0.860和0.854,即GDP的85%以上的变动都可以被该模型所解释,拟和优度较高。
表2
(2)表3给出了回归模型的方差分析表,可以看到,F统计量为141.616,对应的p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
表3
(3)表4给出了回归系数、回归系数的标准差、标准化的回归系数值以及各个回归系数的显著性t检验。从表中可以看到无论是常数项还是解释变量x,其t统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了t 检验。变量US经费的回归系数为0.090,即US经费每增加1百万美元,USGDP
就增加0.090个十亿美元。
表4
(4)为了判断随机扰动项是否服从正态分布,观察图2所示的标准化残差的P -P图,可以发现,各观测的散点基本上都分布在对角线上,据此可以初步判断残差服从正态分布。
为了判断随机扰动项是否存在异方差,根据被解释变量y与解释变量x的散点
图,如图1所示,从图1中可以看到,随着解释变量x的增大,被解释变量y的波动
幅度明显增大,说明随机扰动项可能存在比较严重的异方差问题,应该利用加权
最小二乘法等方法对模型进行修正。
图2
二、多元回归分析
表5给出了Pearson 简单相关系数,相关检验t 统计量对应的p 值。相关系数右上角有两个星号表示相关系数在0.01的显著性水平下显著。从表中可以看出,3个指标之间的相关系数都在0.8以上,对应的p 值都接近0,表示3个指标具有较强的正相关关系,而托宾Q 值与其他3个变量之间的相关性较弱。
表5
案例分析(4):
选取美国1978~2002年US 研究经费与研究人员与GDP 之间的数量关系,建立的多元回归模型如下:
i i i e x x y +++=2110ˆˆˆβββ 其中,Y 是中国GDP ,
X i1是中国研究经费, Xi 2是中国研究人员
线性回归分析的基本步骤及结果分析:
①简单相关分析
从表6中可得到
USGDP 与US 经费的皮尔逊相关系数为0.977,双尾检验概率p 值尾0.000<0.05, USGDP 与US 人数的皮尔逊相关系数为0.991,双尾检验概率p 值尾0.000<0.05, US 经费与US 人数的皮尔逊相关系数为0.987,双尾检验概率p 值尾0.000<0.05, 故变量之间显著相关。进一步进行回归分析,建立一元线性回归方程。
表6
②线性回归分析
(1)表7给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted R Square)、估计标准差(Std. Error of the Estimate)以及Durbin-Watson统计量。从结果来看,回归的可决系数和调整的可决系数分别为0.982和0.981,即GDP 的98%以上的变动都可以被该模型所解释,拟和优度较高。
表7
(2)表8给出了回归模型的方差分析表,可以看到,F统计量为610.725,对
应的p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。
表8
(3)表9给出了回归系数、回归系数的标准差、标准化的回归系数值以及各
个回归系数的显著性t检验。从表中可以看到无论是常数项还是解释变量x,其t
统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了
t检验。
变量US人数的回归系数为6.395,即US人数每增加1人,USGDP就增加6.395
个十亿美元。变量US经费(百万美元)的回归系数为-0.001,及US经费每增加
一百万美元,USGDP就增加十亿美元。
表9
10.13
各季度季节指数如下:
根据分离后的季节因素后的数据计算的趋势方程为:Y t=2043.392+163.7064t