简单线性回归案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BG
14
❖ 2、估计标准误差评价
❖ 估计标准误差是根据样本资料计算的,用 来反映被解释变量的实际值与估计值的平 均误差程度的指标,SE越大,则回归直线 的精度越低;反之,则越高,代表性越好。 当SE=0时,表示所有的样本点都落在回归 直线上,解释变量之间的表现为函数关系。
❖ 本例中,SE=4322.578,即估计标准误差 为4322.578亿元,它代表我国最终消费支 出估计值与实际值之间的平均误差为 4322.578亿元。
简单线性回归案 例
BG
1
❖ 建立我国1978-2008年最终消费支出与国内 生产总值之间的回归模型,进行参数以及总 体的显著性检验,并对经济模型进行预测。
BG
2
一、统计分析
❖ 1、图形分析:在估计模型前,可以借助图形 可以直观观察经济变量的变动规律和相关关 系。
❖ 2、相关性分析 ❖ 3、因果关系分析
❖ 施瓦茨准则(Schwarz criterion):与AIC 类似,它们具有基本相同的解释。
BG
11
❖ F统计量(F-Statistic):这是对回归式中 的所有系数均为零(除截距项或常数项) 的假设检验。如果F统计量超过了临界值, 那么至少有一个系数可能不为0。例如,如 果有三个解释变量和100个观测值,则F统 计量大于2.7将表明在至少95%的可能性上 这三个变量中的一个或多个不为0。根据F 统计量下一行给出的概率也可以方便地进 行这项检验,如果概率值小于0.05,则说明 至少有一个解释变量的回归系数不为零。
BG
8
❖ 调整的可决系数(adjusted R-squared): 它与R2相当接近,只是在方差的度量上有 微小差异,数值比R2小。
❖ 回归标准误差(SE of regression):这是 一个对预测误差大小的总体度量。它和被 解释变量的单位相同,是对残差大小的度 量。大约2/3的残差将落在正负一个标准误 差的范围内,而95%的残差将落在正负两 个标准残差的范围内。
❖ DW统计量(Durbin-Watsonstat):这是对 序列相关性进行检验的统计量,如果它比2 小很多。则证明这个序列正相关。
BG
10
❖ 赤池信息准则(Akaike info criterion):即 AIC,它对方程中的滞后项数选择提供指导。 它是在残差平方和的基础上进行的。在特 定条件下,可以通过选择是AIC达到最小的 方式来选择最优滞后分布的长度,AIC的值 越小越好。
❖ 残差平方和(Sum squared resid):它是残 差的平方和,可以用作一些检验的输入值。
BG
9
❖ 对数似然估计值(Log likelihood):这是 在系数估计值的基础上对对数似然函数的 估计值(假定误差服从正态分布)。可以 通过观察方程的约束式和非约束式的对数 似然估计值的差异来进行似然比检验。
BG
12
❖ 一元线性回归模型的结果分析
❖ 样本回归方程为:
Y 3772.9560.49957X
❖ s =(1045.481 0.009607)
❖ t =(3.608824 52.04354) ❖ R2=0.989407 F=2807.530
DW=0.112499 SE=4322.578
BG
13
四、模型检验
❖ 1、经济意义检验 ❖ 经济意义检验就是根据经济理论判断估计参数的正负号
是否合理,大小是否适当。经济意义检验要求具备较为 扎实的经济理论基础。 ❖ 就本例而言,收入增加会带动消费增加,边际消费倾向 的取值范围为0~1,回归方程中X的系数表示边际消费倾 向,回归结果为0.49957,符合经济理论中的绝对收入假 说,表示我国国内生产总值每增加100亿元,最终消费支 出平均增加49.957亿元。常数项3772.956表示自发消费, 自发消费应该大于零,回归结果与经济理论相符。
BG
3
二、模型实际操作
❖ 在Eviews对话框中,点击Quick菜单中Equation Estimation选项,在Equation specification对话框中 键入变量y c x,其中的c是指一个常量。然后在 Estimation settings 对话框中method(方法)下选 择LS-Least Squares(NLS and ARMA),即最小二 乘法。sample(样本)中的1978 2008表示的是起 止年份。
Biblioteka Baidu
BG
15
❖ 3、拟合优度检验
❖ 拟合优度是指样本回归直线与样本观测数据之 间的拟合程度,用样本决定系数的大小来表示。 决定系数用来描述解释变量对被解释变量的解 释程度。
BG
7
❖ 双侧概率(prob):此列显示了在t分布中取 得前一列的t统计量的概率。通过这一信息 可以方便地分辨出是拒绝还是接受系数真 值为零的假设。在正常情况下,概率低于 0.05即可认为对应系数显著不为零。
❖ 可决系数(R-squared): R2衡量的是在 样本范围内用回归来预测被解释变量的好 坏程度。R2=1说明回归拟合很完美,若 R2=0,则回归拟合程度较差,R2是被解释 变量能够被解释变量所解释的部分。注意, 如果回归没有截距项或常数项, R2可能是 负值。
BG
6
❖ 标准差(std.error,SE):主要用于衡量回归系数的 统计可靠性。标准误差越大,回归系数估计值越不可 靠。根据回归理论,回归系数的真值位于系数估计值 一个标准差之间的概率大约为2/3,位于两个标准差 之内的概率大约为95%。
❖ T统计量(t-Statistic):这是在假设检验中用来检验 系数是否等于某一特定值的统计量。T统计量检验的 是某个系数是否为零(即该变量是否不存在于回归模 型中),它等于系数与其标准误差之比。如果t统计 量的值大于1,则该系数的真值至少有2/3的可能性不 为零,如果t统计量的值大于2,则该系数的真值至少 有95%的可能性不为零。
❖ ls gdp c cons
BG
4
BG
5
三、输出结果说明
❖ 回归系数(coefficient):每个系数乘相应的 解释变量就形成了对被解释变量的最佳预测。 系数度量的是它所对应的解释变量对于预测 的贡献。C的系数序列是回归中的常数项或 截距项,它表示所有其他解释变量取零时预 测的基础水平。其他参数可以解释为对应解 释变量和被解释变量之间的斜率关系。