数学人教A版选修2-3备课参考:第三章 统计案例 3.1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计案例
3.1回归分析的基本思想及其初步应用
教学建议
通过学习我们知道,相关系数与相关指数都是来刻画线性回归模型的量,建议在教学中做好这两个量的对比.
1.相关系数是用来刻画两个变量相关关系的强弱,计算公式为r=.相关系数越接近1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,即说明建立的线性回归模型是有意义的.
2.相关指数用来度量线性回归模型的拟合效果,相关系数的计算公式为R2=1-.表达式
(y i-)2从整体上描述了用估计量来近似预报变量的效果,它越小,说明模型的拟合效果越好,表
达式(y i-)2仅与样本数据有关,与所选的模型无关,因此相关指数可以作为衡量拟合效果的一个指标,它越大,说明模型拟合的效果越好.
在含有一个解释变量的线性回归模型中,相关指数R2恰好等于相关系数r的平方,所以在一元线性回归模型中,相关指数和两个变量的相关系数都能刻画用线性回归模型拟合数据的效果.
资源拓展
如何利用残差图进行残差分析?
在回归模型中,残差变量是一个不能被观测的量,即在实际问题中我们无法得到残差变量的观测值.因此,我们不能希望有某方法获取残差变量的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包含的残差变量,这种估计对于查找样本数据中的错误和模型的评价极为有用.残差分析是回归诊断的一种方法.最简单的残差分析是通过观测残差图,以发现观测数据中可能出现的错误以及所选用的回归模型是否恰当.利用残差图进行残差分析的具体步骤如下:
(1)计算每组观测数据的残差,=y i-(i=1,2,…,n),即残差等于观测值减预测值;
(2)画残差图.残差图的纵坐标为残差,横坐标通常可以是观测样本的序号、自变量x或因变量的预测值等,残差图是一种散点图.
(3)分析残差图.几种常见的残差图如下:
图1
图2
图3
图4
我们以横坐标为观测样本的序号为例,说明每张图的含义.
图1:残差散点图中的点分布在以0为中心的水平带形区域上,并且沿水平方向散点的分布的规律相同,说明残差是随机的,所选择的回归模型建模是合理的.
图2:残差散点图中的点分布在一条倾斜的带形区域上,并且沿带形区域方向散点的分布的规律相同,说明残差与横坐标有线性关系,此时所选用的回归模型的效果不是最好的,有改进的余地.
图3:残差散点图中的点分布在一条二次曲线形的弯曲带形区域上,说明残差与坐标横轴变量有二次关系,此时所选用的回归模型的效果不是最好的,有改进的余地.
图4:残差散点图中的点的分布范围随着横坐标的增加而增加,说明残差的方差与坐标横轴变量有关,不是一个常数,此时所选用的回归模型的效果不是最好的,有改进的余地.
(4)找异常值.根据计算的残差值和残差图,观察残差是否有特别大的那些点,即远离横坐标轴的点.如果存在远离坐标轴的点,就要研究它出现的原因,是否在数据收集和录入中出现错误,如果有错误,改正后重新建立回归模型.。