高考数学复习点拨 阐释回归分析的基本思想
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考数学复习点拨阐释回归分析的基本思想
在客观世界中,变量间总是相互联系、相互依存的。
变量之间的关系大致可以分为两类:一类是具有确定性的函数关系,另一类是非确定性的关系。
非确定性的关系在统计学中称为相关关系。
回归分析就是通过分析、判断来确定相关变量之间的内在关系的一种统计方法,即寻找相关关系中非确定性关系的某种确定性。
1 相关关系与函数关系的异同点:
相同点:均是指两个变量的关系。
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。
2 散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图,散点图形象地反映了各对数据的密切程度。
3 求回归直线方程的思想方法:
设所求的直线方程为,其中a、b是待定系数,
则,于是得到各个偏差
,
显见,偏差的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和
表示n个点与相应直线在整体上的接近程度。
记
上述式子展开后,是一个关于a、b的二次多项式,采用配方法,可求出使Q为最小值时的a、b的值,即
其中。
4 随机误差:当样本点散布在某一条直线的附近,而不是在一条直线上时,可用下面的线
形回归模型来表示:
y=bx+a+e
其中a和b为模型的未知参数,e称为随机误差。
5 相关系数:对于任何给定的一组样本(x i y i)( i =1,2,…n )都可以用最小二乘法建立起一个线
性回归模型,相应地就可以得到一条回归直线。
但是,这样的一条回归直线并不是总有意义的,只有当变量X与Y之间确实存在某种因果关系时,其回归直线才有意义。
统计学中要确定变量X和Y之间是否确实存在线性相关,通常利用相关系数来检验。
相关系数记作r,它能够较精确地描述两个变量之间线性相关的密切程度。
当r>0时称Y与X正相关;当r<0时称Y与X 是负相关。
6线性回归模型的残差原因:
第一是所选择的数学模型不适合,变量间不是线性关系而建立了线性模型;第二是模型中所包含的自变量数目不合适,或是遗漏了某些重要的影响因素,或是包含了不必要的其他因素等。
一般地,残差平方和越小的模型,拟和的效果越好;类似地,还可用R2来比较两个模型的拟和效果,R2越大,模型的拟和效果也越好。
7建立回归模型的步骤:
(1)确定研究对象,明确解释变量、预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察是否存在线性关系等;
(3)确定回归方程的类型;
(4)按一定的规则估计回归方程中的参数;
(5)得出结果后分析残差图是否有异常,若存在异常,则探明原因。