回归分析的基本思想及其初步应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析的基本思想及其初步应用
1.回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报. 2.线性回归模型
(1)在线性回归直线方程y ^=a ^+b ^x 中,b ^=∑n
i =1 (x i -x )(y i -y )∑n
i =1
(x i -x )2
,a ^=y --b ^x -,其中x -=1
n ∑n
i =1x i ,y -=1n
∑n
i =1
y i ,(x ,y )称为样本点的中心,回归直线过样本点的中心. (2)线性回归模型y =bx +a +e ,其中e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.
[注意] (1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具.
(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^
为基数,x 每增加1个单位,y 相应地平均增加b ^
个单位.
3.刻画回归效果的方式
方式方法
计算公式 刻画效果
R 2
R 2=1-∑n
i =1
(y i -y ^i )2
∑n i =1
(y i -y )2
R 2越接近于1,表示回归的效果
越好
残差图
e ^
i 称为相应于点(x i ,y i )的残差,e ^
i =y i -y ^
i
残差点比较均匀地落在水平的
带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高
残差平方和
∑n
i =1
(y i -y ^i )2 残差平方和越小,模型的拟合效果越好
判断正误(正确的打“√”,错误的打“×”) (1)求线性回归方程前可以不进行相关性检验.( )
(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号.( )
(3)利用线性回归方程求出的值是准确值.( ) 答案:(1)× (2)√ (3)×
变量x 与y 之间的回归方程表示( )
A .x 与y 之间的函数关系
B .x 与y 之间的不确定性关系
C .x 与y 之间的真实关系形式
D .x 与y 之间的真实关系达到最大限度的吻合 答案:D
在两个变量y 与x 的回归模型中,分别选择了4个不同的模型,它们的相关指数R 2
如下,其中拟合效果最好的模型是( )
A .模型1的相关指数R 2
为0.98 B .模型2的相关指数R 2
为0.80 C .模型3的相关指数R 2
为0.50 D .模型4的相关指数R 2
为0.25 答案:A
已知线性回归方程y ^
=0.75x +0.7,则x =11时,y 的估计值为________. 答案:8.95
探究点1 线性回归方程
在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 之间的一组观察值如下表.
x (s) 5 10 15 20 30 40 50 60 70 90 120 y (μm)
6
10
10
13
16
17
19
23
25
29
46
(1)画出散点图;
(2)求y 对x 的线性回归方程;
(3)利用线性回归方程预测时间为100 s 时腐蚀深度为多少. 【解】 (1)散点图如
图所示.
(2)从散点图中,我们可以看出y 对x 的样本点分布在一条直线附近,因而求回归直线方程有意义.
x =111
(5+10+15+ (120)
=
51011,y =111(6+10+10+…+46)=21411
,
a ^
=y -b ^
x ≈
21411-0.304×510
11
= 5.36. 故腐蚀深度对腐蚀时间的线性回归方程为y =0.304x + 5.36.
(3)根据(2)求得的线性回归方程,当腐蚀时间为100 s 时,y ^
=5.36+0.304×100=35.76(μm),即腐蚀时间为100 s 时腐蚀深度大约为35.76 μm.
求线性回归方程的三个步骤
(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系. (2)求回归系数:若存在线性相关关系,则求回归系数.
(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.
炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,
必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y (从炼料熔化完毕到出钢的时间)的数据(x i ,y i )(i =1,2,…,10)并已计算出=1
589,
i =1
10
y i =1 720,
故冶炼时间y 对钢水的含碳量x 的回归直线方程为y ^
=1.267x -30.47. 探究点2 线性回归分析