高中数学课件——线性回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455
b

87175 7 30399.3 7000 7 302

4.75
a 399.3 4.7530 257
因此所求的回归直线方程是 yˆ 4.75x 257
n
( yi bxi a)2 i 1
Q 取得最小值的 a,b 的求值公式


n
n
(xi x )( yi y)
xi yi nxy
b i1

n
(xi x )2

i 1
a y bx
i1 n xi2 nx 2 i 1
我们将所得到的方程叫做回归直线方程,相应的直线叫做 回归直线,而对两个变量所进行的上述统计分析叫做线性 回归分析.
可以证明,| r | ≤1,且| r | 越接近于1,相关程度越大;| r | 越接近于 0,相关程度越小.
7
xi yi 7xy
r
i 1
0.9733
7
7
( xi2 7x 2 )( yi2 7 y 2 )
i 1
i 1
Hale Waihona Puke 在这些点附近可画直线不止一条,哪条 直线最能代表x与y之间的关系呢?
回归直线的计算步骤
一般地,设x与y是具有相关关系的两个变量,且相应于n
个观测值的n个点 (xi , yi )大致分布在一条直线的附近,我
们来求在整体上与这n个点最接近的一条直线.
设所求的直线的方程为 yˆ bx a 叫做回归直线方程
yˆi bxi a (i 1, 2,L n) 偏差 yi yˆi yi bxi a (i 1, 2,L n)
偏差的符号有正有负,相加相互抵消,所以和不能代表几 个点与相应直线在整体上的接近程度. 采用n个偏差的平方和
Q ( y1 bx1 a)2 ( y2 bx2 a)2 L ( yn bxn a)2
变量的相关性
如图是一组观测值的散点图.我们看到,图中的各点并 不集中在一条直线的附近,但是按照上面的方法,同样 可以就这组数据求得一个回归直线方程.这显然是毫无 意义的.
于是提出一个问题:所求得的回 归直线方程,在什么情况下才能 对相 应的一组观测值具有代表 意 义呢?
对于变量y与x的一组观测值来说,我们把
线性回归
两个变量之间的关系
确定性的函数关系 正方形边长x 确定关系
面积S x 2
随机性的相关关系 一块农田的水稻产量与施肥量之间的关系:
气候情况 施肥量 不确定关系 浇水
水稻产量
除虫
自变量取值一定时,因变量的取值带有一定随机性的 两个变量之间的关系叫做相关关系.
回归分析
相关关系是一种非确定性关系.对具有相关关系的两个 变量进行统计分析的方法叫做回归分析. 例如:在7块并排、形状大小相同的试验田上进行施肥量对 水稻产量影响的试验,得到如下所示的一组数据:
施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455 当施肥量x一定时,水稻产量y的值带有一定的随机性
施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455
散点图
图中各点,大致分布在 某条直线附近。
n
n
(xi x )( yi y)
xi yi nxy
r
i 1
即r
i 1
n
n
n
n
(xi x )2 ( yi y)2
( xi2 nx 2 )( yi2 ny 2 )
i 1
i 1
i 1
i 1
叫做变量y与x之间的样本相关系数,(简称相关系数),
相关文档
最新文档