线性回归模型y=bxae增加了随机误差项e

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归直线过样本点的中 心.
设y = x+
n 2 n i 1 i 1
+ e
2
设 ( yi yi ) yi xi =Q( , ).
ˆ 分别是使 ˆ 和斜率 b 从已经学过的知识知道 , 截距a Qα,β yi βxi α 取最小值时 α,β的值.
i1 n
n
i
x y i y
i
x
i1
x
, α y βx .
2
这正是我们所要推导的 公式.
下面我们通过案例 , 进一步学习回归分析的 基本思想及其应用 .
二、举例
例1 从某大学中随机选取 8名女大学生 , 其身高和体 重数据如表3 1所示. 编号 1 2 3 4 5 6 7 8 身高/ cm 165 165 157 170 175 165 155 170 体重 / kg 48 57 50 54 64 61 43 59
n
2
x i x y i y n 2 i1 y i y . n 2 i1 x x i
n i1
2
在上式中,后两项和 α,β无关,而前两项为非负 数,因此要使 Q取最小值 ,当且仅当前两项的值 均为0,即有
β
x
3.1 回归分析的基本思想及 其初步应用
一、复习
1、变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间 的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是否 有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得
到如下所示的一组数据:
施化肥量x 水稻产量y
15
20
25 365
30
35
40
45
330 345
405 445
450 455
自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系叫做相关关系。 注 1):相关关系是一种不确定性关系; 2): 对具有相关关系的两个变量进行统计 分析的方法叫回归分析。
图3.1 1
从图3.1 1 中可以看出 , 样本点呈条状分布 ,身 高和体 重有比 较好的 线性相关关系 ,因此可 以用线 性回归方程 刻 画它们之间的关系 .
y
70 65 60 55 50 45 40 150 155 160 165 170 175
x
180
图3.1 1
根据探究中的公式 1和2,可以得到 ˆ 0.849. ˆ 85.712, b a ˆ 0.849x ˆ 85.712. 于是得到回归方程 y 所以, 对身高为172cm的女大学生 ,由回归方程可以 预报其体重为 y 0.849 172 85.712 60.316kg .
求根据一名女大学生的 身高预报她的体重的回 归方程, 并预报一名身高为 172cm的女大学生的体重 . y 70 解 由于问题中要求根 65 据身高预报体重 ,因此选 60 55 取身高为自变量 x , 真实 50 45 x 体重为因变量 y .作散点 40 150 155 160 165 170 175 180 图 (图3.1 1) :
2、求回归直线方程的步骤:
1 n 1 n (1)求 x xi , y yi n i 1 n i 1
(2)求 xi 2 , xi yi .
i 1 i 1 n n
(3)代入公式

b
^
( x x)( y y) x y nx y
i 1 i i
n
n
( x x)
y βx αny nβx ny βx 0,
所以 Qα, β y i βx i y βx ny βx α
2 i1 n 2
β
2
x
i1
n
i
x 2β x i x y i y
x1 , y1 , x2 , y2 , , xn , yn ,
我们知道其回归方程的截距和斜率的最小 二乘估计公式分别为 :
ˆx ˆ y b a
1
ˆ b
ຫໍສະໝຸດ Baidux
i1 n
n
i
x y i y
i
x
i1
x
,
2
2
n 1 n 其中x x i , y yi .x, y 称为样本点的 n i1 i1 公式吗? 中心.你能推导出这两个计算
2
i1
i1
注意到 yi βxi y βx y βx α
i1
n
y βx α yi βxi y βx
i1
n
n n y βx α yi β xi ny βx i1 i1
2 i1 2 2
n
y i y ny βx α
i1
n
xi x yi y n 2 2 ny βx α xi x β i1 n 2 i1 x x i i1
i 1 ^ i
n

2
i 1 n
i
i
x
i 1
2 i
nx
2
,
a y b x,......(1)
^
^ (4)写出直线方程为y=bx+a, 即为所求的回归直线方程。
对于具有线性相关关系的变量 x 和 y, 其回归直线方程为^ y =2x-1,当 x=0.5 时,其估计值为__. 0
对于一组具有线性相关关系的数据
2 i1 n
ˆ 分别是使 ˆ 和斜率 b 从已经学过的知识知道 , 截距a Qα,β yi βxi α 取最小值时 α,β的值.
2 n i1
由于Qα,β yi βxi y βx y βx α
n
2
y βx α y βx α
2 n 2
yi βxi y βx 2yi βxi y βx
2 i1
n

i1
yi βxi y βx 2 yi βxi y βx
n
y βx α ny βx α ,
相关文档
最新文档