第十二讲回归分析优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
xi,y1nin1
yi
x2 1 ni n1xi2,x y1 ni n1xiyi
( 经 验 ) 回 归 方 程 为 : y ˆ ˆ 0 ˆ 1 x y ˆ 1 ( x x )
2 2
n
记 Qe Q(ˆ0 , ˆ1 )
yi ˆ0 ˆ1xi 2
n
( yi yˆi )2
i 1
i 1
H 0 : 1 0; H1 : 1 0 进行检验.
假 设 H 0 : 1 0 被 拒 绝 , 则 回 归 显 著 , 认 为 y 与 x 存 在 线 性 关
系 , 所 求 的 线 性 回 归 方 程 有 意 义 ; 否 则 回 归 不 显 著 , y 与 x 的 关 系 不 能 用 一 元 线 性 回 归 模 型 来 描 述 , 所 得 的 回 归 方 程 也 无 意 义 .
称 Qe 为残差平方和或剩余平方和.
2 的无偏估计为
ˆ
2 e
Qe
(n 2)
称
ˆ
2 ewk.baidu.com
为剩余方差(残差的方差),
ˆ
2 e
分别与
ˆ0
、
ˆ1
独立
。
ˆ e 称为剩余标准差.
一个好的拟合方程,其残差应越小越好。残差越小,
拟合值与观测值越接近,各观测点在拟合直线周围聚 集的紧密程度越高,也就是说,拟合方程 解释y 的能 力越强。另外,当剩余标准差 越小时,还说明残差值
第十二讲回归分析
回归分析在一组数据的基础上研究这样几个问题: (i)建立因变量y与自变量x , x , , xm 之间的回归模型 (经验公式); (ii)对回归模型的可信度进行检验; (iii)判断每个自变量x (i=1,2,…,m) 对y 的影响是否 显著; (iv)诊断回归模型是否适合这组数据; (v)利用回归模型对y 进行预报或控制。
Y 0 1 x , 称 为 y 对 x 的 回 归 直 线 方 程 .
一元线性回归分析的主要任务是:
1 、 用 试 验 值 ( 样 本 值 ) 对 0 、 1 和 作 点 估 计 ; 2 、 对 回 归 系 数 0、 1作 假 设 检 验 ;
3 、 在 x x = 0处 对 y 作 预 测 , 对 y 作 区 间 估 计 .
其 中 r 1 1 n 2 F 1 1 1 , n 2
2、回归系数的置信区间
0 和 1 置 信 水 平 为 1 - α 的 置 信 区 间 分 别 为
ˆ 0 t1 2 ( n 2 )ˆ e1 n L x x 2 ,x ˆ 0 t1 2 ( n 2 )ˆ e1 n L x x 2 x
回归分析
一元线性回归
多元线性回归
* *
* *
数 学 模 型 及 定 义
模 型 参 数 估 计
检 验 、 预 测 与 控 制
性可 回线 归性 (化 曲的 线一 回元 归非 )线
数 学 模 型 及 定 义
模 型 参 数 估 计
检 验 与 预 测
多 元 线 性 回
归
逐 步 回 归 分 析
中
的
一、数学模型
的变异程度越小。由于残差的样本均值为零。所以, 其离散范围越小,拟合的模型就越为精确。
三、检验、预测与控制
1一、般显地著,性检回验归方程的假设检验包括两个方面:一个是对 模型的检验,即检验自变量与因变量之间的关系能否用 一个线性模型来表示,这是由F 检验来完成的;另一个 检验是关于回归参数的检验,即当模型检验通过后,还 要具体检验每一个自变量对因变量的影响程度是否显著。 这是由t 检验完成。在一元线性分析中,由于自变量的 个数只有一个,这两种检验是统一的,它们的效果完全 是等价的。但是,在多元线性回归分析中,这两个检验 的意义是不同的。从逻辑上说,一般常在F 检验通过后, 再例进如一对步回进归行方程t 检Y 验。0 1x 的显著性检验,归结为对假设
故 T t 1 ( n 2 ) , 拒 绝 H 0, 否 则 就 接 H 受 0.
2
n
n
其Lx中 x (xix)2 xi2nx2
i 1
i 1
(Ⅲ)r检验法
n
( x i x ) y i ( y )
记 r i 1
n
n
( x i x ) 2( y i y ) 2
i 1
i 1
当 | r | > r 1 - α 时 , 拒 绝 H 0 ; 否 则 就 接 受 H 0 .
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
102
100
98
96
94
92
90
88
86
84
140
145
150
155
160
165
散点图
y01x
一 般 地 , 称 由 y01x确 定 的 模 型 为 一 元 线 性 回 归 模 型 ,
记 为
y01x E 0 ,D 2 固 定 的 未 知 参 数 0、 1称 为 回 归 系 数 , 自 变 量 x也 称 为 回 归 变 量 .
i1
i1
最 小 二 乘 法 就 是 选 择 0和 1 的 估 计 ˆ0, ˆ1 使 得
Q(ˆ0,ˆ1)m 0,1Q in (0,1)
ˆ
0
y
ˆ1 x
ˆ
1
xy x y x2 x2
n x i x y i y
或 ˆ 1 i 1 n
x i x 2
i 1
其中
x1 n ni1
(Ⅰ)F检验法 当 H 0成 立 时 ,FQ e/U n (2)~F( 1, n-2)
n
其 中 U y ˆiy2( 回 归 平 方 和 ) i1
故 F>F 1(1,n2), 拒 绝 H 0 , 否 则 就 接 受 H 0 .
(Ⅱ)t检验法
当 H 0 成 立 时 , T L ˆ x e ˆ 1 x ~ t ( n - 2 )
二、模型参数估计
1、回归系数的最小二乘估计
有 n组 独 立 观 测 值 , ( x1, y1) , ( x2, y2) , … , ( xn, yn)
设 E yi i 0 0, D xi12 i,i且 11,22,, ....n ..n,相 , 互独立
n
n
记 QQ(0,1) i2 yi 01xi2
例1 测16名成年女子的身高与腿长所得数据如下:
身 高 1 4 31 4 51 4 61 4 71 4 91 5 01 5 31 5 41 5 51 5 61 5 71 5 81 5 91 6 01 6 21 6 4 腿 长 8 8 8 5 8 8 9 1 9 2 9 3 9 3 9 5 9 6 9 8 9 7 9 6 9 8 9 91 0 01 0 2