4.3统计模型检验与评价解析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
QT ( yi y )2 l yy
i 1 N
描述了观察值相对数据平均值的离散程度. 分解总偏差平方和
2 2 ˆ ˆ QT [( yi yi ) ( yi y ) ] i 1
N
N
ˆ i )2 ( y ˆ i y ) 2 QR QE ( yi y
2
QE
/1
/( n 2)
QR ~ F (1, n 2) QE /( n 2)
对Y的影响程度越高 .
给定的显著性水平α,H0:b=0的拒绝域为
( f (1, n 2), )
其中
P{F f (1, n 2)} 1
若拒绝H0,称线性回归方程是显著的,或 称X与Y的线性相关关系显著. 类似地, 检验多元(经验)线性回归方程
y1 , y2 ,, y N ,
记
ˆx , ˆi a ˆb y i
(i 1,2,, N )
作为yi,(i=1,2,…,N)的估计值.
ˆ1 , y ˆ 2 ,, y ˆ N的偏差原因: y1 , y2 ,, y N与y
1) 自变量X的不同取值致使因变量Y产生 的变化; 2) 其它因素(包括试验误差)的影响. 关心哪一个方面的影响占主导. 总偏差平方和
ˆ b0 b1 x1 b2 x2 bP x P y
线性关系是否显著,需检验
H 0 : 0 0, 1 0, P 0
若H0成立,即有多元线性回归模型中β 的每一分量均为零,则Y与之间无显著的线 性相关关系.
仍将总偏差平方和分解为
QT QR QE
一般更需要用一定的方法对模型进行检 验和评价, 选择更“合理”的模型. 本节主要介绍多元线性回归模型的评价 和检验方法. 选择下线性回归模型描述因变量Y与自 变量X1,X2,... XP的关系
ˆ 0 1 x1 2 x2 P x P y
有以下问题值得思考:
1) 因变量Y与可控变量X1,X2,... XP是否 确) 是否所有回归系数 0 , 1 ,, P 都不为零? 回归系数的 显著性检验 3) 回归方程中, 设定的可控变量的个数及 相应变量是否合理? “最优”回归 方程的选择
若H0成立,统计量
QR / P F ~ F ( P , N P 1) QE /( N P 1)
若算得F的统计值f 使 f f ( P , N P 1) 在显著性水平下,可认为方程有显著意义. 续例1.7.5 非线性交调的频率设计(1993 年全国大学生数学模型联赛题) . 对经验回归方程
二、 回归方程的显著性检验
根据数据建立线性经验数学模型
ˆx ˆ a ˆb y
形式地估计回归系数并建立经验线性 回归方程无实际意义. 问题: 1.变量之间是否存在线性相关关系? 2.上述方程对样本数据的代表程度如何?
身高h 和 体重m无 明显的 线性相 关关系.
模型对 数据的 代表程 度不够
需做两方面的检验工作: 1. 评价方程对样本数据的代表程度; 2. 检验变量之间的线性关系是否显著. 1. 线性关系检验 1) 相关系数检验法 2. 方差分析法 以分析一元线性回归模型入手. 已学
一元经验线性回归模型
ˆx ˆ a ˆb y
取定可控变量X的一组值x1,x2,…,xN, 对Y做独立n次观察(试验),其观察值为
y(t ) 0.2441u(t ) 0.04538u (t ) 0.0004132u (t ).
4.3
统计模型检验 与评价
一、模型检验的必要性 基于数据用统计方法建立经验回归模型, 做了以下工作: 1)借助于数据散布图的直观形象, 选择 一个函数来近似变量之间的相关关系;
2)用最小二乘法求经验模型中参数的最 佳估计.
问题:如何评价此建模方法?
分析: 若两个随机变量X、Y 间存在相关关系, 设其回归函数为 y=μ(x). 客观存在 选择一个函数 f(x) 作为 y=μ(x)的估计函数. 主观设定
i 1 i 1
N
ˆ i y) QR ( y
2 i 1
N
l
2 xy
l xx
回归平方和
反映在线性回归方程中由自变量X值的 变化致使因变量Y变化的差异程度.
回归平方和QR表征了自变量X的重要程度
ˆ i ) l yy QE ( yi y
2 i 1
n
l
2 xy
l xx
残差平方和
反映试验误差和其它因素对试验结果的影 响程度. 对于正态线性回归模型
Y a bx , ~
2 N (0, )
若满足回归假定.即对X的不同取值,独立试验 结果的残量
1) 1 , 2 ,, N 相互独立; 2)具有相同分布: i~N(0,σ2). 相应统计量
ˆ ( x) f ( x) 相当于做假设, 令
或
ˆ ( x1 , x2 ,, xP ) S ( x1 , x2 ,, xP ) μ
这种假设主观性太强,是否合理必须 经过检验.
续例1.7.5 p141 非线性交调的频率设计 (1993全国大学生数学模型联赛题) . 得到系统输入输出的两个经验关系式为
y(t ) 0.049 0.24u(t ) 0.046u (t ) 0.00041u (t ).
2 3
y(t ) 0.2441u(t ) 0.04538u2 (t ) 0.0004132u3 (t ).
需对两个不同模型进行评价和合理性检验. 考虑到输入输出关系的物理背景(这一 点在处理实际问题时尤需重视)可以判断第 二式更为合理.
QT
2
~ ( n 1),
2
QE
2
~ 2 ( n 2),
当b 0 时,
并且 QE 和QR 相互独立.
2
QR
~ (1),
2
若X与Y之间存在线性相关关系,回归方
程中应有b ≠0. 检验假设
QR
2
H0 : b 0
若H0成立,则由F分布定理知统计量
F
QR的值越大,统计量F的值越大,说明X
i 1 N
描述了观察值相对数据平均值的离散程度. 分解总偏差平方和
2 2 ˆ ˆ QT [( yi yi ) ( yi y ) ] i 1
N
N
ˆ i )2 ( y ˆ i y ) 2 QR QE ( yi y
2
QE
/1
/( n 2)
QR ~ F (1, n 2) QE /( n 2)
对Y的影响程度越高 .
给定的显著性水平α,H0:b=0的拒绝域为
( f (1, n 2), )
其中
P{F f (1, n 2)} 1
若拒绝H0,称线性回归方程是显著的,或 称X与Y的线性相关关系显著. 类似地, 检验多元(经验)线性回归方程
y1 , y2 ,, y N ,
记
ˆx , ˆi a ˆb y i
(i 1,2,, N )
作为yi,(i=1,2,…,N)的估计值.
ˆ1 , y ˆ 2 ,, y ˆ N的偏差原因: y1 , y2 ,, y N与y
1) 自变量X的不同取值致使因变量Y产生 的变化; 2) 其它因素(包括试验误差)的影响. 关心哪一个方面的影响占主导. 总偏差平方和
ˆ b0 b1 x1 b2 x2 bP x P y
线性关系是否显著,需检验
H 0 : 0 0, 1 0, P 0
若H0成立,即有多元线性回归模型中β 的每一分量均为零,则Y与之间无显著的线 性相关关系.
仍将总偏差平方和分解为
QT QR QE
一般更需要用一定的方法对模型进行检 验和评价, 选择更“合理”的模型. 本节主要介绍多元线性回归模型的评价 和检验方法. 选择下线性回归模型描述因变量Y与自 变量X1,X2,... XP的关系
ˆ 0 1 x1 2 x2 P x P y
有以下问题值得思考:
1) 因变量Y与可控变量X1,X2,... XP是否 确) 是否所有回归系数 0 , 1 ,, P 都不为零? 回归系数的 显著性检验 3) 回归方程中, 设定的可控变量的个数及 相应变量是否合理? “最优”回归 方程的选择
若H0成立,统计量
QR / P F ~ F ( P , N P 1) QE /( N P 1)
若算得F的统计值f 使 f f ( P , N P 1) 在显著性水平下,可认为方程有显著意义. 续例1.7.5 非线性交调的频率设计(1993 年全国大学生数学模型联赛题) . 对经验回归方程
二、 回归方程的显著性检验
根据数据建立线性经验数学模型
ˆx ˆ a ˆb y
形式地估计回归系数并建立经验线性 回归方程无实际意义. 问题: 1.变量之间是否存在线性相关关系? 2.上述方程对样本数据的代表程度如何?
身高h 和 体重m无 明显的 线性相 关关系.
模型对 数据的 代表程 度不够
需做两方面的检验工作: 1. 评价方程对样本数据的代表程度; 2. 检验变量之间的线性关系是否显著. 1. 线性关系检验 1) 相关系数检验法 2. 方差分析法 以分析一元线性回归模型入手. 已学
一元经验线性回归模型
ˆx ˆ a ˆb y
取定可控变量X的一组值x1,x2,…,xN, 对Y做独立n次观察(试验),其观察值为
y(t ) 0.2441u(t ) 0.04538u (t ) 0.0004132u (t ).
4.3
统计模型检验 与评价
一、模型检验的必要性 基于数据用统计方法建立经验回归模型, 做了以下工作: 1)借助于数据散布图的直观形象, 选择 一个函数来近似变量之间的相关关系;
2)用最小二乘法求经验模型中参数的最 佳估计.
问题:如何评价此建模方法?
分析: 若两个随机变量X、Y 间存在相关关系, 设其回归函数为 y=μ(x). 客观存在 选择一个函数 f(x) 作为 y=μ(x)的估计函数. 主观设定
i 1 i 1
N
ˆ i y) QR ( y
2 i 1
N
l
2 xy
l xx
回归平方和
反映在线性回归方程中由自变量X值的 变化致使因变量Y变化的差异程度.
回归平方和QR表征了自变量X的重要程度
ˆ i ) l yy QE ( yi y
2 i 1
n
l
2 xy
l xx
残差平方和
反映试验误差和其它因素对试验结果的影 响程度. 对于正态线性回归模型
Y a bx , ~
2 N (0, )
若满足回归假定.即对X的不同取值,独立试验 结果的残量
1) 1 , 2 ,, N 相互独立; 2)具有相同分布: i~N(0,σ2). 相应统计量
ˆ ( x) f ( x) 相当于做假设, 令
或
ˆ ( x1 , x2 ,, xP ) S ( x1 , x2 ,, xP ) μ
这种假设主观性太强,是否合理必须 经过检验.
续例1.7.5 p141 非线性交调的频率设计 (1993全国大学生数学模型联赛题) . 得到系统输入输出的两个经验关系式为
y(t ) 0.049 0.24u(t ) 0.046u (t ) 0.00041u (t ).
2 3
y(t ) 0.2441u(t ) 0.04538u2 (t ) 0.0004132u3 (t ).
需对两个不同模型进行评价和合理性检验. 考虑到输入输出关系的物理背景(这一 点在处理实际问题时尤需重视)可以判断第 二式更为合理.
QT
2
~ ( n 1),
2
QE
2
~ 2 ( n 2),
当b 0 时,
并且 QE 和QR 相互独立.
2
QR
~ (1),
2
若X与Y之间存在线性相关关系,回归方
程中应有b ≠0. 检验假设
QR
2
H0 : b 0
若H0成立,则由F分布定理知统计量
F
QR的值越大,统计量F的值越大,说明X