多元统计分析回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即有:
R2
U ST
性质: 1、具有非负性,分子分母均是不可能为负值 2、判定系数的取值范围为
3、判定系数是样本观测值的函数,它也是一个统计 量。
2 相关系数的显著性检验
X和 Y之间真实的线性相关程度用总体相关系数ρ来表示
由于总体未知,ρ无法计算,我们利用相本相关系数
(1)计算样本相关系数 r; (2)根据给定的显著性水平α和样本容量 n,查相关系数表得 到临界值 r 。 (3)若|r|大于临界值 ,则 X与 Y有显著的线性关系,否则 X 与 Y 的线性相关关系不显著。
i1
n i 1
xi yi
1( n n i1
n
xi )(
i 1
yi )
n
i 1
xi2
1 n
n
(
i 1
xi ) 2
(二)一元线性回归模型的显著性检验
一元线性回归模型检验的种类
实际意义检验 参数估计值的符号和取值范围
消费支出与可支配收入:
如果估计出来的 b小于 0 或大于 1,
统计检验 检验样本回归方程的可靠性
•所估计的样本回归直线都不可能与真实的总体回 归直线完全一致。
ei2 min
观测值的散点图及其拟合直线
(一)参数a、b的最小二乘估计
① 参数a与b的最小二乘拟合原则要求yi与yˆ i 的误
差ei的平ห้องสมุดไป่ตู้和达到最小,即
n
n
n
Q ei2 ( yi yˆi )2 ( yi a bxi )2 min
一、一元线性回归模型
引例:消费支出与可支配收入的观测值
一、一元线性回归模型
定义:假设有两个变量x 和y,x为自 变量,y为因变量。则一元线性回归模型的 基本结构形式为
y a bx
(2.1)
式中:a和b为待定参数; 1,2, ,n 为 各组观测数据的下标; a 为随机变量。
记 aˆ 和 bˆ 分别为参数a与b的拟合值,
3 回归方程的估计:
如果 b0 , b1 , , bk 分别为 0 , 1, 2 , , k
的拟和值,则回归方程为
yˆ b0 b1 x1 b2 x2 bk xk (2.12)
b0为常数,b1,b2,…bk称为偏回归系数。偏回归系数的
意义是,当其他自变量都固定时,自变量x i 每变化
n
Q ( yi yˆi )2
i 1
U 回归平方和
n
n
U ( yˆi yi )2 (a bxi a bx)2
i 1
i 1
n
b2 (xi x)2 b2 Lxx bLxy i 1
显而易见,各个样本观测点与样本回归直线靠得越紧,U 在
S中所占的比例就越大。因此,可定义这一比例为判定系数,
一个单位而使因变量平均改变的数值。
偏回归系数的推导过程:根据最小二乘
法原理, i (i 0,1,2, ,k)的估计值 b(i i 0,1,2, , k) 应该使
n
n
Q
( ya
a1
yˆ a )2
[ ya
a 1
(b0
b1x1a
b2 x2a
bk xka )]2
(.2m.1in3)
由求极值的必要条件得
( yi y)2
可以证明
i 1
(2.8)
n
S总 L yy
( yi y)2
i 1
n
n
(2.9)
( yi yˆi )2 ( yˆi y)2 Q U
i 1
i 1
③ 统计量F
F U Q n2
(2.10)
④ F越大,模型的效果越佳。统计量F~F
(1,n-2)。在显著水平α下,若F>Fα,则认为 回归方程效果在此水平下显著。一般地,当
i1
i1
i1
② 根据取极值的必要条件,有
(2.3)
n
i 1 n
i1
( yi ( yi
a a
bxi ) bxi ) xi
0
0
(2.4)
③ 解上述正规方程组(2.4)式,得 到参数a与b的拟合值
aˆ y bˆx
(2.5)
n
bˆ
Lxy
(xi
i 1
x)(yi
y)
Lxx
n
(xi x)2
则一元线性回归模型为
yˆ aˆ bˆx
(2.2)
(2.2)式代表x与y之间相关关系的拟合直 线,称为回归直线;yˆ 是y的估计值,亦称 回归值。
一般情况下的总体回归模型
假定条件下的总体回归模型
真实的总体回归直线与估计的样本回归直线
•样本回归直线是对总体回归直线的近似反映。
•回归分析的主要任务就是要采用适当的方法,充 分利用样本所提供的信息,使得样本回归函数尽 可能地接近于真实的总体回归函数。
F<F0.10(1,n-2)时,则认为方程效果不明显。
二、多元线性回归模型
1 多元线性回归模型的结构形式为
ya 0 1x1a 2 x2a k xka a (2.11) 式中: 0 , 1 , , k为待定参数; a 为
随机变量。
2 多元线性回归模型的基本假定
3 回归参数的显著性检验(t检验)
根据样本估计的结果对总体回归参数的有关假设进行检验
3、根据给定的显著水平α确定临界值,或者计算 t 值所对应的 p 值。 4、做出判断。
4 回归方程的显著性检验
① 方法:F 检验法。
② 总的离差平方和:在回归分析中,表示y的n次
观测值之间的差异,记为
n
S总 Lyy
Q
b0
n
2 ( ya
a 1
yˆ a ) 0
Q
b j
n
2 ( ya
a 1
yˆ a )x ja
0
(.2.14)
( j 1,2, , k)
方程组(3.2.14)式经展开整理后得
nb0 ( n
n
x1a )b1 (
n
x2a )b2 (
xka)bk
n
ya
a1
总的离差平方和:在回归分析中,表示y的n次观
测值之间的差异,记为
n
S总 Lyy
( yi y)2
i 1
可以证明
n
S总 Lyy
( yi y)2
i 1
(2.8)
n
n
( yi yˆi )2 ( yˆi y)2 Q U (2.9)
i 1
i 1
Q 称为误差平方和,或剩余平方和
yˆ aˆ bˆx
•拟合程度检验; •相关系数检验; •参数显著性检验(t检验); •回归方程显著性检验(F 检验)
支出
收入
计量检验 假定条件是否满足
序列相关检验 异方差性检验
1 拟合优度检验
所谓拟合程度,是指样本观测值聚集在样本回归直线周 围的紧密程度。判断回归模型拟合程度优劣最常用的数 量指标是判定系数(Coefficient of Determination)