实验七-多元回归模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验七 多元回归模型(2学时)
一、实验目的和要求
1. 熟练掌握多元线性回归模型的建立方法,掌握并能检验所建立回归方程的显
著性与方程系数的显著性,能根据实际问题作预测与控制;
2.掌握平方和分解公式,会编程求总离差平方和TSS 、回归平方和RSS 、残差平方和ESS 、复相关系数平方等统计量;
3.会根据实际问题对建立多元非线性回归模型,掌握多元线性回归的regress 命令格式.
二、实验内容 1.多元线性回归模型
(1)多元线性回归模型
εββββ+++++=p p X X X Y Λ22110——多元线性回归模型
p βββ,,Λ10——待定常数,回归系数,),0(~2σεN .
矩阵表示
对121,,,,-p X X X Y Λ进行n 次独立观测,得n 组数据
),,2,1()
,,,,;(21n i x x x y n i ΛΛ=
则有 i p i p i i x x y εβββ++++=,Λ110,n i ,,2,1Λ= 其中 n εεε,,,21Λ相互独立,且),(~20σεN i .
采用矩阵记号
121⨯⎪⎪⎪⎪
⎪⎭⎫ ⎝⎛=n n y y y ΛY ---观测向量
),,,,,,,p p n p n n p p x x x x x x X X X X ΛΛ
ΛΛΛΛΛΛ2111
2211111111()
(=⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛=+⨯----- 设计矩阵
1
120⨯+⎪
⎪⎪
⎪⎪⎭⎫ ⎝⎛=)(p p βββΛβ----待估回归参数向量 121⨯⎪⎪
⎪⎪
⎪⎭⎫ ⎝⎛=n n εεεΛε---随机误差向量 εX βY += ——多元线性回归模型
(2)参数估计及性质
Y X X X βT T p
110-==)()ˆ,,ˆ,ˆ(ˆβββΛ----β的最小二乘估计 1
-)(1-ˆ2
p n p n ESS T --=-=Y H I Y σ----随机误差项方差εσD =2的无偏估计
βX X βX ββY p 110ˆˆˆˆ)ˆ,,ˆ,ˆ(ˆ=+++==p
T n y y y ΛΛ21---回归方程 给出p X X X ,,,Λ21,可由Y 的观测值和经验回归方程求得Y 的预测值. %求回归参数命令
(3)复相关系数及相关性检验
RSS ESS TSS +=—总离差平方和分解
21)(y y TSS n
i i -=∑= —总离差残差平方和(Total Sum of Squares )
∑∑===-=n
i i n i i y
y ESS 1
22
1ˆ)ˆ(ε —残差平方和(Error Sum of Squares ) 21
)ˆ(y y
RSS i n
i -=∑= —回归平方和(Regression Sum of squares ) TSS
ESS
TSS RSS R -
==
12——复相关系数平方 12≈R ,回归愈越显著. %求复相关系数平方命令
TSS=sum((y-mean(y)).^2) %计算总离差平方和,y 是因变量Y 数据 RSS=sum((y1-mean(y)).^2) %计算回归平方和 ESS=sum((y-y1).^2) %计算残差平方和 R2=RSS/ESS; %计算样本决定系数R2=RSS/TSS
(4)回归方程的显著性检验
检验假设:0i 101210≠≤≤↔====i p p H H ββββ,::存在Λ
统计量 )1-,(~)1-/()/(0p n p F MSE
MSR p n TSS p RSS F H -=-=
真
给出显著性水平α,检验p 值)(00F F P p H ≥=,当),(1-0p n p F F ->αα<⇔p 拒绝0H ,认为Y 与121,,,-p X X X Λ线性回归显著;否则线性关系不显著. %回归方程显著性检验命令
F=(n-p-1)*SSR/SSE %计算的F 统计量,n 是样本容量 F1=finv(0.95,p,n-p-1) %查F 统计量0.05的分位数 F2=finv(0.99,p,n-p-1) %查F 统计量0.01的分位数 p=1-fcdf(F,p,n-p-1) %求检验P 值,F 是上面计算结果 (5)回归系数的统计推断
检验假设 ),,,(::p k H H k k k k Λ210
010=≠↔=ββ
统计量 )(~)
ˆ(ˆ)ˆ(ˆˆˆ10
--=-=-=p n t s s c t k k
H k k k kk k k k βββββσββ真
检验p 值|)|)((|)||(|k H k k H k t p n t P t t P p 0001200≥--=≥= 当α
10->⇔-
n t
t α
,拒绝k 0H ,认为Y 与X 线性回归显著;否则不显著.
kk k
kk k k kk c s c βN c σβσβˆˆˆ,=)(),,(~)(2-1对角元为注意:XX %回归系数显著性的t 检验命令
T=b1/sqrt(SSE/(n-2))*sqrt(sum((x-mean(x)).^2)) %t 统计量观测值to, x 是自变量,b1是X 的回归系数 T1=tinv(0.975,n-p-1) %t 统计量0.05的分位数 T2=tinv(0.995,n-p-1) %t 统计量0.01的分位数 p=2-2*tcdf(T,n-p-1) %t 检验的p 值 (6)预测及统计推断
.--1)1k 2121α置信区间-置信度1βββββαα⎪⎪⎭
⎫ ⎝⎛-------
-)ˆ()(ˆ,ˆ()(ˆk k k k s p n t s p n t
因变量的点估计和区间估计
给出0x ,0y 的预测值βx ˆˆˆˆˆˆ,T p p x x x y 010*********=+++=--ββββ