实验七-多元回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验七 多元回归模型(2学时)

一、实验目的和要求

1. 熟练掌握多元线性回归模型的建立方法,掌握并能检验所建立回归方程的显

著性与方程系数的显著性,能根据实际问题作预测与控制;

2.掌握平方和分解公式,会编程求总离差平方和TSS 、回归平方和RSS 、残差平方和ESS 、复相关系数平方等统计量;

3.会根据实际问题对建立多元非线性回归模型,掌握多元线性回归的regress 命令格式.

二、实验内容 1.多元线性回归模型

(1)多元线性回归模型

εββββ+++++=p p X X X Y Λ22110——多元线性回归模型

p βββ,,Λ10——待定常数,回归系数,),0(~2σεN .

矩阵表示

对121,,,,-p X X X Y Λ进行n 次独立观测,得n 组数据

),,2,1()

,,,,;(21n i x x x y n i ΛΛ=

则有 i p i p i i x x y εβββ++++=,Λ110,n i ,,2,1Λ= 其中 n εεε,,,21Λ相互独立,且),(~20σεN i .

采用矩阵记号

121⨯⎪⎪⎪⎪

⎪⎭⎫ ⎝⎛=n n y y y ΛY ---观测向量

),,,,,,,p p n p n n p p x x x x x x X X X X ΛΛ

ΛΛΛΛΛΛ2111

2211111111()

(=⎪⎪⎪⎪⎪⎭

⎛=+⨯----- 设计矩阵

1

120⨯+⎪

⎪⎪

⎪⎪⎭⎫ ⎝⎛=)(p p βββΛβ----待估回归参数向量 121⨯⎪⎪

⎪⎪

⎪⎭⎫ ⎝⎛=n n εεεΛε---随机误差向量 εX βY += ——多元线性回归模型

(2)参数估计及性质

Y X X X βT T p

110-==)()ˆ,,ˆ,ˆ(ˆβββΛ----β的最小二乘估计 1

-)(1-ˆ2

p n p n ESS T --=-=Y H I Y σ----随机误差项方差εσD =2的无偏估计

βX X βX ββY p 110ˆˆˆˆ)ˆ,,ˆ,ˆ(ˆ=+++==p

T n y y y ΛΛ21---回归方程 给出p X X X ,,,Λ21,可由Y 的观测值和经验回归方程求得Y 的预测值. %求回归参数命令

(3)复相关系数及相关性检验

RSS ESS TSS +=—总离差平方和分解

21)(y y TSS n

i i -=∑= —总离差残差平方和(Total Sum of Squares )

∑∑===-=n

i i n i i y

y ESS 1

22

1ˆ)ˆ(ε —残差平方和(Error Sum of Squares ) 21

)ˆ(y y

RSS i n

i -=∑= —回归平方和(Regression Sum of squares ) TSS

ESS

TSS RSS R -

==

12——复相关系数平方 12≈R ,回归愈越显著. %求复相关系数平方命令

TSS=sum((y-mean(y)).^2) %计算总离差平方和,y 是因变量Y 数据 RSS=sum((y1-mean(y)).^2) %计算回归平方和 ESS=sum((y-y1).^2) %计算残差平方和 R2=RSS/ESS; %计算样本决定系数R2=RSS/TSS

(4)回归方程的显著性检验

检验假设:0i 101210≠≤≤↔====i p p H H ββββ,::存在Λ

统计量 )1-,(~)1-/()/(0p n p F MSE

MSR p n TSS p RSS F H -=-=

给出显著性水平α,检验p 值)(00F F P p H ≥=,当),(1-0p n p F F ->αα<⇔p 拒绝0H ,认为Y 与121,,,-p X X X Λ线性回归显著;否则线性关系不显著. %回归方程显著性检验命令

F=(n-p-1)*SSR/SSE %计算的F 统计量,n 是样本容量 F1=finv(0.95,p,n-p-1) %查F 统计量0.05的分位数 F2=finv(0.99,p,n-p-1) %查F 统计量0.01的分位数 p=1-fcdf(F,p,n-p-1) %求检验P 值,F 是上面计算结果 (5)回归系数的统计推断

检验假设 ),,,(::p k H H k k k k Λ210

010=≠↔=ββ

统计量 )(~)

ˆ(ˆ)ˆ(ˆˆˆ10

--=-=-=p n t s s c t k k

H k k k kk k k k βββββσββ真

检验p 值|)|)((|)||(|k H k k H k t p n t P t t P p 0001200≥--=≥= 当α

10->⇔-

n t

t α

,拒绝k 0H ,认为Y 与X 线性回归显著;否则不显著.

kk k

kk k k kk c s c βN c σβσβˆˆˆ,=)(),,(~)(2-1对角元为注意:XX %回归系数显著性的t 检验命令

T=b1/sqrt(SSE/(n-2))*sqrt(sum((x-mean(x)).^2)) %t 统计量观测值to, x 是自变量,b1是X 的回归系数 T1=tinv(0.975,n-p-1) %t 统计量0.05的分位数 T2=tinv(0.995,n-p-1) %t 统计量0.01的分位数 p=2-2*tcdf(T,n-p-1) %t 检验的p 值 (6)预测及统计推断

.--1)1k 2121α置信区间-置信度1βββββαα⎪⎪⎭

⎫ ⎝⎛-------

-)ˆ()(ˆ,ˆ()(ˆk k k k s p n t s p n t

因变量的点估计和区间估计

给出0x ,0y 的预测值βx ˆˆˆˆˆˆ,T p p x x x y 010*********=+++=--ββββ

相关文档
最新文档