多元线性回归概述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

定义:线性回归模型中的解释变量有多个。一般表现形式:多元线性回归模型k :解释变量个数;i =1,2…,n

βj :回归参数(Regression Coefficient );j=1,2…,k 习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。这样:

i ki k i i i X X X Y μββββ++⋅⋅⋅+++=22110虚变量

X 0=1模型中解释变量的数目为(k+1)

指2个或2个以上

多元线性回归模型总体回归函数的随机表达形式:

i ki k i i i X X X Y μββββ++⋅⋅⋅+++=22110总体回归函数非随机表达式:

ki k i i ki i i i X X X X X X Y E ββββ+⋅⋅⋅+++=2211021),,|( 偏回归系数βj :在其他解释变量保持不变的情况下,X j 每变化1个单位时,Y 的均值E(Y)的变化;或者说X j 的单位变化对Y 均值的“直接”或“净”(不含其他变量)影响。

方程表示:各变量X 值给定时Y 的平均响应。

总体回归模型n 个随机方程的矩阵表达式为

μ

X βY +=)1(212221212111111+⨯⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=k n kn n n k k X X X X X X X X X X 121⨯⎥⎥⎥⎥

⎦⎤⎢⎢⎢⎢⎣⎡=n n Y Y Y Y 1)1(210⨯+⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=k k ββββ β1

21⨯⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n n μμμ μ其中n :样本容量k :解释变量的个数

e i 称为残差或剩余项(Residuals),μi

的近似替代样本回归函数:

ki ki i i i X X X Y ββββˆˆˆˆˆ22110++++= 其随机表示式: i

ki ki i i i e X X X Y +++++=ββββˆˆˆˆ22110 βX Y ˆˆ=e βX Y +=ˆ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=k βββˆˆˆˆ10 β⎪⎪⎪⎪⎪⎭

⎫ ⎝⎛=n e e e 21e 其中

或样本回归函数的矩阵表达:

假设1,解释变量是非随机的或固定的,

且各X 之间互不相关(无多重共线性)。假设2,随机误差项具有零均值、同方差及不序列相关性这是一元线性回归模型没有的0

)(=i E μ2

2)()(σμμ==i i E Var 0

)(),(==j i j i E Cov μμμμn

j i j i ,,2,1, =≠

假设3,解释变量与随机项不相关

假设4,随机项满足正态分布

0),(=i ji X Cov μk

j ,2,1 =)

,0(~2σμN i

假设1,n ⨯(k+1)矩阵X 是非随机的,X 的秩ρ=k+1,即X 满秩。假设2,0)()()(11=⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛=n n E E E E μμμμ μ()⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛='n n E E μμμμ 11)(μμ⎪⎪⎪⎭⎫ ⎝⎛=21121n n n E μμμμμμ I

222

11100)var(),cov(),cov()var(σσσμμμμμμ=⎪⎪⎪⎭

⎝⎛

=⎪⎪⎪⎭⎫ ⎝⎛= n n n 上述假设的矩阵符号表示式

假设3,E(X’μ)=0,即0

)()()(11=⎪⎪⎪⎪⎪

⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛∑∑∑∑∑∑i Ki i i i i Ki i i i E X E X E X X E μμμμμμ 假设4,向量μ有一多维正态分布,即

)

,(~2I 0μσN 上述假设的矩阵符号表示式

假设5,样本容量趋于无穷时,各解释变量的方差趋于有界常数,即n →∞时,

j j ji ji Q X X n x n →-=∑∑22)(11或Q

x x →'n 1

其中:Q 为一非奇异固定矩阵,矩阵x 是由各解释变量的离差为元素组成的n ⨯k 阶矩阵

⎪⎪

⎝⎛=kn n k x x x x 1111x

假设6,回归模型的设定是正确的。

模型里面,该包含的所有解释变量,都应该放到模型里面,不应该遗漏。

X必须以正确的函数形式,引到模型里面。

相关文档
最新文档