多元线性回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、多元线性回归模型 二、多元线性回归模型的基本假设
本节重点内容
1.多元线性回归模型一般形式 2.偏回归系数的含义 3.多元线性回归模型的基本假设(与一元
相比,多元的基本假设的不同点)
多元线性回归模型的一般形式
• P72例3.2.2:考虑2006年中国内地城镇居民家 庭全年人均消费支出与人均可支配收入及其上 一年人均消费支出的关系
总体回归模型——一般采用的形式
• 总体回归模型:总体回归函数的随机表达形式
Y 0 1X1 2 X2 k X k
该模型表示Y可表现为对总体均值的波动。源自样本回归函数与样本回归模型
• 从一次抽样中获得的总体回归函数的近似,称为样 本回归函数(sample regression function)。
3. 理解以一元为基础,注意多元中出现的新概 念及其与一元的不同点。
本章内容
• 多元线性回归模型概述 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测 • 可化为线性的非线性模型 • 受约束回归 • 注:本章矩阵表述部分不涉及
§3.1 多元线性回归模型概述 (Regression Analysis)
• 样本回归函数:
Yˆ ˆ0 ˆ1X1 ˆ2 X2
• 样本回归模型: Y ˆ0 ˆ1X1 ˆ2X2 e
总体回归函数
• 总体回归函数:描述在给定解释变量X条件下 被解释变量Y的条件均值。
E(Y | X1, X 2, X k ) 0 1X1 2 X 2 k X k
k为解释变量的数目(采用此说法)。 习惯上,把常数项看成为虚变量的系数,该虚 变量的样本观测值始终取1。 于是,模型中解释变量的数目为(k+1)。
• 多元模型(二元) • PRF-某类家庭人均消费支出与两个相关因素之
间的函数关系
• PRM-某家庭人均消费支出与两个相关因素之 间的相关关系-均值+波动
• SRF-PRF的估计 • SRM-PRM的估计
• 总体回归函数: E(Y | X1, X2 ) 0 1X1 2 X2
• 总体回归模型: Y 0 1X1 2 X 2
Yˆ ˆ0 ˆ1X1 ˆ2 X2 ˆk Xk
• 样本回归函数的随机形式,称为样本回归模型 (sample regression model)。
残差
Y ˆ0 ˆ1X1 ˆ2 X2 ˆk Xk e
多元线性回归模型的下标
下标示例:某班共30名同学,考察期末考试各同学 的计量成绩。 • 计量成绩=0.2*平时成绩+0.7*考试成绩+0.1*实 验成绩
值,抽取样本后它们的值就确定了。
i 表示对应于每组(Xi1, Xi2,…, Xik, Yi)的随机
误差项,是未知的。
• 如果给出一组样本观测值,则总体回归模型将 表述为
Yi 0 1Xi1 2 Xi2 k Xik i i=1,2…,n
• 样本回归函数将表述为
Yˆi ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik i=1,2…,n
• 样本回归模型将表述为
Yi ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik ei
i=1,2…,n
多元线性回归模型偏回归系数的含义
E(Y | X1, X 2, X k ) 0 1X1 2 X 2 k X k
j称为回归系数(regression coefficient),j(从1
Y 0.2X 1 0.7X 2 0.1X 3
甲的化学成绩=0.2*甲的平时成绩+0.7*甲的 考试成绩+0.1*甲的实验成绩
Y 1 0.2 X 11 0.7 X 12 0.1X 13
• 乙的计量成绩= 0.2*乙的平时成绩+0.7*乙的 考试成绩+0.1*乙的实验成绩
Y 2 0.2 X 21 0.7 X 22 0.1X 23
• 用一般形式表示即为:
Y i 0.2 X i1 0.7 X i2 0.1X i3
i=1,2,…,30
多元线性回归模型一般形式中的下标表述:
Yi 0 1X i1 2 X i2 k X ik i
i=1,2,…,n
Yi表示被解释变量的第i个观测值 Xij表示第j个解释变量的第i个观测值,在下标中
第三章 经典单方程计量经济学模型:多 元线性回归模型
Multiple Linear Regression Model
说明 1. “多元”是指线性回归模型中的解释变量有
多个(两个以上),指需要考虑所有这些变量 对被解释变量的影响。
2. 无论是模型的一般形式,还是参数估计及检 验等多元都是一元的推广。
• 多元模型(二元)
散点图说明:每个个别的家庭的消费支出都有差异, 即使收入相同。但平均来说,随着收入的增加,消费 支出也在线性增加。
3500
每 月 消 费 支 出
Y (元)
3000 2500 2000 1500 1000
500
0
500
1000
1500 2000 2500 3000 每月可支配收入X(元)
开始)也被称为偏回归(斜率)系数(partial regression coefficients)(与一元不同点)。
j表示在其他解释变量保持不变的情况下, Xj每变化1个单位时,Y的均值E(Y|…)的变化。
或者说j给出了Xj的单位变化对Y均值的
“直接”或“净”(不含其他变量)影响。 P72例3.2.2
3500
4000
• 总体回归函数: E(Y | X ) 0 1X
• 总体回归模型: Y E(Y | X ) 0 1X
•
样本回归函数:
Yˆ
E(Y |
X
)
ˆ0
ˆ1 X
• 样本回归模型:
Y
Yˆ
ˆ
E(Y
|
X
)
ˆ
ˆ0
ˆ1 X
e
• P72例3.2.2:考虑2006年中国内地城镇居民家 庭全年人均消费支出与人均可支配收入及其上 一年人均消费支出的关系
把把表示第几个观测值的数字放在了前面,表示 第几个变量的数字放在后面。(与一元的不同点)
• 的下标表示与它相乘的是第几个解释变量, 例如 j 对应Xj。
Yi 0 1X i1 2 X i2 k X ik i
抽取共n 组样本观测值(样本数据),则
(Xi1, Xi2,…, Xik, Yi) 表示一组具体的样本观测
本节重点内容
1.多元线性回归模型一般形式 2.偏回归系数的含义 3.多元线性回归模型的基本假设(与一元
相比,多元的基本假设的不同点)
多元线性回归模型的一般形式
• P72例3.2.2:考虑2006年中国内地城镇居民家 庭全年人均消费支出与人均可支配收入及其上 一年人均消费支出的关系
总体回归模型——一般采用的形式
• 总体回归模型:总体回归函数的随机表达形式
Y 0 1X1 2 X2 k X k
该模型表示Y可表现为对总体均值的波动。源自样本回归函数与样本回归模型
• 从一次抽样中获得的总体回归函数的近似,称为样 本回归函数(sample regression function)。
3. 理解以一元为基础,注意多元中出现的新概 念及其与一元的不同点。
本章内容
• 多元线性回归模型概述 • 多元线性回归模型的参数估计 • 多元线性回归模型的统计检验 • 多元线性回归模型的预测 • 可化为线性的非线性模型 • 受约束回归 • 注:本章矩阵表述部分不涉及
§3.1 多元线性回归模型概述 (Regression Analysis)
• 样本回归函数:
Yˆ ˆ0 ˆ1X1 ˆ2 X2
• 样本回归模型: Y ˆ0 ˆ1X1 ˆ2X2 e
总体回归函数
• 总体回归函数:描述在给定解释变量X条件下 被解释变量Y的条件均值。
E(Y | X1, X 2, X k ) 0 1X1 2 X 2 k X k
k为解释变量的数目(采用此说法)。 习惯上,把常数项看成为虚变量的系数,该虚 变量的样本观测值始终取1。 于是,模型中解释变量的数目为(k+1)。
• 多元模型(二元) • PRF-某类家庭人均消费支出与两个相关因素之
间的函数关系
• PRM-某家庭人均消费支出与两个相关因素之 间的相关关系-均值+波动
• SRF-PRF的估计 • SRM-PRM的估计
• 总体回归函数: E(Y | X1, X2 ) 0 1X1 2 X2
• 总体回归模型: Y 0 1X1 2 X 2
Yˆ ˆ0 ˆ1X1 ˆ2 X2 ˆk Xk
• 样本回归函数的随机形式,称为样本回归模型 (sample regression model)。
残差
Y ˆ0 ˆ1X1 ˆ2 X2 ˆk Xk e
多元线性回归模型的下标
下标示例:某班共30名同学,考察期末考试各同学 的计量成绩。 • 计量成绩=0.2*平时成绩+0.7*考试成绩+0.1*实 验成绩
值,抽取样本后它们的值就确定了。
i 表示对应于每组(Xi1, Xi2,…, Xik, Yi)的随机
误差项,是未知的。
• 如果给出一组样本观测值,则总体回归模型将 表述为
Yi 0 1Xi1 2 Xi2 k Xik i i=1,2…,n
• 样本回归函数将表述为
Yˆi ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik i=1,2…,n
• 样本回归模型将表述为
Yi ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik ei
i=1,2…,n
多元线性回归模型偏回归系数的含义
E(Y | X1, X 2, X k ) 0 1X1 2 X 2 k X k
j称为回归系数(regression coefficient),j(从1
Y 0.2X 1 0.7X 2 0.1X 3
甲的化学成绩=0.2*甲的平时成绩+0.7*甲的 考试成绩+0.1*甲的实验成绩
Y 1 0.2 X 11 0.7 X 12 0.1X 13
• 乙的计量成绩= 0.2*乙的平时成绩+0.7*乙的 考试成绩+0.1*乙的实验成绩
Y 2 0.2 X 21 0.7 X 22 0.1X 23
• 用一般形式表示即为:
Y i 0.2 X i1 0.7 X i2 0.1X i3
i=1,2,…,30
多元线性回归模型一般形式中的下标表述:
Yi 0 1X i1 2 X i2 k X ik i
i=1,2,…,n
Yi表示被解释变量的第i个观测值 Xij表示第j个解释变量的第i个观测值,在下标中
第三章 经典单方程计量经济学模型:多 元线性回归模型
Multiple Linear Regression Model
说明 1. “多元”是指线性回归模型中的解释变量有
多个(两个以上),指需要考虑所有这些变量 对被解释变量的影响。
2. 无论是模型的一般形式,还是参数估计及检 验等多元都是一元的推广。
• 多元模型(二元)
散点图说明:每个个别的家庭的消费支出都有差异, 即使收入相同。但平均来说,随着收入的增加,消费 支出也在线性增加。
3500
每 月 消 费 支 出
Y (元)
3000 2500 2000 1500 1000
500
0
500
1000
1500 2000 2500 3000 每月可支配收入X(元)
开始)也被称为偏回归(斜率)系数(partial regression coefficients)(与一元不同点)。
j表示在其他解释变量保持不变的情况下, Xj每变化1个单位时,Y的均值E(Y|…)的变化。
或者说j给出了Xj的单位变化对Y均值的
“直接”或“净”(不含其他变量)影响。 P72例3.2.2
3500
4000
• 总体回归函数: E(Y | X ) 0 1X
• 总体回归模型: Y E(Y | X ) 0 1X
•
样本回归函数:
Yˆ
E(Y |
X
)
ˆ0
ˆ1 X
• 样本回归模型:
Y
Yˆ
ˆ
E(Y
|
X
)
ˆ
ˆ0
ˆ1 X
e
• P72例3.2.2:考虑2006年中国内地城镇居民家 庭全年人均消费支出与人均可支配收入及其上 一年人均消费支出的关系
把把表示第几个观测值的数字放在了前面,表示 第几个变量的数字放在后面。(与一元的不同点)
• 的下标表示与它相乘的是第几个解释变量, 例如 j 对应Xj。
Yi 0 1X i1 2 X i2 k X ik i
抽取共n 组样本观测值(样本数据),则
(Xi1, Xi2,…, Xik, Yi) 表示一组具体的样本观测