双变量回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
160
180
200
Y
每
Yi
周
消 费
Yˆi
支
出
EY | Xi
SRF: Yˆi ˆ1 ˆ2 Xi
uˆi
ui
PRF: E Y | Xi 1 2 Xi
Yi Yˆi uˆi Yi E Y | Xi ui
Xi
X
每周收入
双变量回归分析: 基本概念
cht02
§2.1 一个假想的例子
家庭收入与家庭支出之间的关系,假定一个国家的人口总体由60个家庭组成
每周收入X 80 100 120 140 160 180 200 220 240 260
每周支出 Y
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88
113 125 140
对参数为线性
对参数不是 线性
NLRM E Y | Xi 1 2 Xi
从现在起,线性回归一词总是指对参数为线性的一种回归; 对解释变量X则可以是或不是线性的。
§2.4 PRF的随机设定
uj Yj E Y | Xi
Yj E Y | Xi uj
Stochastic disturbance
Y
条件均值
每 149
周
消
费 支
101
出
65
EY | Xi
给定X=220美元 时Y的分布
在几何意义上,PRC就 是解释变量取给定值 时应变量的条件均值 的轨迹。
80
140
每周收入
220
X
§2.2 PRF/PR的概念
• Population regression function
E Y | Xi f Xi
160 189 185
115
162
191
共计
325 462 445 707 678 750 685 1043 966 1211
§2.1 一个假想的例子
• 上表的数据代表一个总体
• 条件概率
p Y 55 | X 80 1
5
p Y 60 | X 80 1
5
Conditional mean/expectation E(Y | X 80) 65
§2.1 一个假想的例子
X E(Y) 80 65 100 77 120 89 140 101 160 113 180 125 200 137 220 149 240 161 260 173
每周支出
200 180 160 140 120 100 80 60 40 20
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280
其中 f Xi 表示解释变量 X i 的某个函数
在我们人为的例子中,
E(Y|Xi)就是Xi的一个 线性函数
总体回归函数
§2.2 PRF的概念
• 函数f(xi)采取什么形式?很难清楚的知道 • 除非你得到了全部的总体值 • 在实际应用中,我们很难得到全部总体值 • PRF的函数形式,只能从经验中寻找。
§2.2 PRF的概念
• 比如,你可以提出消 费与收入间有线性关 系
E Y | Xi 1 2 Xi
线性 总体回归函数
回归系数
Regression coefficients
我们的兴趣在于根据X,Y的观测值来估计 1, 2
§2.3 线性的含义
变量带 有幂
对变量为线性
E
Y
|
Xi
1
2
X
2 i
LRM
每周收入
250
每周支出
200
总体回归线
150
Population regression line
100 总体回归曲线
Population regression curve 50
每周收入 0
290 280 270 260 250 240 230 220 210 200 190 180 170 160 150 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0
Stochastic error 非系统性成分 代理变量
系统性成分 确定性成分
§2.5 随机干扰项的意义
• 为什么不做一个包含尽可能多变量的模型? 来把这个说不清楚的干扰项去掉?
• 不可能的
理论的含糊性 数据的欠缺 核心变量与周边变量 人类行为的内在随机性 糟糕的替代变量 节省原则 错误的函数形式
§2.6 样本回归函数
总体的一个随机样本
Y
X
70
80
65
100
90
120
95
140
110
160
115
180
120
200
140
220
155
240
150
260
总体的另一个随机样本
Y
X
55
80
88
100
90
ห้องสมุดไป่ตู้
120
80
140
118
160
120
180
145
200
135
220
145
240
175
260
每周收入
290 280 270 260 250 240 230 220 210 200 190 180 170 160 150 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0
线性 (样本2)
线性 (样本1)
样本2
样本1
每周消费
0
20
40
60
80
100
120
140