多重线性回归与相关
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
coefficient),是βj的估计值,表示当方程中其他自变量
保持常量时,自变量Xj变化一个计量单位,反应变量Y的平 均值变化的单位数。
10
ˆ )2 [Y (b b X b X Q (Y Y 0 1 1 2 2
求偏导数(一阶)
bk X k )]2
原
理
最小二乘法
或大部分为定量指标,若有少量定性或等级指标需 作转换。
用途:解释和预报。 意义:由于事物间的联系常常是多方面的,一个应
变量的变化可能受到其它多个自变量的影响,如糖 尿病人的血糖变化可能受胰岛素、糖化血红蛋白、 血清总胆固醇、甘油三脂等多种生化指标的影响。
4
第一节
多重线性回归的概念 与统计推断
l11b1 l12b2 l b l b 21 1 22 2 lk 1b1 lk 2b2
l1k bk l1Y l2 k bk l2Y lkk bk lkY
bk X k )
i j
b0 Y (b1 X 1 b2 X 2
… … … … …
Xk X1k X2k ┇ Xnk
Y Y1 Y2 ┇ Yn
条件
(1) Y 与 X 1 , X 2 , , X k 之间具有线性关系。 (2)各例观测值 Yi (i 1,2 , , n) 相互独立。 并服从正态分布。
7
(3) 残差 e~N (0, 2 ) 且各自变量与应变量 Y 具有相同方差,
lij ( X i X i )( X j X j ) X i X j l jY ( X j X j )(Y Y ) X jY n
X X
j
, i , j=1,2, ,k j 1, 2 ,k
X Y ,
n
统计软件包
ˆ 0.14166 0.00011619 X 0.00449 X 0.00000655X 0.03468X Y 1 2 3 4 11
0 为常数项, 1 , 2 , , k 为偏回归系数,表示在其它自变
量保持不变时, X j 增加或减少一个单位时 Y 的平均变化 量,e 是去除 k 个自变量对 Y 影响后的随机误差(残差) 。
6
多元回归分析数据格式
例号 1 2 ┇ n
X1 X11 X21 ┇ Xn1
X2 X12 X22 ┇ Xn2
0.45 0.50 1.50 0.40 0.90 0.80 1.80
0.066 0.076 0.001 0.170 0.156 0.120 0.040
948 1440 1084 1844 1116 1656 1536
22.5 21.5 28.5 26.0 35.0 20.0 23.0
69 79 59 73 92 83 57
F ~F (k , n k 1)
12
多元线性回归方差分析表 ( 0.05)
变异来源 总变异 回 归 残 差
5
一、数据与多元线性回归模型
• • • • 变量:应变量 1 个,自变量k 个,共 k+1 个。 样本含量:n 数据格式见表13-1 回归模型一般形式:
Yi 0 1 x1i 2 x2i ... k xki i
上式表示数据中应变量 Y 可以近似地表示为自变量
X1, X 2 , , X k 的线性函数。
建立回归方程(样本)
一 般 步 骤
ˆ b b X b X Y 0 1 1 2 2
bk X k
(2)检验并评价回归方程 及各自变量的作用大小
9
二、多元线性回归方程的建立
样本估计而得的多重线性回归方程
ˆ b0 b1x1 b2 x2 ... bk xk y
bj为自变量Xj 的偏回归系数(partial regression
2.00 2.40 3.00 1.00 2.80 1.45 1.50
0.005 0.011 0.003 0.140 0.039 0.059 0.087
1500
1200 1476
21.8
27.0 27.0
77
58 65
0.60
1.70 0.65
0.120
0.100 0.129
960
1784 1496
24.8
多重线性回归与相关
(multiple linear regression & multiple correlation)
1
实际中一个指标往往受到多个因素的影响,或者与多个因素之 间都有联系 建立糖尿病人空腹血糖的测量值和血清总胆固醇、甘油三酯、 空腹胰岛素、糖化血红蛋白之间的联系
一些疾病的患病率 空气污染物含量 病情的好转过程
第二节 假设检验及其评价
(一)对回归方程
1. 方差分析法: H 0 : 1 2 k 0 ,
H1 : 各(j=1,2, ,k) 不全为 0, j
0.05
SS总 SS回 SS残
SS回 / k MS回 F SS残 ( / n k 1) MS残
23.3 27.0
67
83 65
1.50
0.90 0.65
0.039
0.222 0.145
1820
1436
22.0
28.0
83
68
0.40
2.00
0.135
0.099
1060
1436
26.0
28.0
58
68
1.83
2.00
0.029
0.099
8
(1)求偏回归系数 b0 , b1 , b2 , , bk
车流 (X1)
气温 (X2)
气湿 (X3)
风速 (XFra Baidu bibliotek)
一氧化氮 (Y)
车流 (X1)
气温 (X2)
气湿 (X3)
风速 (X4)
一氧化氮 (Y)
1300 1444 786 1652 1756 1754 1200
20.0 23.0 26.5 23.0 29.5 30.0 22.5
80 57 64 84 72 76 69
通常需要在研究设计阶段,根据专业知识,合理地选择需要纳 入的变量
2
content
第一节 第二节 第三节 第四节 第五节 多重线性回归的概念与统计推断 假设检验及其评价 复相关系数与偏相关系数 自变量筛选 多元线性回归的应用与注意事项
3
目的:作出以多个自变量估计应变量的多元线性回
归方程。
资料:线性回归中应变量为定量指标;自变量全部