管理统计学多元线性回归分析,案例应用步骤解析及EXCEL操作详解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学
(第二版)
修正多重判定系数
(adjusted multiple coefficient of determination)
1. 用样本容量n和自变量的个数p去修正R2得到 2. 计算公式为
3. 避免增加自变量而高估 R2 4. 意义与 R2类似 5. 数值小于R2
统计学
(第二版)
估计标准误差 Sy
2. 求解各回归参数的标准方程如下
Q b 0 Q b i 0
ˆ b0 b0
0
ˆ bi bi
(i 1,2, , p )
统计学
(第二版)
参数的最小二乘法
(例题分析)
【例】一家大型商业银行在多个地区设有分行, 为弄清楚不良贷款形成的原因,抽取了该银行 所属的25家分行2002年的有关业务数据。试建 立不良贷款(y)与贷款余额(x1)、累计应收贷款 (x2)、贷款项目个数(x3)和固定资产投资额(x4)的 线性回归方程,并解释各回归系数的含义
Coefficients 标准误差 t Stat P-value Intercept -0.8687 0.951548 -0.91294 0.391634 Miles Traveled 0.061135 0.009888 6.182397 0.000453 Number of Deliveries 0.923425 0.221113 4.176251 0.004157
(第二版)
多元回归模型
(基本假定)
1. 误差项ε是一个期望值为0的随机变量,即 E()=0 2. 对于自变量x1 ,x2 ,…,xp 的所有值, 的 方差2都相同 3. 误差项ε是一个服从正态分布的随机变量, 即ε~N(0,2),且相互独立
统计学
(第二版)
多元回归方程
(multiple regression equation)
ˆ ˆ ˆ ˆ 1. 用样本统计量 b 0 , b1 , b 2 ,, b p 估计回归方 程中的 参数 b 0 , b1 , b 2 ,, b p 时得到的方程 2. 由最小二乘法求得 3. 一般形式为
ˆ ˆ ˆ ˆ ˆ y b 0 b1 x1 b 2 x2 b p x p
t Stat 2.660526279 0.329713665 1.402393325 -0.256331212
P-value Lower 95% Upper 95% 0.009145 9576.962637 65858.23 0.742335 -11577.29206 16189.45 0.164023 -30.8649232 179.4585 0.798244 -38.15618421 29.42862
1. 对误差项的标准差的一个估计值 2. 衡量多元回归方的程拟合优度 3. 计算公式为
统计学
(第二版)
3 显著性检验
一. 线性关系检验 二. 回归系数检验和推断
统计学
(第二版)
线性关系检验
统计学
(第二版)
线性关系检验
1. 检验因变量与所有自变量之间的是否显著 2. 也被称为总体的显著性检验 3. 检验方法是将回归离差平方和(SSR)同剩余离 差平方和(SSE)加以比较,应用 F 检验来分 析二者之间的差别是否显著
一元回归结果
SS MS F Significance F 1 15.8713 15.8713 15.81458 0.004080177 8 8.028696 1.003587 9 23.9
Intercept Miles Traveled
Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%下限 95.0%上限 95.0% 1.273913 1.400745 0.909454 0.389687 -1.95621171 4.504038 -1.95621 4.504038 0.067826 0.017056 3.976755 0.00408 0.028495691 0.107156 0.028496 0.107156
ˆ ˆ ˆ ˆ b 0 , b1 , b 2 ,, b p是 估计值 ˆ y 是 y 的估计值
b 0 , b1 , b 2 ,, b p
统计学
(第二版)
参数的最小二乘估计
统计学
(第二版)
参数的最小二乘法
1. 使因变量的观察值与估计值之间的离差平方和 ˆ ˆ ˆ ˆ 达到最小来求得 b 0 , b1 , b 2 ,, b p 。即
统计学
(第二版)
第8讲 多元线性回归
1 2 3 4 5 6
多元线性回归模型 回归方程的拟合优度 显著性检验 多重共线性 利用回归方程进行估计和预测 虚拟自变量的回归
统计学
(第二版)
1 多元线性回归模型
一. 多元回归模型与回归方程 二. 估计的多元回归方程 三. 参数的最小二乘估计
统计学
(第二版)
多元回归模型与回归方程
统计学
(第二版)
多元回归模型
(multiple regression model)
1. 一个因变量与两个及两个以上自变量的回归 2. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型 3. 涉及 p 个自变量的多元回归模型可表示为
1. 描述因变量 y 的平均值或期望值如何依赖 于自变量 x1, x2 ,…,xp的方程 2. 多元线性回归方程的形式为 E( y ) = b0+ b1 x1 + b2 x2 +…+ bp xp
b1,b2,,bp称为偏回归系数
bi 表示假定其他变量不变,当 xi 每变 动一个单位时,y 的平均变动值
y b 0 b1 x1i b 2 x2i b p x pi i
b0 ,b1,b2 ,,bp是参数 是被称为误差项的随机变量 y 是x1,,x2 , ,xp 的线性函数加上误差项 包含在y里面但不能被p个自变量的线性关系 所解释的变异性
统计学
(第二版)
例:巴特勒运输公司
巴特勒运输公司的主营业务地域为本地, 为了建立更好的工作日程表,经理们计划为 他们的驾驶员估计日常行驶时间。
26
统计学
(第二版)
Miles Number Travel Time Traveled of Deliveries (hours) 100 4 9.3 50 3 4.8 100 4 8.9 100 2 6.5 50 2 4.2 80 2 6.2 75 3 7.4 65 4 6.0 90 3 7.6 90 2 6.1
统计学
(第二版)
二元回归方程的直观解释
二元线性回归模型 y
y b 0 b1 x1 b 2 x2
(观察到的y)
b0
回归面
}
i
x2 (x1,x2) x1
E ( y) b 0 b1 x1 b 2 x2
统计学
(第二版)
估计的多元回归方程
统计学
估计的多元回归的方程
(第二版) (estimated multiple regression equation)


如果是显著的,因变量与自变量之间存在线性 关系 如果不显著,因变量与自变量之间不存在线性 关系
统计学
(第二版)
1. 提出假设


线性关系检验
H0:b1b2bp=0 线性关系不显著 H1:b1,b2,,bp至少有一个不等于0
2. 计算检验统计量F
3. 确定显著性水平和分子自由度p、分母自由度np-1找出临界值F 4. 作出决策:若F>F ,拒绝H0
用Excel进行回归
统计学
(第二版)
2 回归方程的拟合优度
一. 多重判定系数 二. 估计标准误差
统计学
(第二版)
多重判定系数
统计学
多重判定系数
(第二版) (multiple coefficient of determination)
1. 回归平方和占总平方和的比例 2. 计算公式为
3. 因变量取值的变差中,能被估计的多元回 归方程所解释的比例
统计学
(第二版)
多重共线性及其产生的问题
统计学
(第二版)
多重共线性
(multicollinearity)
1. 回归模型中两个或两个以上的自变量彼此 相关 2. 多重共线性带来的问题有

可能会使回归的结果造成混乱,甚至会把分 析引入歧途
可能对参数估计值的正负号产生影响,特别 是各回归系数的正负号有可能同我们与其的 正负号相反
27
统计学
(第二版)
10.0
Travel time
8.0 6.0 4.0 2.0 0.0 0 20 40 60 80 Miles traveled 100 120
28
统计学
(第二版)
SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 df 回归分析 残差 总计 0.814906 0.664071 0.62208 1.001792 10
MS 25500572782 626135896.4
F Significance F 40.7269 4.56894E-17
Coefficients 标准误差 Intercept 37717.59 14176.74195 Bedrooms 2306.081 6994.19244 H Size 74.29681 52.97857934 Demand -4.36378 17.0240013
0.400575489 1.446275
统计学
(第二版)
回归系数的解释
ˆ y 0.8687 0.0611 Miles 0.9234Deliv
b1=0.0611 当送货次数不变时,行驶里程每 增加1英里,行驶时间期望的估计值增 加0.0611小时。 b2=0.9234 当行驶里程不变时,送货次数每 增加1次,行驶时间期望的估计值增加 0.9234小时。
2. 计算检验的统计量 t
3. 确定显著性水平,并进行决策

t>t2,拒绝H0; t<t2,不拒绝H0
统计学
(第二版)
回归系数的推断
(置信区间)
回归系数在(1-)%置信水平下的置信区间为
ˆ b i t 2 (n p 1)s bˆ
回归系数的 抽样标准差
i
统计学
31
统计学
(第二版)
来自百度文库
4 多重共线性
一. 多重共线性及其所产生的问题 二. 多重共线性的判别 三. 多重共线性问题的处理
统计学
(第二版)
例:房屋售价
一个房地产经纪人认为房屋的售价可由房屋的面积、卧室 的个数和潜在需求人数来预测。他随机选取了100座 房屋并收集数据如下:
Price 124100 218300 117800 . . Bedrooms 3 4 3 . . H Size 1290 2080 1250 . . demand 3900 6600 3750 . .

统计学
(第二版)
多重共线性的识别
统计学
(第二版)
统计学
(第二版)
回归统计 Multiple R 0.950678 R Square 0.903789 Adjusted R Square 0.8763 标准误差 0.573142 观测值 10 方差分析 df 回归分析 残差 总计
二元回归结果
SS MS F Significance F 2 21.60056 10.80028 32.87837 0.00027624 7 2.299443 0.328492 9 23.9 Lower 95% Upper 95% -3.118752683 1.38135 0.037752041 0.084517
33
统计学
(第二版)
回归统计 Multiple R 0.74833 R Square 0.559998 Adjusted R0.546248 Square 标准误差 25022.71 观测值 100 方差分析 df 回归分析 残差 总计 3 96 99
三元回归结果
SS 76501718347 60109046053 1.36611E+11
统计学
(第二版)
回归系数检验和推断
统计学
(第二版)
回归系数的检验
1. 对每一个自变量都要单独进行检验 2. 应用 t 检验统计量
统计学
(第二版)
1. 提出假设

回归系数的检验
(步骤)
H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系)
相关文档
最新文档