第12章 回归分析[研究材料]
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
调研学习
18
调研学习
19
第二节 最小平方法
最小平方法(Least squares method), 也称最小二乘法,是将回归模型的方差之 和最小化,以得到一系列方程,从这些方 程中解出模型中需要的参数的一种方法。
调研学习
20
(一)画散点图,以初步观察成本与乘客 数量之间是否呈回归直线。
调研学习
指标是测定系数,(又称可决系数、判定
系数)。
该指标是建立在对总离差平方和进
行分解的基础之上的。
调研学习
30
离差分解图
y
(xi , yi )
{ } y yˆ
yy
}yˆ y
yˆ ˆ0 ˆ1x
y
离差分解图
调研学习
x
31
离差平方和的分解
y y ( yˆ y) ( y yˆ ) (12.9)
第十二章 回归分析
学习目标 掌握简单线性回归模型基本原理。 掌握最小平方法。 掌握测定系数。 了解模型假定。 掌握显著性检验 学会用回归方程进行估计和预测。 了解残差分析。
调研学习
1
习题
1. P370-1 2. P372-7 3. P380-18
4. P380-20 5. P388-28 6. P393-35
调研学习
5
一、从一个实际问题入手
用回归分析可以预测运行一条商业航空 线的成本吗?
如果可以,那么哪些变量与这一成本有 关呢?
调研学习
6
飞机型号
飞行距离 乘客数量
行李或货物重量
飞机运行成本
天气状况
……
调研学习
7
为了减少自变量个数,我们做如下假定:
飞机类别——波音737飞机 飞行距离——500公里 航线——可比,而且在每年的相同季节 在这种条件下,可以用乘客数来预测飞行
时,因变量 y 平均变化的量。
调研学习
15
调研学习
16
调研学习
17
三、估计回归方程
估计回归方程(Estimated regression equation) 就是用样本统计量作为参数的估 计值所建立的回归方程。
yˆ b0 b1x
yˆ :y 的估计值
(12.4)
b0 :0 的估计值
b1 : 1 的估计值
调研学习
4
第一节 简单线性回归模型
只涉及两个变量(一个自变量和一 个因变量)之间关系的回归分析称为简
单回归分析(Simple regression analysis)。
两个变量之间的关系大约呈一条直
线的简单回归分析称为简单线性回归分
析(Simple linear regression analysis)。
两端平方后求和有
yi y2 yˆi y2 yi yˆ 2 (12.10)
{ { {
总离差平方和 (SST)
回归平方和 (SSR)
残差平方和 (SSE)
R2 SSR ( yˆi y)2 1 ( yi yi )2
SST (yi y)2
( yi y)2
(12.11)
调研学习
b1
xi yi x y
x2
2
nx
b1
n
xi yi n x2
xi yi x2
12.7a 12.7b
b0 y b1 x (12.8)
调研学习
23
调研学习
24
b1
n
xi yi n x2
xi yi x2
12 4462.220 930 56.690
12 73764 9302
调研学习
27
yˆi 1.570 0.0407 70
4.419千元
**Y = 4.48千元二者差0.061千元或61元。
调研学习
28
第三节 一元线性回归方程的评价
测定系数 估计标准误差
调研学习
29
一、测定系数
回归直线与各观测数据的接近程度 称为回归直线的拟合优度。
度量回归直线的拟合优度最常用的
0.0407
调研学习
25
b0 y b1 x
n
y
b1
n
x
56.690 0.0407 930
12
12
1.570
调研学习
26
(四)将b0和 b1 的计算结果代入式
(12.5)有:
yˆi 1.570 0.0407 xi
结论:
计算结果表明,在其他条件相同情况下, 12条航线上波音737飞机各条航线每次飞行时 每增加1名乘客,将会使飞行成本平均增加 40.70元。
0、1 :参数
:误差项(随机变量),含义为说明在 y
中不能被x 和y 之间线性关系解释的变异
性。
调研学习
11
在有关 假设中,有一个假设就是的
期望值或均值等于0,即
E 0
(12.2)
如果简单线性回归模型满足了这个条
件,那么就意味着 y 的均值或期望值就是
一个线性函数。
描述 y 的均值与 x 的关系如何的方
21
(二)建立估计回归方程
yˆi b0 b1xi i 1,2,,12 (12.5)
最小平方法运用样本数据求出 b和0
使得因变量的实际观察值 与其yi 估计值
的b1 值,
之
yˆi 差的平方和最小,即
yi yˆi 2 min
(12.6)
调研学习
22
(三)估计回归方程斜率和截距的计算公式
的成本吗?
调研学习
8
表12-1是每年相同季节波音737飞机在 12条500公里的不同航线不同乘客数时的飞 行成本。我们用这些数据以乘客数作为自 变量构造模型来预测成本。
调研学习
9
调研学习
10
二、回归模型和回归方程
y 0 1x
y :因变量(随机变量)
x :自变量(给定变量)
(12.1)
调研学习
百度文库
2
案例讨论: 1.这个案例都告诉了我们哪些信息?
2.通过阅读这个案例你受到哪些启发?
调研学习
3
根据一个变量(或更多变量)来估计 某一变量的方法,统计上称为回归分析 (Regression analysis)。
回归分析中,待估计的变量称为因变 量(Dependent variables),用y表示;用来 估计因变量的变量称为自变量 (Independent variables),用x表示。
程称为回归方程(Regression equation)。
调研学习
12
E y 0 1x (12.3)
在简单线性回归中 1.回归方程的图形是一条直线(如图12.1
所示);
调研学习
13
调研学习
14
2. 0 :y 的截距;
3. 1:斜率(回归系数); 1 的含义:当自变量 x 给定一个具体变动值
32
决定系数的取值
R2的取值范围是[0,1]。 R2越接近于1,表明回归平方和占总离差
平方和的比例越大,回归直线与各观测点 越接近,回归直线的拟合程度就越好。