工业系统工程回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
相关系数与判定系数 相关 系数
S 2 xy r = = S xS y =
11.1.9
的条件下, 在直线相关的条件下,用以反映 两变量 间 线性相关 密切程度的指 标,用r表示 表示
n∑ x
2
∑ (x − x ) n n ∑ xy − ∑ x ∑ − (∑ x ) n∑ y
2 2
∑ (x
− x
)(y − y ) n ⋅ ∑ (y − y )
ˆ ˆ Yt = β1 + β2 X + et
t=1 t=1,2,... n
称为残差 在概念上, 残差, 相互对应; et称为残差,在概念上,et与总体误差项ut相互对应;n是 样本的容量。 样本的容量。
11.1.9 14
样本回归函数与总体回归函数区别
总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的, 总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的, 每抽取一组样本,便可以拟合一条样本回归线。 每抽取一组样本,便可以拟合一条样本回归线。 总体回归函数中的β1和β2是未知的参数,表现为常数。而样本回归 是未知的参数,表现为常数。
625 916 β1 = y − β 2 x = − 0.7961× = −6.5142 16 16
线性回归方程为: 线性回归方程为:
ˆ y = − 6 . 5142
11.1.9
+ 0 . 7961
x
结果表明,其他条件不变时,能源消耗量每增加 结果表明,其他条件不变时, 100000吨 工业总产值将增加7961万元。 100000吨,工业总产值将增加7961万元。 7961万元 24
11.1.9 4
函数关系
指变量之间存在着确定性依存关系。当一 指变量之间存在着确定性依存关系。 个或一组变量每取一个值时, 个或一组变量每取一个值时,相应的另一个变 量必然有一个确定值与之对应 。
例 : 圆面积 S = π × r
2
函数关系可以用一个确定的公式, 函数关系可以用一个确定的公式,即函数式
一、相关和回归分析的基本概念 二、一元线性回归分析 三、多元线性回归分析 四、非线性回归分析
11.1.9
2
一、相关和回归分析的基本概念
比较下面两种现象ຫໍສະໝຸດ Baidu的依存关系
⒈ 出租汽车费用与行驶里程: 出租汽车费用与行驶里程:
总费用=行驶里程 总费用 行驶里程 × 每公里单价 2. 家庭收入与恩格尔系数: 家庭收入与恩格尔系数:
y = f ( x1 , x 2 ,L , x n )
11.1.9
来表示。 来表示。
5
相关关系
指变量之间存在着非确定性依存关系。 指变量之间存在着非确定性依存关系。即 当一个或一组变量每取一个值时, 当一个或一组变量每取一个值时,相应的另一 个变量可能有多个不同值与之对应 。 例、根据消费理论,商品需求量Q与商品 根据消费理论,商品需求量 与商品 价格P、居民收入I之间具有相关关系 之间具有相关关系: 价格 、居民收入 之间具有相关关系:
n∑ x − (∑ x )
2
n∑ y − (∑ y)
2
2
=
11.1.9
16 × 37887 − 916× 625 16 × 55086 − 916 16 × 26175− 625
2 2 2
= 0.9757
11
r = (0.9757) = 0.9520
2
二、一元线性回归分析
1、标准的一元线性回归模型 2、一元线性回归模型的估计 3、一元线性回归模型的检验 4、一元线性回归模型预测
y
2
2
n
− (∑ y ) 2
8
相关系数与判定系数
相关系数r的取值范围: 相关系数r的取值范围:-1≤r≤1
r>0 为正相关,r < 0 为负相关; 正相关, 负相关; |r|=0 表示不存在线性关系; 表示不存在线性关系; 线性关系 |r|=1 表示完全线性相关; = 表示完全线性相关 完全线性相关; 0<|r|<1表示存在不同程度线性相关: 表示存在不同程度线性相关: 不同程度线性相关 |r| < 0.4 为低度线性相关; 为低度线性相关; 0.4≤ |r| <0.7为显著性线性相关; 为显著性线性相关; 为显著性线性相关 0.7≤|r| <1.0为高度显著性线性相关。 显著性线性相关。 为高度显著性线性相关
11.1.9 16
2、一元线性回归模型的估计
一元线性回归方程的几何意义
E (Y )
斜率
x
2
ˆ y=
ˆ ˆ β +β
1
X
截距
β2为0
一元线性回归方程的可能形态
β2为正 β2为负
11.1.9
17
ˆ 总体一元线性回归方程: Y = E Y
以样本统计量估计总体参数
样本一元线性回归方程: 样本一元线性回归方程:
11.1.9 12
回归分析的种类
Simple Linear regression
按自变量的 个数分
一元回归 简单回归 多元回归 复回归 线性回归 非线性回归
按回归曲线 的形态分
11.1.9
一 元 线 性 回 归
13
1、标准的一元线性回归模型
(一)总体回归函数
Yt=β1+β2Xt+ut
随机误差项,又称随机干扰项 随机干扰项, u t是随机误差项,又称随机干扰项,它是一个特殊的随机 变量, 的影响。 变量,反映未列入方程式的其他各种因素对Y的影响。 (二)样本回归函数: 样本回归函数:
Q = aP
11.1.9
b1
I
b 2
+ ε
来表示。 来表示。
6
关系, 相关关系,可用模型 y = f (x1, x2 ,L xn ) +ε ,
相关分析和回归分析
研究现象之间相关关系的两种基本方法: 研究现象之间相关关系的两种基本方法: 相关 分析 回归 分析
11.1.9
就是用一个指标来表明现象间相互 依存关系的密切程度 就是根据相关关系的具体形态, 就是根据相关关系的具体形态,选 择一个合适的数学模型, 择一个合适的数学模型,来近似地 表达变量间的平均变化关系。 表达变量间的平均变化关系。
② 总体方差的估计
S
2
∑e =
2 t
n− 2
该式中,分母是自由度,其中n 该式中,分母是自由度,其中n是样 本观测值的个数, 本观测值的个数,2是一元线性回归 方程中回归系数的个数。 方程中回归系数的个数。在一元线性 回归模型中,残差e 必须满足: 回归模型中,残差et必须满足:
相关和回归分析
研究系统的相互联系、 研究系统的相互联系、测定其联 系的紧密程度、 系的紧密程度、揭示其变化的具 体形式和规律性的统计方法, 体形式和规律性的统计方法,是 构造各种系统模型、 构造各种系统模型、进行系统结 构分析、预测和控制的重要工具。 构分析、预测和控制的重要工具
11.1.9
1
【主要内容】 】
标准方 程组
20
根据整理方程求解可得: 根据整理方程求解可得:
n∑XtYt − ∑ Xt ∑Y t ˆ β2 = 2 2 n∑Xt − (∑Xt ) Xt β = Yt − β ˆ ˆ ˆ = Y − β2 X 2∑ 1 ∑ n n
11.1.9 21
上述进行回归分析的方法可称为: 上述进行回归分析的方法可称为:
11.1.9 9
相关系数与判定系数
判定 系数
是相关系数的平方, 表示; 是相关系数的平方,用 r2 表示;用 的解释程度。 来衡量回归方程对y的解释程度。
判定系数取值范围: 判定系数取值范围:
0 ≤ r ≤1
2
r2 越接近于1,表明x与y之间的相关性越强; 越接近于1 表明x 之间的相关性越强; r2 越接近于0,表明两个变量之间几乎没有 越接近于0
ˆ ˆ 是随机变量, 函数中的 β1和β2t 是随机变量,其具体数值随所抽取的样本观测值不 同而变动。 同而变动。
总体回归函数中的u 与未知的总体回归线之间的纵向距离, 总体回归函数中的ut是Yt与未知的总体回归线之间的纵向距离,它 是不可直接观测的。而样本回归函数中的e 是不可直接观测的。而样本回归函数中的et是Yt与样本回归线之间 的纵向距离,当根据样本观测值拟合出样本回归线之后, 的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出 的具体数值。 et的具体数值。
函数关系 确定性关系
相关关系 非确定性关系
家庭收入高,则恩格尔系数低。 家庭收入高,则恩格尔系数低。
11.1.9 3
函数关系和相关关系
现象间的依存关系大致可以分成两种类型: 现象间的依存关系大致可以分成两种类型:
函数关系 相关关系 指现象间所具有的严格的确定性的依存 关系 指客观现象间确实存在,但数量上不是 指客观现象间确实存在, 严格对应的依存关系
直线相关关系. 直线相关关系.
11.1.9 10
【例】计算工业总产值与能源消耗量之间的相关 系数及判定系数 资料
解:已知n = 16, ∑ x = 916, ∑ y = 625, 结论: 结论:工业总产值与能源消耗量之间
2 2 存在高度的正相关关系,能源消耗量 存在高度的正相关关系,能源消耗量x ∑ xy = 37887, ∑ x = 55086, ∑ y = 26175 的变化能够解释工业总产值y变化的 的变化能够解释工业总产值 变化的 n∑ xy − ∑ x∑ y r95.2﹪。 = ﹪ 2
11.1.9 15
误差项的标准假定
假定1 误差项的期望值为零: E(u )=0 假定1: 误差项的期望值为零: E(ut)=0 。 假定2:误差项的期望值为常数: Var(ut) = σ 2 。 假定2 误差项的期望值为常数: 假定3 误差项之间不存在序列相关,协方差为零: 假定3: 误差项之间不存在序列相关,协方差为零: Cov(utus)=0 (t≠s) 。 假定4 自变量是给定变量,与误差项线性无关。 假定4:自变量是给定变量,与误差项线性无关。 假定5 随机误差项服从正态分布。 假定5:随机误差项服从正态分布。 满足以上标准假定的一元线性回归模型, 满足以上标准假定的一元线性回归模型,称为标准的一元 线性回归模型。 线性回归模型。
( )=
ˆ y=
β1 + β2X
ˆ β
+
1
ˆ β
x
2
估计的一元 线性回归方程
截距
斜率(回归系数) 斜率(回归系数)
截距β1 表示在没有自变量 的影响时,其它各种因素 表示在没有自变量x的影响时 的影响时, 对因变量y的平均影响 的平均影响; 表明自变量x每变 对因变量 的平均影响;回归系数β2 表明自变量 每变
动一个单位,因变量 平均变动 个单位。 平均变动b个单位 动一个单位,因变量y平均变动 个单位。
11.1.9 18
①回归系数的估计 总体回归函数
ˆ ∑( y − y) = 0 ˆ ∑( y − y) = min
2
样本回归函数
11.1.9 19
回归系数的估计---最小二乘法 回归系数的估计---最小二乘法 --2 ˆ Q = ∑et = ∑( t −Y )2 Y t
函数关系与相关关系之间并无严格的界限:有函数关系 函数关系与相关关系之间并无严格的界限: 的变量间,由于有测量误差及各种随机因素的干扰, 的变量间,由于有测量误差及各种随机因素的干扰,可 表现为相关关系; 表现为相关关系;对具有相关关系的变量有深刻了解之 相关关系有可能转化为或借助函数关系来描述。 后,相关关系有可能转化为或借助函数关系来描述。
解:设线性回归方程为 y = β 1 + β ˆ


2
x
由计算表知 n = 16, ∑ x = 916, ∑ y = 625,
∑ xy = 37887, ∑ x
11.1.9
2
= 55086,
23
β2 =


n∑xy − ∑x∑y n∑x − (∑x)
2 ∧ 2
16×37887 − 916× 625 = = 0.7961 2 16×55086 − 916
最小 平方法
通过使残差平方和 为最小来估计回归 系数的一种方法, 系数的一种方法, 又称最小二乘法。 又称最小二乘法。
22
11.1.9
【例】建立工业总产值对能源消耗量的线性 回归方程 。 资料 【分析】因为工业总产值与能源消耗量之间存 分析】 在高度正相关关系( r=0.9575), ),所以可以拟 在高度正相关关系( r=0.9575),所以可以拟 合工业总产值对能源消耗量的线性回归方程。 合工业总产值对能源消耗量的线性回归方程。
ˆ ˆ Y = ∑( t − β1 − β2 Xt )2
ˆ ˆ 2 - ∑(Y − β1 − β2 Xt ) 0 = t ˆ ˆ 2 - ∑ Xt (Y − β1 − β2 Xt ) = 0 t
11.1.9
ˆ ˆ nβ1 + β2 ∑X t = ∑ t Y ˆ 2 ˆ β1 ∑Xt + β2 ∑X t = ∑XtY t
相关文档
最新文档