3预测与决策-回归分析预测法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(yˆ0 t syx
2
1
n
(x0 x)2
,yˆ0 t syx
(x x)2
2
1
n
(x0 x)2 ) (x x)2
^
残差 0 y0 E ( y0 ),

0





^
E ( 0 ) E[ y0 E ( y0 )] (0 1x0 ) (0 1x0 ) 0

0



:var(
相关关系
当一个或几个相互联系的变量取一定数值时,与之 相对应的另一变量的值虽然不确定,但它仍按某种规律 在一定的范围内变化,变量间的这种相互关系,称为具 有不确定性的相关关系。
如:以X和Y分别记一个人的身高和体重,或分别记每 公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而 又没有确切到可由其中的一个去精确地决定另一个的程 度,这就是相关关系。
2.预测可分两种类型 ⑴.点预测 ⑵.区间预测
㈠、点预测
对于自变量 x 的一个取值x0,根据样本回归方程
yˆ abx

yˆ0 abx0
作为y0的估计,称为点预测。
㈡、y均值E(y0 ) 的置信区间
可以证明 syx
E(y0) yˆ0
~ t(n 2)
1
n
(x0 x)2
(x x)2
E( y0 )的置信区间为
y
y
B (x, y)
y yc
yc abt
yc y
C (x, yc)
A (x,y)
x
x
总离差平方和分解
(YY)2 [(YYC)(YCY)]2
2
(YY)2 [(YYC)(YCY)]
(YYC)2
2
(YCY) 2
(YYC)(YCY)
(YYc)(Yc Y) (YYc)(abXY)
a(YYc)bX(YYc)Y(YYc)
(一)T检验
tb
bˆ Sb
其中,
Sb是回归系数bˆ的估计标准误
Sb
Syx2
xx2
SE/(n2)
xx2
检验规则:给定显著性水平 ,若 tb t (n 2)
则回归系数显著。
2
随机误差项的方差2的无偏估计为
Syx2
(yyC)2 样本拟合误差的均方和 n2
Syx
(yyC)2 估计标准误 n2
Q ( Y Y ) 2 c ( Y a b ) 2 X min
式中,a,b是待定参数,Q是a,b的函数,要使Q 达到最小,依据函数求极限的原理,则先求Q对a 和b的偏导数,再令其为0。即:
Q a 2 (Y a bX )0 Q b 2 ( Y a b) · X ( x ) 0
式中:SY.X估计标准误 y因变量数列的实际值
yc根据回归方程推算出来的估计值.
n因变量的项数,由于在 (YYc)2 (YabX)2公式中,
其中参数是由实际资料计算的,从而丧失了两个自由度。
总体未知参数A 样本统计量a
估计标准误差是
总体未知参数B 样本统计量b 估计标准误差是
总 体 未 知 参 数 Yˆ0 样 本 统 计 量 yˆ 0 估计标准误差是
解:根据样本数据得
(x x )(y y ) 1 7 9 8 1 2 2 .6 4 4 , (x x )2 3 4 1 6 0 3 4 .8 2 7 (y y )2 9 4 8 9 4 9 .0 7 7
得人均消费金额 y 与人均国民收入 x 的样本相关系数为
r
17981.62424
34160.832479489.40977
相关系数很大未必表示变量间存在因果关系,也可能 两个变量同时受第三个变量的影响而使它们有很强的相关。 比如,人的肺活量与人的身高会呈现高度相关,其实肺活 量和身高都受人的体重的影响,因此如果固定人的体重来 研究肺活量与身高的关系,则会发现相关性很低。这涉及 偏相关系数的计算。又如,我们计算若干年期间某地猪肉 销售量与感冒片销售量的相关系数,它可能很大,但这并 不说明猪肉销售量与感冒片销售量之间有线性相关关系, 因为它们都受这个时期人口增长因素的影响,把两个从逻 辑上不存在联系的两个变量放在一起做相关分析,没有意 义,在统计上称之为“虚假相关”。
相关系数设计思路
直线相关系数
r S 2xy SxSy
(X X )2
Sx
n
(Y Y )2
Sy
n
S 2 xy
(X
X n
)(Y
Y)
XY
n
XY
nn
计算公式
rxy
1
nபைடு நூலகம்
n i1
(Xi
X)(Yi
Y)
2xy
n
n
(Xi X)2 (Yi Y)2
xy
i1
i1
n
n
标准差
标准差
rxy
专题(四) 文化建设
3预测与决策-回归分析预测法
第一节 基本概念
一、函数关系与相关关系 二、相关分析与回归分析
函数关系
当一个或几个变量取一定的值时,另一个 变量有确定值与之相对应,这种关系为确定性 的函数关系。
如:圆面积 正方形的面积
一般把作为影响因素的变量称为自变量;把 发生对应变化的变量称为因变量。
0.8914
极端值
|r|=1 --- 完全线性相关
0<r<1---不完全正相关 -1<r<1---不完全负相关
一般值
|r|≥0.8,高度相关 0.8﹥|r|≥0.5,中度相关 0.5﹥|r|≥0.3,低度相关 0.3﹥|r|,不相关
注意事项
①r值很小,说明X与Y之间没有线性相 关关系,但并不意味着X与Y之间没有 其它关系,如很强的非线性关系。
R2SRSTSE1SE
ST ST
ST
R 2 (Y CY)21 (YY C)2
(YY)2
(YY)2
四、回归模型显著性检验
在上面的分析中,为了求得回归方程,我们曾假定x与y 之间存在着线性关系。在求得回归方程后,我们必须对这 一假定进行检验,以确定x与y是否的确存在线性关系。
经济理论检验 统计检验
斯皮尔曼等级相关系数
斯皮尔曼等级相关是根据等级资料研究两个变 量间相关关系的方法。它是依据两列成对等级的 各对等级数之差来进行计算的,所以又称为“等 级差数法”。
斯皮尔曼等级相关对数据条件的要求没有积 差相关系数严格,只要两个变量的观测值是成对 的等级评定资料,或者是由连续变量观测资料转 化得到的等级资料,不论两个变量的总体分布形 态、样本容量的大小如何,都可以用斯皮尔曼等 级相关来进行研究。
n xy x y n x2 ( x)2 n y2 ( y)2
xy nx y
x2 n(x)2
y2 n( y)2
xy
xy
(其中xy =
xy )
x y
n
题目
rxy
nxyxy nx2 (x)2 ny2 (y)2
20*541250339*30800
(20*60293392) (20*49070000308002)
肯德尔等级相关系数
rs用于测量两个变量等级的相关程度。统计学 家肯德尔(Kendall)提出多变量等级相关系 数,即肯德尔和谐系数rk,将其应用于测量多 个变量间的等级相关程度。
肯德尔等级的计算公式
rk
1
4i
n(n 1)
r k 1 n 4 (n i1 ) 1 8 4 * * 7 6 1 0 .4 2 9 0 .5 7 1
0
)
E[
^
y0
E( y0 )]2
2
1
n
(
x0
x)2
2
(参



经济
学)
(x x)

s
2 yx


2,


0
标准


(
0
)
s yx
1
n
(x0 x)2
2
(x x)
②有时两个变量可以互为因果关系,比如全 社会的生产量与消费量,这时对何者为自变 量,何者为因变量就要根据研究目的来决定。 如果希望研究生产量的变化怎样影响消费量 的变化,则可将生产量定为自变量,消费量 定为因变量,反之亦然。
“你的头发怎么一天比一天少?” “因为我天天都有忧虑的事。” “你每天都忧虑什么呢?” “我忧虑我的头发一天比一天少!”
正规方程
Y n a b X X a Y X b X 2
解正规方程得:
bˆnXYXY nX2(X)2
a ˆ1 n( Yb X)Y _bX _
三、回归直线的代表性分析
建立了回归方程以后,通常要用方 程估计值Yc来推断或预测实际值Y。为 了分析用Yc去估计Y是否准确可靠,常 采用反映回归直线代表性好坏的统计 分析指标,检验方程回归系数的拟合 优劣程度。为此需要进行变差分析。
2
s y x
1 n
x (x x)2
1
s y x
(x x)2
s y x
1 n
(x0 x)2 (x x)2
估计标准误的简便公式
如果已经求得直线回归方程的参数,可以直接 利用下式求估计标准误。
Y2a Yb XY
SY.X
n2
(二)F检验
检验假设:H0:b=0 H1:b0
检验统计量:F SR/1 SE/(n2)
如y=-x2+12x+4
②直线相关系数一般只适用于测定变量 间的线性相关关系,若要衡量非线性相 关时,一般应采用相关指数R。
相关系数的显著性检验
通常,我们用样本相关系数r作为总体相关系 数ρ的估计值,而r仅说明样本数据的X与Y的相关
程度。有时候,由于样本数据太少或其它偶然因 素,使得样本相关系数r值很大,而总体的X与Y并
第二节 、回归分析预测法
一、回归分析预测法的基本步骤
(一)根据预测的目的,选择确定自变量和因变 量,并判断其相关类型 (二)初步确定方程模型,进行参数估计 (三)进行统计检验 (四)进行预测和区间估计
举例
①在工业企业经济统计分析中,利润额受 投资额的大小影响,因而投资额可看作是 自变量,利润额可看作是因变量。
检验法则: 在D—W小于等于2时, D—W检验法则规定:
如: DWdL 存在正自相关;
DWdU 无自相关;
在D—W大于2时, D—W检验法则规定:
如: 4DWdL 存在负自相关; 4D无W自相dU 关;
dL4D 不W 能 确d 定U是否有自相关。
五、利用回归方程进行预测
1.根据自变量 x 的取值预测 y 的取值
相关关系的特点
相关关系的特点:
(1)现象之间确实存在数量上的依存关系。 (2)现象之间数量上的依存关系不是确定的。
相关关系与函数关系在一定的条件下是可以相互转换的。 (1)本来具有函数关系的变量,当存在观测误差时,其 函数关系往往以相关的形式表现出来。 (2)如果我们对所研究对象有更深入的认识,便可以将 影响因素全部纳入方程,使之成为函数关系。
0
其中: (YYc)0,X(YYc)0
X(YYc)X(YabX)XYaXbX2 0
(Y Y )2(Y Y C )2(Y C Y )2
总变差(ST) 剩余变差(SE)
回归变差(SR)
可决系数
如果样本回归线对样本观测值拟合程度越好,各样 本观测点与回归线靠得越近,由样本回归做出解释的 离差平方和在总离差平方和的比重也将越来越大;反 之,拟合程度越差,这部分所占比重就越小。
不存在真正的线性关系。因而有必要通过样本资 料来对X与Y之间是否存在真正的线性相关进行检
验,即检验总体相关系数ρ是否为零。
检验表
相关系数检验表
在研究我国人均消费水平的问题中,把人均消费金额
记为y ;把人均国民收入记为x 。我们收集到1981-
1993 年13年的样本数据。数据见表。

我国人均国民收入与人均消费金额数据
y
y
a
a
0
0
x
x
二、最小二乘法确定模型参数
(Ordinary Least Square Estimation,简记为OLSE)
线性相关示意图
y
yˆ abx
a
0
x
数理统计知识证明,最小二乘法是一种参数拟合较好的方法。
最小二乘法
最小二乘法的理论基础是样本的n个实际值Y与其相 应的理论值Yc的离差平方和达到最小,即:
ycy2 yyc2
F1,n2
n2
检验规则:给定显著性水平a,若 FF1,n2
则回归方程显著。
一元线性回归方程的方差分析表
(三)德宾-沃森统计量(D-W)
检验ui之间是否存在自相关关系。
其中,
n
i i1 2
D W i2 n
i2
i 1
i yi yˆi
D—W的取值域在0-4之间。
D-W检验表?
0.9987
相关系数检验
1. H 0:0,H 1:0 2.根据 0 .0和1n21,1查表得
r0.01(1)10.684
3.由于
r0 .99r 8 0 .0(7 1 1) 10 .684
因此,拒绝 H
,认为
0
x

y
的相关系数
0,即人均
消费金额 y 与人均国民收入 x 之间的相关关系显著。
注意:线性相关关系与因果关系不同
从表中的数字可以看出,工人的考试成绩愈 高其产量也愈高,二者之间的联系程度是很一 致的,但是相关系数r=0.676 并不算太高,这 是由于它们之间的关系并不是线性的,如果分 别按考试成绩和产量高低变换成等级(见上表第 3、4列),则可以计算它们之间的等级相关系数 为1。
6 D2
rs 1n(n21)101
相关文档
最新文档