线性回归的显著性检验及回归预测.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2 2
2 2
R 1 ( y yc ) / ( y y )
相关指数计算表
序号 1 y 106.42 yc 107.53 (y-yc)2 1.2321 (y-yˉ)2 13.0012
2
3 4 5 6 7 8
108.20
109.58 109.50 110.00 109.93 110.49 110.59
对【例6.1】的回归系数进行显著性检验(a=0.05)
提出假设 H 0: b = 0 H 1: b 0 选择检验的统计量 t=b / S (b) ~t(14) 计算检验统计量
2
由b 0.7961; Se 2.457, ( x x ) x 2 ( x )2 / n 55086 (916)2 / 16 2645 1 则S ( b ) S e 2.457 2 2645 ( x x) b 0.7961 t 16.6548 S (b) 0.0478 1
点估计
1、对于自变量x的一个给定值x0,根据回 归直线方程得到因变量y的一个估计值y c ; 2.【例】在例6.1中,如果我们想知道 能源消耗量为73(十万吨)时的工业 总产值是多少,则属于因变量y的点 估计。根据估计的回归方程得
yc = -6.5142+0.7961 73=51.6011(亿元)
•由a0.05,可知临界值
♥ ta/2(n-2)=t0.025(14)=2.1448
♥|t|=16.6548>t0.025(14)=2.1448
拒绝H0,表明总体的两变量之间存在着 显著的线性相关关系,即能源消耗量与 工业总产值之间存在显著的线性相关关 系。
回归方程的显著性检验
1、目的:对回归方程拟合优度的检验 2、具体方法:将回归离差平方和(SSR)同 剩余离差平方和(SSE)加以比较,应用F检 验来分析二者之间的差别是否显著 ♥如果是显著的,两个变量之间存在线性 关系 ♥如果不显著,两个变量之间不存在线性 关系
n xy x y b 0.0006 2 2 n x ( x) y 0.009 0.0006 x a y bx 0.009
将x 1/ x, y 1/ y代入回归方程,可得双曲线回归方程为: 1/ yc 0.009 0.0006 / x 即 x yc 0.009 x 0.0006
12
13 14 合计
18
19 20 -
111.00
111.20 111.18 -
112.00 111.00 110.00 109.00 108.00 107.00 106.00 0 5 10 15 20 25 系列1
1/ y a b / x 令x 1/ x y 1/ y y a by
对于给定的1 a , y0的置信度 为1 a的置信区间为:
yc ta 2 Se 1 x0 x ) 1 (小样本) 2 n ( x x)
2
yc Za 2 S ( e 大样本,n充分大时)
【例】求出例6.1中能源消耗量为73(十万吨)时,工 业总产值95%置信水平下的预测区间
回归方程计算表
序号
1 2
x
2 3
y
106.42 108.20
x′=1/x
0.5000 0.3333
y′=1/y
0.0094 0.0092
x′2
0.2500 0.1111
x′y′
0.0047 0.0031
3
4 5 6 7 8 9 10 11 12 13
4
5 7 8 10 11 14 15 16 18 19
110.61
110.90 110.76 111.00
110.58
110.62 110.65 110.70
0.0009
0.0784 0.0121 0.0900
0.3414
0.7644 0.5392 0.9493
13
14 合计
111.20
111.18 1540.36
110.72
110.74 -
0.2304
•由a0.05,可知临界值
♥ Fa(1,n-2)=F0.05(1,14)=4.6
♥F>F0.05(1,14),拒绝H0,
表明总体的两变量间线性相关关系是显 著地,所拟和的线性回归方程具有95% 的置信度。
回归预测
利用回归方程进行估计和预测
1. 根据自变量x的取值估计或预测因变量 y的取值 2. 估计或预测的类型 点估计 • 因变量y 置信区间估计 区间估计 • 因变量y 置信区间估计
108.70
109.29 109.65 110.06 110.19 110.38 110.44
0.2500
0.0841 0.0225 0.0036 0.0676 0.0121 0.0225
3.3332
0.1986 0.2764 0.0007 0.0092 0.2156 0.3184
9
10 11 12
区间估计
1. 点估计不能给出估计的精度,点估 计值与实际值之间是有误差的,因 此需要进行区间估计; 2. 对于自变量 x 的一个给定值 x0 ,根据 回归方程得到因变量y的一个估计区 间; 3. 区间估计的类型 置信区间估计
置信区间估计
对于给定的任一值x0 ,由一元线性 模型知道,不可能求出y相应的精确y0 , 但是我们可以预测y的取值范围.对于 给定的1 a ,求出y0的置信区间,称之为 预测区间.求预测区间的方法与抽样 推断中的区间估计原理相同.
0.0091
0.0091 0.0091 0.0091 0.0091 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090
0.0625
0.0400 0.0204 0.0156 0.0100 0.0083 0.0051 0.0044 0.0039 0.0031 0.0028
注意:
预测区间以估计值yc为中点,区间
长度为2 .其中区间长度在x0 x处最短,
x0离x 越远区间长度越长.故置信区间上、
下限的曲线对称地落在回归直线两侧,
呈喇叭型.
y
预测区间上限
yc a bx
预测区间下限
x
x0
x
第四节
可线性化的回归方程
一、可线性化的常用曲线类型 二、配合回归曲线的问题 三、非线性判定系数与相关系数
解:根据前面的计算结果有 n 16, Se 2.457, yc 51.6011, ta / 2 ( n 2) t 0.025 (14) 2.1448
2 x x / n 57.25, nS x ( x x )2 2645
故置信上下限为: 1 51.6011 2.1448 2.457 1 (73 57.25)2 / 2645 16 即51.6011 5.6666 置信区间为45.9345 y0 57.2677
双曲线
1. 基本形式:
1. 线性化方法 令:y' = 1/y,x'= 1/x, 则有y' = a+ bx' 2. 图像
b<0
b>0
幂函数曲线
1. 基本形式:
2. 线性化方法
两端取对数得:lg y = lga + b lg x 令:y' = lgy,x'= lg x,则y' = lga + b x‘ 3. 图像
F检验的步骤
提出假设 H0:b0; H1:b≠0 • 选择检验统计量F,
• 计算实际统计量F的值
• 确定显著性水平a,查F分布表得临界值 Fa(1,n-2),进而作出决策:Hale Waihona Puke Baidu若FF a(1,n-2),拒绝H0;表明在总体两 变量间线性相关性显著; ♥ 若F<F a(1,n-2),接受H0,表明总体两变 量间线性相关性不显著.
b 构造检验统计量 t ~ t ( n 2) S (b)
H 1: b 0
S ( b ) Se
1
(x
i 1
2 x
n
i
x)
n i 1
2
n
(x
i 1
n
i
x ) nS xi ( x ) / n
2 2 2 i 1
•计算实际统计量t的值
•确定显著性水平a,查t分布表得临界值 ta/2(n-2),作出统计决策: ♥ |t|>=ta/2,拒绝H0,说明变量X与Y之间存 在着显著的线性关系; ♥ |t|<ta/2,接受H0,说明变量X与Y之间不 存在线性关系。
非线性判定系数R2 非线性相关系数R(相关指数) 上述两指标是用来度量两变量之间非线性相 关关系的密切程度。取值范围介于0到1之间, R2或者R的取值越趋紧于1,则非线性相关程 度越强,反之越趋近于0,非线性相关程度越 弱。 计算公式
R 1 ( y yc ) / ( y y )
0.1936 2.2999
1.3790
1.3324 22.6589
计算可得 R 1 ( y yc ) / ( y y ) 1 2.999 / 22.6589
2 2 2
0.8985 进而得到 R 0.8985 0.9497
R2=0.8985表明两变量之间有高度的非线性相关关系。
0.0023
0.0018 0.0013 0.0011 0.0009 0.0008 0.0006 0.0006 0.0006 0.0005 0.0005
14
合计
20

111.18
-
0.0500
2.1009
0.0090
0.1271
0.0025
0.5397
0.0004
0.0193
非线性判定系数与相关系数
第三节
线性回归的显著性检验及回归预测
一、回归系数的显著性检验(t检验) 二、回归方程的显著性检验(方差分析(F检验))
三、回归预测
回归系数的显著性检验 --t检验
目的:检验X与Y之间是否具有 线性关系;或者说检验自变量X 对因变量Y的影响是否显著
t检验的步骤
提出假设 H 0: b = 0
可线性化的常用曲线类型
曲线相关与曲线回归的概念和分类
曲线相关:指相关的两个变量对应值的散点 图呈某种 曲线形状的关系式. 曲线回归:根据曲线相关的变量拟合的回归 方程. 常见的可线性化的曲线一元回归方程有:
(1)双曲线回归方程: (2)幂函数曲线回归方程: (3)指数曲线回归方程: (4) S型曲线回归方程:
109.58
109.50 110.00 109.93 110.49 110.59 110.61 110.90 110.76 111.00 111.20
0.2500
0.2000 0.1429 0.1250 0.1000 0.0909 0.0714 0.0667 0.0625 0.0556 0.0526
b1 b=1 0<b < 1 b =-1 b<-1 -1<b <0
配合回归曲线的问题
非线性回归方程
序号 1
2 3 4 5 6 7 8 9 10 11
x 2
3 4 5 7 8 10 11 14 15 16
y 106.42
108.20 109.58 109.50 110.00 109.93 110.49 110.59 110.61 110.90 110.76
置信度 95 %的情况下,当能源消耗量为 73( 十万吨 ) 时,工 业总产值的预测区间在45.9345亿元到57.2677亿元之间。
影响区间宽度的因素
1. 置信水平 (1 - a) 区间宽度随置信水平的增大而增大 2. 回归估计标准差Se 区间宽度随离散程度的增大而增大 3. 样本容量 区间宽度随样本容量的增大而减小 4. 用于预测的x0 与x 的差异程度 区间宽度随x0 与x 的差异程度的增大而增大

方差分析表
离差来源 回归 剩余 总计 平方和 自由度
2 2
F值
SS R F SS E /( n 2)
SS R ( yc y ) SS E ( y yc )
SS ( y y )
2
1 n-2
对【例6.1】的回归方程进行显著性检验 (a=0.05)
提出假设 H 0: b = 0 H1: b 0 选择检验的统计量 F=SSR/(SSE/(n-2) )~ F(1,14) 计算检验统计量
非线性回归--练习
一种商品的需求量与其价格有一定的关系。现对 一定时期内的商品价格 x 与需求量 y进行观察,取得 的样本数据如表所示。试判断商品价格与需求量之 间回归函数的类型,并求需求量对价格的回归方程, 以及相应的判定系数。
相关文档
最新文档