数学建模与数学实验(4版) 回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4
6
8
10
12
14
16
散 点 图
此即非线性回归或曲线回归 问题(需要配曲线) 配曲线的一般方法是:
先对两个变量 x 和 y 作 n 次试验观察得(xi , yi ), i 1,2,..., n 画出散点图,
根据散点图确定须配曲线的类型.然后由 n 对试验数据确定每一类曲线的未知
参数 a 和 b.采用的方法是通过变量代换把非线性回归化成线性回归,即采用
返回 22
多项式回归
(一)一元多项式回归 y=a1xm+a2xm-1+…+amx+am+1 1、回归:
(1)确定多项式系数的命令:[p,S]=polyfit(x,y,m)
其中 x=(x1,x2,…,xn),y=(y1,y2,…,yn); p=(a1,a2,…,am+1)是多项式 y=a1xm+a2xm-1+…+amx+am+1 的系数;S 是一个矩阵,用来估计预测误差.
(n

2)
2
1 1 x0 x2
n
Lxx
特别,当 n 很大且 x0 在x 附近取值时,
y 的置信水平为1 的预测区间近似为





ˆ
e u1 2
,


ˆ
e
u
1

2

2019/6/21
13
(2)控制
要求: y 0 1x 的值以1 的概率落在指定区间y, y
[b,bint,r,rint,stats]=regress(Y,X)
b,bint,stats
得结果:b =
bint =
To MATLAB(liti11)
-16.0730
-33.7071 1.5612
0.7194
0.6047 0.8340
stats =
0.9282 180.9531 0.0000
即 ˆ0 16.073, ˆ1 0.7194 ; ˆ0 的置信区间为[-33.7017,1.5612],ˆ1 的置信区间为[0.6047,0.834];
有 n 组独立观测值,(x1,y1),(x2,y2),…,(xn,yn)

yi 0 x1 i ,i 1,2,...,n E i 0, D i 2 且1 2,..., n相互独立
n
n

Q Q(0 , 1)

2 i

yi 0 1xi 2
3、画出残差及其置信区间:
rcoplot(r,rint) 20
例1 解:1、输入数据:
x=[143 145 146 147 149 150 153 154 155 156 157 158 159
题目
160 162 164]';
X=[ones(16,1) x];
Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]'; 2、回归分析及检验:
r2=0.9282, F=180.9531, p=0.0000
p<0.05, 可知回归模型 y=-16.073+0.7194x 成立.
21
3、残差分析,作残差图:
rcoplot(r,rint)
从残差图可以看出,除第二个数据外,其余数据的残
差离零点均较近,且残差的置信区间均包含零点,这说明
回归模型 y=-16.073+0.7194x能较好的符合原始数据,而第

2)
,

2
2
Qe (n
2)

2019/6/21
12
3、预测与控制
(1)预测
用 y0 的回归值 yˆ0 ˆ0 ˆ1x0 作为 y0的预测值.
y0 的置信水平为1 的预测区间为
yˆ0 (x0 ), yˆ0 (x0 )
其中
(x0
)

ˆ
e
t
1
故 T t (n 2) ,拒绝H 0 ,否则就接受H 0 .
1
2n
n
其中Lxx (xi x)2 xi2 nx 2
i 1
i 1
2019/6/21
Fra Baidu bibliotek
10
(Ⅲ)r检验法
n
(xi x)( yi y)

r
i 1
n
n
(xi x)2 ( yi y)2
则x, x 就是所求的 x 的控制区间.
2019/6/21
14
四、可线性化的一元非线性回归(曲线回归)
例2 出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀, 容积不断增大.我们希望知道使用次数与增大的容积之间的关 系.对一钢包作试验,测得的数据列于下表:
使用次数
2 3 4 5 6 7 8 9
增大容积
6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99
使用次数
10 11 12 13 14 15 16
增大容积
10.49 10.59 10.60 10.80 10.60 10.90 10.76
2019/6/21
15
11
10.5
10
9.5
9
8.5
8
7.5
7
6.5
6
2
回 归 系 数







用于检验回归模型的统计量,
区 间
有三个数值:相关系数r2、

F值、与F对应的概率p

相关系数 r2 越接近 1,说明回归方程越显著;
.


省显
时著
为性
0
水 平
05

F > F1-α (k,n-k-1)时拒绝 H0,F 越大,说明回归方程越显著;
与 F 对应的概率 p 时拒绝 H0,回归模型成立.
xi x 2
i 1
其中
x

1 n
n i 1
xi , y

1 n
n i 1
yi,x 2

1 n
n i 1
xi2 , xy

1 n
n i 1
xi yi
(经验)回归方程为:
yˆ ˆ0 ˆ1x y ˆ1(x x)
2019/6/21
7
2、 2 的无偏估计
模 型 参 数 估 计
2019/6/21
* *
* *
检 验 、 预 测 与 控 制
性可 回线 归性 (化 曲的 线一 回元 归非 )线
数 学 模 型 及 定 义
模 型 参 数 估 计
检 验 与 预 测
多 元 线 性 回

逐 步 回 归 分 析

的3
一元线性回归 一、数学模型
例1 测16名成年女子的身高与腿长所得数据如下:
X

1 ...
x21 ...
x22 ...
...
x2
p

... ...
1
xn1
xn2
...
xnp

对一元线性回归,取 p=1 即可
2019/6/21
19
2、求回归系数的点估计和区间估计、并检验回归模型: [b, bint,r,rint,stats]=regress(Y,X,alpha)
二个数据可视为异常点.
Residual Case Order Plot
4
3
4、预测及作图:
2 1
Residuals
z=b(1)+b(2)*x
0
-1
plot(x,Y,'k+',x,z,'r')
-2
-3
-4
-5
2
4
6
8
10 12 14
16
Case Number
To MATLAB(liti12)
2019/6/21
Y 0 1x ,称为 y 对 x 的回归直线方程. 一元线性回归分析的主要任务是:
1、用试验值(样本值)对0 、 1 和 作点估计;
2、对回归系数0 、 1 作假设检验;
3、在 x=x0 处对 y 作预测,对 y 作区间估计. 返回
2019/6/21
5
二、模型参数估计
1、回归系数的最小二乘估计
身高 143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164
腿长
88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
、ˆ1 独立 。
2019/6/21
8
三、检验、预测与控制
1、回归方程的显著性检验 对回归方程Y 0 1x 的显著性检验,归结为对假设 H 0 : 1 0; H1 : 1 0
进行检验.
假设 H 0 : 1 0 被拒绝,则回归显著,认为 y 与 x 存在线性关 系,所求的线性回归方程有意义;否则回归不显著,y 与 x 的关系 不能用一元线性回归模型来描述,所得的回归方程也无意义.
x2 Lxx
, ˆ0
t1 2
(n

2)ˆ e
1

x2

n Lxx


ˆ1


t1 2
(n

2)ˆ e
/
Lxx , ˆ1 t1 (n 2)ˆ e / 2
Lxx

2 的置信水平为 1- 的置信区间为




2
1 2
Qe (n
数学建模与数学实验
回归分析
2019/6/21
后勤工程学院数学教研室
1
实验目的
1、直观了解回归分析基本内容。 2、掌握用数学软件求解回归分析问题。
实验内容
1、回归分析的基本理论。 2、用数学软件求解回归分析问题。 3、实验作业。
回归分析
一元线性回归
多元线性回归 (原理略)
数 学 模 型 及 定 义
i 1
i 1
最小二乘法就是选择 0 和 1 的估计 ˆ0 , ˆ1 使得
Q(ˆ0
,
ˆ1
)

min
0 ,1
Q( 0
,
1
)
2019/6/21
6
解得
ˆ

0

y

ˆ1x
ˆ1


xy x y x2 x2
n
xi xyi y
或 ˆ1 i1 n
2019/6/21
9
(Ⅰ)F检验法
当 H 0 成立时,
F
U
~F(1,n-2)
Qe /(n 2)
n
其中 U yˆi y2 (回归平方和) i 1
故 F> F1 (1, n 2) ,拒绝H 0 ,否则就接受H 0 .
(Ⅱ)t检验法 当 H 0 成立时,T
Lxx ˆ1 ~t(n-2) ˆ e
只要控制 x 满足以下两个不等式
yˆ (x) y, yˆ (x) y 要求 y y 2 (x) .若 yˆ (x) y, yˆ (x) y 分别有解x
和 x ,即 yˆ (x) y, yˆ (x) y .
2019/6/21
18
多元线性回归
y 0 1x1 ... p x p
1、确定回归系数的点估计值:
b=regress( Y, X )
b


ˆ 0 ˆ1
.ˆ.p.

Y1
Y

Y2

...
Yn

1 x11 x12 ... x1p
非线性回归线性化的方法.
2019/6/21
16
通常选择的六类曲线如下:
(1)双曲线 1 a b
y
x
(2)幂函数曲线 y=axb , 其中 x>0,a>0
(3)指数曲线 y=aebx 其中参数 a>0.
(4)倒指数曲线 y=aeb / x 其中 a>0,
(5)对数曲线 y=a+blogx,x>0
i 1
i 1
当|r|> r1-α 时,拒绝 H0;否则就接受 H0.
其中 r1
1
1 n 2 F1 1, n 2
2019/6/21
11
2、回归系数的置信区间
0 和 1 置信水平为 1-α 的置信区间分别为

ˆ
0

t1 2
(n

2)ˆ e
1 n

n
记 Qe Q(ˆ0 , ˆ1 )
yi ˆ0 ˆ1xi 2 n ( yi yˆi )2
i 1
i 1
称 Qe 为残差平方和或剩余平方和.
2 的无偏估计为
ˆ
2 e

Qe
(n 2)
称ˆ
2 e
为剩余方差(残差的方差),
ˆ
2 e
分别与ˆ0
ˆ e 称为剩余标准差.
解答
102
100
98
y 0 1x
96
94
92
90
88
86
84
140
145
150
155
160
165
2019/6/21
散点图
4
一般地,称由 y 0 1x 确定的模型
为一元线性回归模型,记为
y 0 1x E 0, D 2
固定的未知参数 0 、 1 称为回归系数,自变量 x 也称为回归变量.
(6)S 型曲线 y 1 a bex
解例 2.由散点图我们选配倒指数曲线 y=eab/ x
根据线性化方法,算得bˆ 1.1107 , Aˆ 2.4587
由此 aˆ e Aˆ 11.6789
2019/6/21
1.1107

最后得 y 11.6789 e x
17
解答
统计工具箱中的回归分析命令 1、多元线性回归 2、多项式回归 3、非线性回归 4、逐步回归 返回
相关文档
最新文档