数学建模讲义统计模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
95.9
67
11 3 55 71 9 17 22 6
109.2 102.7
8
1 31 22 44
72.5ቤተ መጻሕፍቲ ባይዱ
9 10
2 54 18 22
93.1
21 47 4 26
115.9
11 12 13
1 40 23 34
83.8
11 66 9 12
113.3
10 68 8 12
109.4
y b 0 b 1 x 1 b 2 x 2 b 3 x 3 b 4 x 4
0 引例
例1: 水泥凝固时放出的热量y与水泥中4种化学成分x1、x2、x3、 x4 有关,今测得一组数据如下,试确定一个 线性模型.
序 号 1
x1 7 x2 26 x3 6 x4 60
y 78.5
23
1 29 15 52
74.3
11 56 8 20
104.3
4
11 31 8 47
87.6
5
7 52 6 33
4. y还受其他因素影响吗? 如x1*x2, yt-1,xt-1
1多元线性回归
y1 b0 b1x11b2x21L bkxk11
L
yn b0b1x1nb2x2nLbkxknn
为了可以使用普通最小二乘法进行参数估计,需对 模型提出若干基本假设 :
(1)随机误差项服从0均值、同方差的正态分布:
i:N (0,2), i1 ,L,n
y1
1 x11 x12 ...x1k
0 1
Y..., X1 x21 x22 ...x2k, 1, 2
...
...... ... ... ...
... ...
yn
1 xn1 xn2 ...xnk
k n
y01x 1 .. .kxk 称为回归平面方程.
线 性 模 型 (Y,X,2In)考 虑 的 主 要 问 题 是 : (1)用 试 验 值 ( 样 本 值 ) 对 未 知 参 数和 2 作 点 估 计 和 假 设 检 验 , 从 而 建 立 y与 x1,x2,..x.k,之
n
n
其中U yˆi y2(回归平方和) Qe (yi yˆi)2 (残差平方和)
i1
i1
(Ⅱ)r检验法
定 义 R L U yyU U Q e为 y与 x1,x2,...,xk的 多 元 相 关 系 数 或 复 相 关 系 数 。 由 于 Fnk k11 R R 22, 故 用 F和 用 R检 验 是 等 效 的 。
3 线性关系的显著性检验
假 设 H 0 :1 . . . k 0
(Ⅰ)F检验法
U/k 当H0成 立 时 , FQe /(nk1)~F(k,nk1)
如 果F>F1-α ( k, n-k-1) , 则 拒 绝H0, 认 为y与x1,… ,xk之 间 显 著 地 有 线 性 关 系 ; 否 则 就 接 受H0, 认 为y与x1,… , xk之 间 线 性 关 系 不 显 著 .
间 的 数 量 关 系 ;
(2)在 x1x0,1x2x0,2..xk . , x0k,处 对 y的 值 作 预 测 与 控 制 , 即 对 y作 区 间 估 计 .
2 参数的最小二乘估计
用最小二乘法求0,...,k 的估计量:作离差平方和
n
Q i1
yi 0 1xi1...kxik
2
bˆ
0
n
Q ( b 0 ,b 1 ,b 2 ,b 3 ,b 4 )( b 0 b 1 x 1 i b 2 x 2 i b 3 x 3 i b 4 x 4 i y i) 2 i 1 1. 线性关系是否显著?
2. 当x=(8,30,10,10)时,95%的可能y落在哪个区间?
3. 是否4种化学成分都对释放的热量有显著影响?
则线性关系不显著,反之显著。 F 1 0 .1 (4 ,1 3 4 1 ) 2 .8 0 6 4
4 预测
(1)点预测
求 出 回 归 方 程 y ˆˆ0ˆ1x1.. .ˆkxk, 对 于 给 定 自 变 量 的 值 x1 *,.x .k ., ,用 y ˆ*ˆ0ˆ1x1*.. .ˆkxk*来 预 测 y01x1*.. . kxk*.称 y ˆ* y 为 * 的 点 预 测 .
3 线性关系的显著性检验
记:
y
1 n
n i1
yi
y94.4231
回归平方和:
残差平方和:
n
U ( yˆi y)2 =2677.9 i1
n
Qe (yi yˆi )2 =47.86 i1
F U/k : F(k,nk1) Q e/(nk1)
若 FF 1(k,nk1)
F 2677.9/4 111.48 47.86/(1341)
6 2 .4 0
选择0,...,k 使Q达到最小。
解得 ˆXTX1XTY
bˆ1
bˆ
2
bˆ 3
1
.
5
5
0 .5 1
0
.
1
0
得 到 的 ˆi代 入 回 归 平 面 方 程 得 : yˆ0 ˆ1 x 1 . . bˆ.4ˆkx k 0 . 1 4
称 为 经 验 回 归 平 面 方 程 ˆ .i 称 为 经 验 回 归 系 数 .
(2)区间预测
y 的1 的预测区间(置信)区间为
ˆe
Qe n k 1
yˆ ˆe
1
X0
(X
T
X
)1
X
T 0
t1 /2
(n
k
1),
Qe
n
(yi yˆi )2
yˆ ˆe
1
X0
(X
T
X
)1
X
T 0
t1
/2
(n
k
1)
残差平i方1 和:
4 预测
在未知点 (x1,x2,L ,xk) 的点预测为: (7,40,10,30)
数学建模讲义
统计模型
— 回归分析
主要内容
0 引例 1 (多元)线性回归模型 2 参数的最小二乘估计 3 线性关系的显著性检验 4 区间预测 5 参数的区间估计(假设检验) 6 matlab多元线性回归 7 matlab非线性回归 8 非线性回归化为线性回归 9 matlab逐步回归 10 综合实例:牙膏的销售量 11 综合实例:投资额与国民生产总值和物价指数
(2)随机误差项在不同样本点之间是独立的,不存在序列相关:
cov(i,j)0, ij
(3)随机误差项与解释变量之间不相关:
c o v (i,x ij) 0 , i 1 ,L ,n ;j 1 ,L ,k
多元线性回归
一 般 称
Y X E () 0 ,C( O ,) V 2 In
为 高 斯 — 马 尔 柯 夫 线 性 模 型 ( k 元 线 性 回 归 模 型 ) , 并 简 记 为 (Y ,X ,2 In)
67
11 3 55 71 9 17 22 6
109.2 102.7
8
1 31 22 44
72.5ቤተ መጻሕፍቲ ባይዱ
9 10
2 54 18 22
93.1
21 47 4 26
115.9
11 12 13
1 40 23 34
83.8
11 66 9 12
113.3
10 68 8 12
109.4
y b 0 b 1 x 1 b 2 x 2 b 3 x 3 b 4 x 4
0 引例
例1: 水泥凝固时放出的热量y与水泥中4种化学成分x1、x2、x3、 x4 有关,今测得一组数据如下,试确定一个 线性模型.
序 号 1
x1 7 x2 26 x3 6 x4 60
y 78.5
23
1 29 15 52
74.3
11 56 8 20
104.3
4
11 31 8 47
87.6
5
7 52 6 33
4. y还受其他因素影响吗? 如x1*x2, yt-1,xt-1
1多元线性回归
y1 b0 b1x11b2x21L bkxk11
L
yn b0b1x1nb2x2nLbkxknn
为了可以使用普通最小二乘法进行参数估计,需对 模型提出若干基本假设 :
(1)随机误差项服从0均值、同方差的正态分布:
i:N (0,2), i1 ,L,n
y1
1 x11 x12 ...x1k
0 1
Y..., X1 x21 x22 ...x2k, 1, 2
...
...... ... ... ...
... ...
yn
1 xn1 xn2 ...xnk
k n
y01x 1 .. .kxk 称为回归平面方程.
线 性 模 型 (Y,X,2In)考 虑 的 主 要 问 题 是 : (1)用 试 验 值 ( 样 本 值 ) 对 未 知 参 数和 2 作 点 估 计 和 假 设 检 验 , 从 而 建 立 y与 x1,x2,..x.k,之
n
n
其中U yˆi y2(回归平方和) Qe (yi yˆi)2 (残差平方和)
i1
i1
(Ⅱ)r检验法
定 义 R L U yyU U Q e为 y与 x1,x2,...,xk的 多 元 相 关 系 数 或 复 相 关 系 数 。 由 于 Fnk k11 R R 22, 故 用 F和 用 R检 验 是 等 效 的 。
3 线性关系的显著性检验
假 设 H 0 :1 . . . k 0
(Ⅰ)F检验法
U/k 当H0成 立 时 , FQe /(nk1)~F(k,nk1)
如 果F>F1-α ( k, n-k-1) , 则 拒 绝H0, 认 为y与x1,… ,xk之 间 显 著 地 有 线 性 关 系 ; 否 则 就 接 受H0, 认 为y与x1,… , xk之 间 线 性 关 系 不 显 著 .
间 的 数 量 关 系 ;
(2)在 x1x0,1x2x0,2..xk . , x0k,处 对 y的 值 作 预 测 与 控 制 , 即 对 y作 区 间 估 计 .
2 参数的最小二乘估计
用最小二乘法求0,...,k 的估计量:作离差平方和
n
Q i1
yi 0 1xi1...kxik
2
bˆ
0
n
Q ( b 0 ,b 1 ,b 2 ,b 3 ,b 4 )( b 0 b 1 x 1 i b 2 x 2 i b 3 x 3 i b 4 x 4 i y i) 2 i 1 1. 线性关系是否显著?
2. 当x=(8,30,10,10)时,95%的可能y落在哪个区间?
3. 是否4种化学成分都对释放的热量有显著影响?
则线性关系不显著,反之显著。 F 1 0 .1 (4 ,1 3 4 1 ) 2 .8 0 6 4
4 预测
(1)点预测
求 出 回 归 方 程 y ˆˆ0ˆ1x1.. .ˆkxk, 对 于 给 定 自 变 量 的 值 x1 *,.x .k ., ,用 y ˆ*ˆ0ˆ1x1*.. .ˆkxk*来 预 测 y01x1*.. . kxk*.称 y ˆ* y 为 * 的 点 预 测 .
3 线性关系的显著性检验
记:
y
1 n
n i1
yi
y94.4231
回归平方和:
残差平方和:
n
U ( yˆi y)2 =2677.9 i1
n
Qe (yi yˆi )2 =47.86 i1
F U/k : F(k,nk1) Q e/(nk1)
若 FF 1(k,nk1)
F 2677.9/4 111.48 47.86/(1341)
6 2 .4 0
选择0,...,k 使Q达到最小。
解得 ˆXTX1XTY
bˆ1
bˆ
2
bˆ 3
1
.
5
5
0 .5 1
0
.
1
0
得 到 的 ˆi代 入 回 归 平 面 方 程 得 : yˆ0 ˆ1 x 1 . . bˆ.4ˆkx k 0 . 1 4
称 为 经 验 回 归 平 面 方 程 ˆ .i 称 为 经 验 回 归 系 数 .
(2)区间预测
y 的1 的预测区间(置信)区间为
ˆe
Qe n k 1
yˆ ˆe
1
X0
(X
T
X
)1
X
T 0
t1 /2
(n
k
1),
Qe
n
(yi yˆi )2
yˆ ˆe
1
X0
(X
T
X
)1
X
T 0
t1
/2
(n
k
1)
残差平i方1 和:
4 预测
在未知点 (x1,x2,L ,xk) 的点预测为: (7,40,10,30)
数学建模讲义
统计模型
— 回归分析
主要内容
0 引例 1 (多元)线性回归模型 2 参数的最小二乘估计 3 线性关系的显著性检验 4 区间预测 5 参数的区间估计(假设检验) 6 matlab多元线性回归 7 matlab非线性回归 8 非线性回归化为线性回归 9 matlab逐步回归 10 综合实例:牙膏的销售量 11 综合实例:投资额与国民生产总值和物价指数
(2)随机误差项在不同样本点之间是独立的,不存在序列相关:
cov(i,j)0, ij
(3)随机误差项与解释变量之间不相关:
c o v (i,x ij) 0 , i 1 ,L ,n ;j 1 ,L ,k
多元线性回归
一 般 称
Y X E () 0 ,C( O ,) V 2 In
为 高 斯 — 马 尔 柯 夫 线 性 模 型 ( k 元 线 性 回 归 模 型 ) , 并 简 记 为 (Y ,X ,2 In)