回归分析讲义
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学建模与数学实验
回归分析
2020/9/19
1
目的
1、了解回归分析基本内容。 2、掌握用数学软件求解回归分析问题。
一元线性回归:
例1 测16名成年女子的身高与腿长所得数据如下:
身 高1 4 31 4 51 4 61 4 71 4 91 5 01 5 31 5 41 5 51 5 61 5 71 5 81 5 91 6 01 6 21 6 4 腿 长8 8 8 5 8 8 9 1 9 2 9 3 9 3 9 5 9 6 9 8 9 7 9 6 9 8 9 91 0 01 0 2
2020/9/19
7
回归分析的基本思想
变量之间的关系
确定性关系 相 关关系
Sr2
身高和体重
确定性关系 相关关系
相关关系的特征是:变量之间的关系很难用一 种精确的方法表示出来.
回归分析——处理变量之间的相关关系的一 种数学方法,它是最常用的数理统计方法.
2020/9/19
8
起源:英国统计学家F.GALTON和K.PEARSON研究 身高问题时总结出来的。
2020/9/19
19
表中显示方方 差和 来、 源自 、由 平 F度 比、 以均 及方 显、 著性
F的值 13为 .652, 0 其相伴 0.0概 0, 0率 即为 检验 H0: 假回 设归 “ j= 系 0”数
成立的概 0.0率 0, 0等 从于 而应 H0, 该说 拒明 绝回归效果显
腿 长8 8 8 5 8 8 9 1 9 2 9 3 9 3 9 5 9 6 9 8 9 7 9 6 9 8 9 91 0
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
102
解答
100
98
y01x
96
94
92
90
88
86
84
140
145
150
155
160
165
回
一元线性回归分析 线性回归分析
归
多元线性回归分析
分 析
非线性回归分析
2020/9/19
9
一元线性回归:
例1 测16名成年女子的身高与腿长所得数据如下:
身 高1 4 31 4 51 4 61 4 71 4 91 5 01 5 31 5 41 5 51 5 61 5 71 5 81 5 91 6 01 6
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
102
解答
100
98
y01x
96
94
92
90
88
86
84
140
145
150
155
160
165
2020/9/19
3
散点图
多元线性回归:
20000
10000
人 均 GNP
0
70
60 50
2020/9服/1产9 比
40
2020/9/19
15
0.05:F统计量的相S伴 ig概 0.0率 , 5 应该引入回归方程; 0.1:F统计量的相S伴 ig概 0.1, 率应该从回归; 方程剔除
2020/9/19
16
2020/9/19
17
2020/9/19
18
显示:相R= 关 0.9系 9, 5R 数 2= 0.91, 3 经调R2整 = 0.9的 0, 6 估计标准 1.82误 。 49差 表明身高与 存腿 在长 线之 性间 相关
30
0
10
20
30 40 50 60
高教入学
70
服务业产值
高校入学率 人均GNP
比
0.97
348.42
25.01
2.21
375.46
31.16
4.19
603.14
35.44
6.3
698.42
35.68
8.74
666.86
39.45
10.48
1501.88
43.92
12.36
1851.18
47.18
14.55
2
4
6
8
10
12
14
16
散 点 图
此即非线性回归或曲线回归 问题(需要配曲线) 配曲线的一般方法是:
先 对 两 个 变 量 x 和 y作 n 次 试 验 观 察 得 (x i,y i)i ,1 ,2 ,.n .画 .出 ,散 点 图 ,
根 据 散 点 图 确 定 须 配 曲 线 的 类 型 .然 后 由 n 对 试 验 数 据 确 定 每 一 类 曲 线 的 未 知
2020/9/19
10
散点图
2020/9/19
腿长
102
100
98
96
94
92
90
88
86
84
140
150
身高
160
11 170
一元线性回归spss:
2020/9/19
12
2020/9/19
13
Estim:a默te认的输出项。 j、S输 j和出 其与 相伴概率值等。
Modfeilt:默认的输 .输出出项(调整), 判回 定归 系方 数程的。 标准误 Rsquarcehdan: ge方程引入或个 者自 踢变 出量 一以后。 的变化量 C2a02s0e/9/w 19 disieagnoss:输 tic出标准化残差 3的绝样对本值点的相1关 4 信息
参 数 a和 b .采 用 的 方 法 是 通 过 变 量 代 换 把 非 线 性 回 归 化 成 线 性 回 归 , 即 采 用
非 线 性 回 归 线 性 化 的 方 法 .
2020/9/19
6
通常选择的六类曲线如下:
( 1 ) 双 曲 线 1 a b y x
( 2 ) 幂 函 数 曲 线 y = a x b , 其 中 x > 0 , a > 0
1811.18
45.85
16.25
2099.16
46.3
19.05
3709.54
44.45ຫໍສະໝຸດ Baidu
21.46
3592.09
36.98
23.59
4940.4
49.4
25.64
5899.97
51.89
27.59
9742.41
54.04
29.55
8462.23
52.88
31.55
14371.63
54.88
34.94
( 3 ) 指 数 曲 线 y = a e b 其 中 参 数 a > 0 x .
( 4) 倒 指 数 曲 线 y=aeb/x 其 中 a>0,
( 5 ) 对 数 曲 线 y = a + b l o g x , x > 0 ( 6 ) S 型 曲 线 y 1
a b x e
也可根据专业知识直接确定类型,进而估计参数即可(logstic) 当然,多项式形式是一个通用的选择,但可能精度不高。
13212.76
52.16
38.2 44.37
12099.78 8830.92
452.78 43.32
一元非线性回归:
高教入学率
60
50
40
30
20
10
0
-10
-10000
0
人 均 GDP
10000
20000
30000
40000
2020/9/19
5
11
10.5
10
9.5
9
8.5
8
7.5
7
6.5
6
回归分析
2020/9/19
1
目的
1、了解回归分析基本内容。 2、掌握用数学软件求解回归分析问题。
一元线性回归:
例1 测16名成年女子的身高与腿长所得数据如下:
身 高1 4 31 4 51 4 61 4 71 4 91 5 01 5 31 5 41 5 51 5 61 5 71 5 81 5 91 6 01 6 21 6 4 腿 长8 8 8 5 8 8 9 1 9 2 9 3 9 3 9 5 9 6 9 8 9 7 9 6 9 8 9 91 0 01 0 2
2020/9/19
7
回归分析的基本思想
变量之间的关系
确定性关系 相 关关系
Sr2
身高和体重
确定性关系 相关关系
相关关系的特征是:变量之间的关系很难用一 种精确的方法表示出来.
回归分析——处理变量之间的相关关系的一 种数学方法,它是最常用的数理统计方法.
2020/9/19
8
起源:英国统计学家F.GALTON和K.PEARSON研究 身高问题时总结出来的。
2020/9/19
19
表中显示方方 差和 来、 源自 、由 平 F度 比、 以均 及方 显、 著性
F的值 13为 .652, 0 其相伴 0.0概 0, 0率 即为 检验 H0: 假回 设归 “ j= 系 0”数
成立的概 0.0率 0, 0等 从于 而应 H0, 该说 拒明 绝回归效果显
腿 长8 8 8 5 8 8 9 1 9 2 9 3 9 3 9 5 9 6 9 8 9 7 9 6 9 8 9 91 0
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
102
解答
100
98
y01x
96
94
92
90
88
86
84
140
145
150
155
160
165
回
一元线性回归分析 线性回归分析
归
多元线性回归分析
分 析
非线性回归分析
2020/9/19
9
一元线性回归:
例1 测16名成年女子的身高与腿长所得数据如下:
身 高1 4 31 4 51 4 61 4 71 4 91 5 01 5 31 5 41 5 51 5 61 5 71 5 81 5 91 6 01 6
以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出.
102
解答
100
98
y01x
96
94
92
90
88
86
84
140
145
150
155
160
165
2020/9/19
3
散点图
多元线性回归:
20000
10000
人 均 GNP
0
70
60 50
2020/9服/1产9 比
40
2020/9/19
15
0.05:F统计量的相S伴 ig概 0.0率 , 5 应该引入回归方程; 0.1:F统计量的相S伴 ig概 0.1, 率应该从回归; 方程剔除
2020/9/19
16
2020/9/19
17
2020/9/19
18
显示:相R= 关 0.9系 9, 5R 数 2= 0.91, 3 经调R2整 = 0.9的 0, 6 估计标准 1.82误 。 49差 表明身高与 存腿 在长 线之 性间 相关
30
0
10
20
30 40 50 60
高教入学
70
服务业产值
高校入学率 人均GNP
比
0.97
348.42
25.01
2.21
375.46
31.16
4.19
603.14
35.44
6.3
698.42
35.68
8.74
666.86
39.45
10.48
1501.88
43.92
12.36
1851.18
47.18
14.55
2
4
6
8
10
12
14
16
散 点 图
此即非线性回归或曲线回归 问题(需要配曲线) 配曲线的一般方法是:
先 对 两 个 变 量 x 和 y作 n 次 试 验 观 察 得 (x i,y i)i ,1 ,2 ,.n .画 .出 ,散 点 图 ,
根 据 散 点 图 确 定 须 配 曲 线 的 类 型 .然 后 由 n 对 试 验 数 据 确 定 每 一 类 曲 线 的 未 知
2020/9/19
10
散点图
2020/9/19
腿长
102
100
98
96
94
92
90
88
86
84
140
150
身高
160
11 170
一元线性回归spss:
2020/9/19
12
2020/9/19
13
Estim:a默te认的输出项。 j、S输 j和出 其与 相伴概率值等。
Modfeilt:默认的输 .输出出项(调整), 判回 定归 系方 数程的。 标准误 Rsquarcehdan: ge方程引入或个 者自 踢变 出量 一以后。 的变化量 C2a02s0e/9/w 19 disieagnoss:输 tic出标准化残差 3的绝样对本值点的相1关 4 信息
参 数 a和 b .采 用 的 方 法 是 通 过 变 量 代 换 把 非 线 性 回 归 化 成 线 性 回 归 , 即 采 用
非 线 性 回 归 线 性 化 的 方 法 .
2020/9/19
6
通常选择的六类曲线如下:
( 1 ) 双 曲 线 1 a b y x
( 2 ) 幂 函 数 曲 线 y = a x b , 其 中 x > 0 , a > 0
1811.18
45.85
16.25
2099.16
46.3
19.05
3709.54
44.45ຫໍສະໝຸດ Baidu
21.46
3592.09
36.98
23.59
4940.4
49.4
25.64
5899.97
51.89
27.59
9742.41
54.04
29.55
8462.23
52.88
31.55
14371.63
54.88
34.94
( 3 ) 指 数 曲 线 y = a e b 其 中 参 数 a > 0 x .
( 4) 倒 指 数 曲 线 y=aeb/x 其 中 a>0,
( 5 ) 对 数 曲 线 y = a + b l o g x , x > 0 ( 6 ) S 型 曲 线 y 1
a b x e
也可根据专业知识直接确定类型,进而估计参数即可(logstic) 当然,多项式形式是一个通用的选择,但可能精度不高。
13212.76
52.16
38.2 44.37
12099.78 8830.92
452.78 43.32
一元非线性回归:
高教入学率
60
50
40
30
20
10
0
-10
-10000
0
人 均 GDP
10000
20000
30000
40000
2020/9/19
5
11
10.5
10
9.5
9
8.5
8
7.5
7
6.5
6