数据挖掘回归与时序分析PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 59.74 4398 13 55.96 4063 23 60.1 4516
4 58.04 4068 14 57.87 4334 24 60.5 4473
5 59.67 4339 15 56.87 4301 25 59.04 4297
6 59.44 4393 16 55.97 4141 26 59.01 4123
n
SSE ( yi yˆ )2 i 1
SSE a
0
SSE
b
0
*
n
SSE yi a bxi 2 i 1
a
yi i n
xi i n
i
xi
i
xi n
yi
i
yi n
i
xi
i
xi n
2
i
xi
i
xi n
yi
i
yi n
b
xi 2
体重与肺活量之间有何关系,这里面的人都正常吗?如何处理?
*
《医药信息分析与应用》课程组
8
回归分析
*
《医药信息分析与应用》课程组
9
回归分析
*
《医药信息分析与应用》课程组
10
二、回归分析
4600 4500
肺活量(ml)
4400
4300
4200
4100
4000
3900
3800
53
54
55
56
57
58
59
60
61
*
《医药信息分析与应用》课程组
11
4600 4500 4400 4300 4200 4100 4000 3900 3800
52
二、回归分析
肺活量(ml)
yˆ a bx
54
56
58
60
62
*
《医药信息分析与应用》课程组
12
二、回归分析
yˆ a bx
最小二 乘法
*
《医药信息分析与应用》课程组
• 检验假设: H0 : 回归方程不显著 H1 : 回归方程
• 显 检验著统计量:F
y
yˆ
yˆ 2
y
2
~ F 1, n 2
n 2
• 检验规则:给定显著性水平 ,
若 F F 1, n 2 ,则回归系数显著。
*
《医药信息分析与应用》课程组
*
《医药信息分析与应用》课程组
7
二、回归分析
编号NO
体重 (kg)
肺活量 (mபைடு நூலகம்)
编号NO
体重 (kg)
肺活量 (ml)
编号NO
体重 (kg)
肺活量 (ml)
1 60.1 4508 11 56.95 4181 21 55.11 4238
2 60.38 4469 12 57.22 4097 22 53.24 4523
i
xi
i
n
SE
y yˆ 2
n2
《医药信息分析与应用》课程组
15
二、回归分析
• 最小二乘法 • 利用EXCEL计算:单击菜单栏中“工具”→ “加载宏”命令,选择相应的“分析工具库” 和“分析工具库–VBA函数”复选框,单击 “确定”按钮,完成加载。
*
《医药信息分析与应用》课程组
16
二、回归分析
• 最小二乘法 • 利用EXCEL计算:单击“工具”→“数据分析” 命令,选中“回归”选项,单击“确定”按钮。
Y=760.25+60.18x
*
《医药信息分析与应用》课程组
17
*
《医药信息分析与应用》课程组
18
二、回归分析
• 对回归方程进行假设检验:通常包括如下三个方面 • 回归系数显著性检验 • 回归模型的显著性检验 • 检验ui 之间是否存在自相关关系
*
《医药信息分析与应用》课程组
19
二、回归分析
• 回归系数显著性检验
• 检验假设:H0 : b 0 H1 : b 0
•
检验统计量:t
b Sb
tn 2
• 检验规则:给定显著性水平α,
若 t t n 2 ,则回归系数显著。
*
《医药信息分析与应用》课程组
20
二、回归分析
• 回归模型的显著性检验
13
二、回归分析
• 最小二乘法:拟合回归模型的原则是寻求代表性 最好的模型
• i 是一个随机变量;
• i 的均值为零,即 Ei 0 ;
• 在每一个时期中,i 的方差为常量,即 Dui 2
• 各个 i 相互独立;
• i 与自变量无关。
*
《医药信息分析与应用》课程组
14
二、回归分析
• 最小二乘法
7 58.7 4389 17 56.07 3905 27 59.7 4216
8 59.75 4306 18 55.28 3943 28 59.06 4077
9 60.5 4395 19 55.79 4195 29 59.12 4287
10 58.72 4462 20 54.56 4039 30 54.21 4201
回归与时序分析
《医药信息分析与应用》课程组 精品课程:正在建设 课程博客: 电子邮箱: communion.
本章要点
一、概述 二、回归分析 三、时间序列分析 四、Microsoft SQL Server 2005实践回归分
析与时间序列分析
*
《医药信息分析与应用》课程组
2
一、概 述
现实生活中的许多现象之间存在着相互依赖、相 互制约的关系,这些关系在量上主要有两种类 型: 确定性关系 (s=pi*r*r) 非确定性关系 (相关关系)
*
《医药信息分析与应用》课程组
5
一、概 述
回归分析与时间序列分析
✓ 时间序列分析方法明确强调变量值顺序的重要性,而 其它统计分析方法则不必如此;
✓ 时间序列各观察值之间存在一定的依存关系,而其它 统计分析一般要求每一变量各自独立;
✓ 时间序列分析根据序列自身的变化规律来预测未来, 而其它统计分析则根据某一变量与其它变量间的因果 关系来预测该变量的未来;
*
《医药信息分析与应用》课程组
3
一、概 述
变量之间是否线性 线性回归模型 非线性回归模型
变量的个数分为: 一元回归和多元回归
*
《医药信息分析与应用》课程组
4
一、概 述
时间序列分析
回归分析中如果自变量是时间,则将按 时间顺序产生的离散型观测数据序列 (xt)(t=1,2,3…)称作时间序列,根据时间 序列,揭示相应系统的内在统计特性和发 展规律的统计方法,称时间序列分析。
✓ 时间序列是一组随机变量的一次样本实现,而其它统 计分析的样本值一般是对同一随机变量进行N次独立重 复实验的结果;
✓ 二者建模思路不同。
*
《医药信息分析与应用》课程组
6
二、回归分析
回归分析的过程即是寻求有关联(相关)的变量 之间的关系的过程,主要内容包括:从一组样本 数据出发,确定这些变量间的定量关系式;对这 些关系式的可信度进行各种统计检验;从影响某 一变量的诸多变量中,判断哪些变量的影响显著, 哪些不显著;利用求得的关系式进行预测和控制。