各个模型的作用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时间序列模型
1.时间序列模型是用于做预测的,其中包含多种预测模型:
1)加法模型
2)乘法模型
3)混合模型
2.移动平均法有简单移动平均法,加权移动平均法,趋势移动平均法(趋势移动平均法对于同时存在直线趋势与周期波动的序列,是一种既能反映趋势变)
化,又可以有效地分离出来周期变动的方法。
2.指数平滑法:一次指数平滑法、二次指数平滑法和三次指数平滑法等(在第7页)
一次指数平滑法虽然克服了移动平均法的缺点。
但当时间序列的变动出现直线趋
势时,用一次指数平滑法进行预测,仍存在明显的滞后偏差。
因此,也必须加以修正。
修正的方法与趋势移动平均法相同,即再作二次指数平滑,利用滞后偏差的规律建立直
线趋势模型。
这就是二次指数平滑法。
当时间序列的变动表现为二次曲线趋势时,则需要用三次指数平滑法
3. 差分指数平滑法:一阶差分指数平滑法、二阶差分指数平滑模型(14)
4.自适应滤波法:以时间序列的历史观测值进行某种加权平均来预测的,它要寻找一组“最佳”的权数,其办法是先用一组给定的权数来计算一个预测值,然后计算预测误差,再根据预测误差调整权数以减少误差
5. 趋势外推预测方法,推测出事物
未来状况的一种比较常用的预测方法。
利用趋势外推法进行预测,主要包括六个阶段:(a)选择应预测的参数;(b)收集必要的数据;(c)利用数据拟合曲线;(d)趋势外推;(e)预测说明;(f)研究预测结果在进行决策中应用的可能性。
趋势外推法常用的典型数学模型有:指数曲线、修正指数曲线、生长曲线、包络
曲线等。
(22)
6. 平稳时间序列模型:自回归模型(Auto Regressive Model)简称AR 模型,移动平均模型(MovingAverage Model)简称MA 模型,自回归移动平均模型(Auto Regressive Moving AverageModel)简称ARMA 模型(23)
1.
插值
1、可用于预测问题,观察相应散点的变化,预测被插值点的函数值
2、主要方法有:一维插值法,二维网格插值和散点插值(contour)
3、要求所求通过所有给定的点
拟合
1、线性拟合:一般都先画出散点图,用plot命令,然后再进行观察拟合,polyfit得系数,polyval
在相关点的值。
2、非线性拟合:(11)
数据的统计描述与分析
1、常见的概率分布函数:正态分布、指数分布、韦伯分布、指数分布、卡方分布、t分布F
分布、概率密度函数、概率分布函数、逆概率分布、均值与方差、随机数生成
2、数直方图描绘用hist
3、参数估计(34)
4、假设检验
5、非参数检验:总体分布的检验步骤:(输入数据、做频数直方图、分布的检验、参数估
计、假设检验)
主成分分析——因子分析
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。
它解决了变量太多计算量太大和分析问题的复杂性高的问题,使变量较少而得到的信息有较多。
通过对原始变量相关矩阵内部结构关系的研究,找出影响某一过程的几个指标,使综合指标为原来变量的线性组合,使我们抓住主要矛盾。
主要应用:1)主成分分析能降低所研究的数据的数据空间维数且所损失的信息很少;
2)可通过因子负荷的结构弄清原始变量间的某些关系;3)多维数据的一种图表表示方法,可用于分类,发现利群点;4)进行主成分回归;5)进行变量筛选,在所选的前几个主成分中,若某个变量的系数都近似为零的话,就可以吧这个原始变量删除;6)进行综合评价。
用主成分分析的优点为:全面性(保留信息多)、可比性(进行标准化,消除了原始数据级上的差别)、合理性(加权平均)、可行性(计算机软件容易实现)
因子分析是主成分分析的推广,也是一种吧多个变量化为少数变量的分析模型。
在matlab中的应用,主成分分析计算步骤:计算标准化矩阵(在Y1=score(X1))相关矩阵R1=corrcoef (Y1)、计算特征值与特征向量([V1,D1]=eig(R1))、计算主成分贡献率及累计贡献率(A1=[特征根]排序:A=fliplr(A1))、计算主成分载荷(累计贡献率)
1、在SPSS中应用
聚类分析
1、在实际工作中,我们经常遇到分类问题,若事先已经建立类别,则使用判别分析,若事先没有建立类别,则使用聚类分析。
聚类分析主要是研究在事先没有分类的情况下,如何将样本归类的方法
2、判别分析是利用原有的分类信息,得到判别函数(判别函数是这种分类函数关系式,一般是与分类相关的若干个指标的线性关系式),然后利用该函数去判断未知样品属于哪一类。
常用的判别分析方法有:距离判别法、费歇尔判别法、贝叶斯判别法等
2、聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、
图论聚类法、聚类预报法等
3、在SPSS中用的比较简单
模糊聚类分析
在生产斗争、科学实验及日常生活中,常要求把所接触、研究的对象(论域),按它们的性质、用途等分成几类。
在科学技术,经济管理中常常需要按一定的标准(相似程度或亲疏关系)进行分类。
对所研究的事物按一定标准进行分类的数学方法称为聚类分析。
由于科学技术,经济管理中的分类往往具有模糊性,因此采用模糊聚类方法通常比较符合实际。
我们不能明确地回答“是”或“否”,而是只能作出“在某种程度上是”的回答,这就是模糊聚类分析。
模糊分析用于聚类分析(蠓的分类、DNA分类)
微分方程模型
《当我们描述实际对象的某些特性随时间(或空间)而演变的过程、分析它的变化规律、预测它的未来性态,研究它的控制手段时,通常要建立对象的动态模型.建模时首先要根据建模目的和对问题的具体分析作出简化假设,然后按照对象内在的或可以类比的其他对象的规律列出微分方程,求出方程的解并将结果翻译回实际对象,就可以进行描述、分析、预测或控制了.》
在实际问题中关于增长(生物学中关于人口问题),衰变(放射性问题),边际(经济学)问题可通过建立微分方程模型来解决。
就解决问题的类型有:一、要求把未知变量直接表示为已知量的函数(多用数值解法);二、要求得出未知函数的一些性质,或它的变化趋势(根据微分方程的定性理论)。
微分方程的建模步骤:1、根据实际问题给出的信息转化为倒数信息,一般的,速率、增长、衰变、边际、改变、变化等都可转化为倒数问题。
2、有相同的物理单位3、给定条件,某一时刻的信息,独立于微分方程而成立微分方程解出后利用他们确定有关常数。
(待定系数、积分常数)4、建立模型。
主要包括指数增长模型和阻滞增长模型(logistic模型)大量使用于人口增长问题和最优捕鱼策略问题中。
回归分析模型
一元线性回归:对于某一现象与影响它的某一主要因素的影响
对具体问题从建模到应用全过程如下:1、首先要搜集与他有关的n组样本数据,画出相应的散点图。
2、设定模型3、用OLS法估计模型中的未知参数并写出回归方程4、计算相关系数和决定系数5、列出方差分析表,进行回归方程的显著性检验6、估计方差,构造两个未知量的置信区间7、残差分线8、模型应用
可化为一元线性回归的曲线回归:一般先化为线性模型,再用OLS 法求出参数估计值,然后经适当变形回到所求曲线。
其中指数函数、对数函数、S行曲线均可化为一元线性回归曲线。
多元线性回归:对实际问题建立起多远线性回归后,一个重要的应用就是利用方程去进行预测,给定变量值的到预测值,与预测区间相比较,当给自变量落在我们需要判断因变量的真实值在某个区间出现的概率是否达到指定的精度。
逐步回归,在给定一系列散点的情况下(课件P41,例题在后面)多元变量时
判别分析
在已知研究对象分成若干类型,并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。
用统计语言来描述为:有K个总体,希望建立一个准则,对任意给定的一个样本,一句这个准则即可判定它属于哪个总体。
判别分析是利用原油的分类信息,得到判别函数(判别函数是这种分类函数关系式,一般是与分类相关的若干个指标的线性关系式),然后利用该函数去判断未知样品属于哪一类。
常用的判别分析方法有:距离判别法、费歇尔判别法、贝叶斯判别法等。
在Matlab软件包中,将已经分类的m个数据(长度为n)作为行向量,得到一个矩阵
trianing,每行都属于一个分类类别,分类类别构成一个整数列向量g(共有m行),待分类的k个数据(长度为n)作为行向量,得到一个矩阵sample,然后利用classify函数进行线性判别分析(默认)。
它的格式为
classify(sample, training, group)
一般步骤:training=[]; %已知数据
group=[]; %已知数据的分类
sample=[]; %待分类样品
class= classify(sample, training, group) %输出样品分类
较复杂的格式:[class,err]= classify(sample, training, group,’type’) %输出样品分类
其中:class 返回分类表;err 返回误差比例信息;sample 样本数据矩阵;training 已有的分类数据矩阵;group 分类列向量;type有三种选择:
type=linear(默认设置)表示进行线性判别分析;
type=quadratic 表示进行二次判别分析;
type=mahalanobis 表示用马氏距离进行判别分析。
层次分析法
层次分析法是一种定性和定量分析相结合的决策分析方法,用较少的定量信息使决策的思维过程数学化。
它的核心问题是排序,包括递阶层次原理、测度原理和排序原理。
层次结构原理氛围三层:目标层、准则层、方案层,每个因素称为元素,按照属性不同把这些元分组形成互不相交的层次,上一层的元素对下一层次的元素其支配作用。
测度原理:决策就是要从已知方案中选择理想的方案,而理想的方案一般是在一定的准则下通过时效用函数极大化而产生的,层次分析法的核心是决策模型中各因素的测度化。
排序原理实质上是一组元素两两比较器重要性,计算元素相对重要性的测度问题。
模型的决策:层次分析法的最终结果是得到相对于总目标层的各决策方案的优先顺序。
在整个递阶层次结构所有判断的总的一致性指标达到满意时,则可以使用模型进行决策。
层次总排序也要进行一致性检验,检验是从高层到底层进行的,单排序的一致性指标CI,平均随机一致性指标RI总排序一致性指标CR<0.1时认为层次总排序具有满意的一致性。
由于在处理复杂的决策问题上的实用性和有效性,层次分析法在经济计划和管理、能源分配、军事指导、交通、农业、科学技术、环保、医疗、行为科学等领域中有广泛应用。
层次分析模型应用于:1)问题中含有一些难以度量的因素2)问题的结构在很大程度上依赖于决策者的经验3)问题的某些变量存在相关性4)需要加入决策者的经验、偏好等因素则运用层次分析模型。
运筹学模型
线性规划模型:线性规划是运筹学上的一个重要分支,在数学上他用来确定多变量满足线性约束下的最优值,模型包含有目标函数和满足对应的约束条件。
线性规划模型主要运用于工农业、军事、交通运输、管理与规划科学实验等领域,用于求最优解。
动态规划模型:它是解决多阶段决策过程最优化问题的一种数学方法,一般要根据问题的特点去寻求算法。
考察某个系统的运行过程可分为若干个阶段,为控制系统的运行沿着预期的方向进行,在每个阶段都要做出决策,这个决策依赖于当前面临的局面,又给随后的发展以影响,当每一阶段的决策定下来,就构成一个决策序列,而动态规划方法就利用bellman的最优化原理及上述方法建立一个基本方程(递推方程)是目标函数达到最优,求出最优解,即最优策略。
动态系统的特征是其中包含有随着时间或空间变化的因素和变量
动态规划的基本方法及一般模型步骤:
1)正确选择阶段变量;
2)正确选择状态变量,状态变量必须能正确描述整个过程的演变特性,又要满足无后效性原则;
3)正确选择决策变量;
4)列出状态转移方程;
5)列出动态规划基本方程给出终端条件即可地推得到最优解。
常用于最短路问题、行遍性问题、人员分配问题、最大收益问题等最短路、行遍性问题的算法:floyd算法用于求任意两点的最短路问题;
解决选址问题和重心问题和中心问题;中国邮递员问题最佳巡回问题;Fleury算法(求欧拉图的欧拉巡回)。
灰色系统理论。