信息分析与预测-苏敏
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10 概述
需要说明的是, 需要说明的是,人们研究的事物往往受到诸 多因素的复杂影响,而在倾向变动预测中,我们 多因素的复杂影响,而在倾向变动预测中, 都只考虑其中的时间因素, 都只考虑其中的时间因素,即把事物的特征值仅 仅作为时间的函数来表现,求出函数表达式, 仅作为时间的函数来表现,求出函数表达式,并 在假定这种函数关系在要预测的期间内无结构性 突变的情况下,预测其未来值。 突变的情况下,预测其未来值。因此在所研究事 物的客观环境(条件)发生突变的情况下,切不 物的客观环境(条件)发生突变的情况下, 可机械地套用时间序列分析方法, 可机械地套用时间序列分析方法,而应该对研究 对象进行全面的条件和环境分析, 对象进行全面的条件和环境分析,才能得出比较 符合事物发展的客观预测结果。 符合事物发展的客观预测结果。
10 概述
从回归分析法的角度看, 从回归分析法的角度看,时间序列分 析法实际上是一种特殊的回归分析法, 析法实际上是一种特殊的回归分析法,因 为此时不再考虑事物之间的因果关系或其 他相关关系, 他相关关系,而仅考虑研究对象与时间之 间的相关关系, 间的相关关系,即将时间作为自变量来看 待。
10 概述
10 概述
倾向线的拟合方法, 倾向线的拟合方法,实质上是一种时间序列回 归分析法, 归分析法,它是通过数学模型的建立和求解来进 行分析的。 行分析的。这种方法的优点是精确度比较高 。 倾向线的逐步修正方法则是与倾向线拟合方 法性质完全不同的另一种方法。 法性质完全不同的另一种方法。它是通过时间序 列数据的平滑来进行分析的。所谓“平滑” 列数据的平滑来进行分析的。所谓“平滑”,就 是将原始时间序列数据不规则的, 是将原始时间序列数据不规则的,有突变的轨迹 大致地修匀,形成平滑的倾向线, 大致地修匀,形成平滑的倾向线,以把握事物的 发展趋势。 发展趋势。
∑ lg y i = N lg a + lg b ∑ t i 2 ∑ t i lg y i = lg a ∑ t i + lg b ∑ t i
解此联立方程, 解此联立方程,可以得到
10.3.1一次指数曲线法 一次指数曲线法
∑lg y ∑t ∑t ∑t lg y lg a = N ∑t (∑t ) N ∑ t lg y ∑ t ∑ lg b = N ∑ t (∑ t )
y = a + bt + ct
2
10.1.3三次曲线 三次曲线
在时间序列数据yi散点图的倾向线呈三 在时间序列数据 次多项式曲线时, 次多项式曲线时,可以用三次多项式去描 述它,其一般表达式为: 述它,其一般表达式为:
y = a + bt + ct + dt
2
3
10.2.3三次曲线 三次曲线
10.3 指数曲线法
2
a = 14.876
b = 1 . 116
t
所以, 所以,指数曲线回归方程为
y = 14 . 876 × 1 . 116
10.3.1一次指数曲线法 一次指数曲线法
不一致系数为: 不一致系数为:
u=
∑( y y ) ∑y
i i 2 i
∧
2
0.100603 = = 0.0076009 1737.55
10.3.1一次指数曲线法 一次指数曲线法
在时间序列数据散点图的倾向线大致 是一次指数曲线时可用一次指数曲线去拟 合它。 合它。
10.3.1一次指数曲线法 一次指数曲线法
一次指数曲线的一般形式为
y = a bt
10.3.1一次指数曲线法 一次指数曲线法
两边取对数, 两边取对数,有
lg y = lg a + lg b t
10.1.1 一次曲线
为了衡量所得的回归方程与实际值的偏 离程度,引入不一致系数u。 离程度,引入不一致系数 。
u =
∑e ∑y
2 i 2 i
∧
=
Q
∑
2
yi
2
式中 Q =
∑ (y
i
yi ) =
∑e
ຫໍສະໝຸດ Baidu
2 i
剩余平方和
不一致系数u值越小, 不一致系数 值越小,说明所得的拟合 值越小 曲线(回归方程) 曲线(回归方程)与实际值倾向线的偏差 越小,即拟合得越好。 越小,即拟合得越好。
2
10.3.1一次指数曲线法 一次指数曲线法
根据微积分的极值原理, 根据微积分的极值原理,有
1 Q = 2( )∑ [lg y i (lg a + t i lg b)] = 0 a a Q ti = 2∑ [lg y i (lg a + t i lg b)]( ) = 0 b b
10.3.1一次指数曲线法 一次指数曲线法
记Y = lgy, A = lga, B = lgb, 则有 Y = A + B t
10.3.1一次指数曲线法 一次指数曲线法
即将指数曲线化成了直线。 即将指数曲线化成了直线。下面我们来求 回归系数a和 。 回归系数 和b。 直线式的剩余平方和为
Q = ∑ [lg y i (lg a + t i lg b)]
∑t
2 i
10.3.1一次指数曲线法 一次指数曲线法
例:某市1998-2003年的灯具商品销售 某市 年的灯具商品销售 量分别为8.7,10.6,13.3,16.5,20.6,26.0万架, 万架, 量分别为 万架 用一次指数曲线法预测2004年销售量。 年销售量。 用一次指数曲线法预测 年销售量
10.1.1 一次曲线(直线) 一次曲线( )
当时间序列数据的散点图可以用直线 拟合时, 拟合时,则可用直线回归方程来描述研究 对象y与时间 的关系, 与时间t的关系 对象 与时间 的关系,并可据此预测研究 对象的未来情况。 对象的未来情况。
y = a + bt
回归系数a,b可根据最小二乘法求得 回归系数 可根据最小二乘法求得
10.3.1一次指数曲线法 一次指数曲线法
10.3.1一次指数曲线法 一次指数曲线法
根据表中的数据, 根据表中的数据,求得
∑ lg y lg a =
lg b =
i
N ∑ t i lg y i
=
7 . 035001 = 1 . 1725 6 3 . 336587 = = 0 . 04767 70
∑ ti
研究对象呈现指数增长是时间序列数据 分析中比较常见的一种形式, 分析中比较常见的一种形式,特别是研究 对象在初期发展阶段其时间序列数据的倾 向线往往呈指数曲线( 向线往往呈指数曲线(exponenial curve) 上升的趋势。 上升的趋势。如我国网络用户数量增长曲 线就是呈指数曲线形式。 线就是呈指数曲线形式。
2 2
10.1.1 一次曲线
为连续等间隔时, 当时间点 t 1 , t 2 ,... t N 为连续等间隔时, 若把原点取在时间序列的中间, 若把原点取在时间序列的中间, 即在数据项数为奇数( 即在数据项数为奇数(N=2n+1)时,取ti的 ) 系列为: 系列为: -n,-(n-1),…,-2,-1,0,1,2,…,(n-1),n 在数据项数为偶数( 在数据项数为偶数(N=2n)时,取ti的系列 ) 为: -(2n-1),-(2n-3),…,-3,-1,1,3,…,(2n-3),(2n-1)
10 概述
时间序列数据随时间推移而变动包括四种类型: 时间序列数据随时间推移而变动包括四种类型: 倾向变动/趋势变动(trend variation)即在整个 倾向变动 趋势变动( ) 趋势变动 预测内研究对象呈现出渐增或渐减的总倾向。 预测内研究对象呈现出渐增或渐减的总倾向。 周期变动( 周期变动(cyclical variation)即以某一时间间 ) 隔为周期的周期性变动,如危机和复苏的交替。 隔为周期的周期性变动,如危机和复苏的交替。 季节变动( )。即以一年为 季节变动(seasonal variation)。即以一年为 )。 周期的周期变动, 周期的周期变动,如服装行业销售额的季节性波 动。 不规则变动/随机变动(irregular/random 不规则变动 随机变动( 随机变动 variation)是指除以上三种变动之外的变动。 )是指除以上三种变动之外的变动。
10.1.1 一次曲线
a = y b t
b =
∑
N
i =1 N
ti y i t ti
2
∑ ∑
N
∑
t
i =1 N
yi ti
i =1
i =1
经过转换
∑ y ∑t a= N∑t
i
2 2 i
i
∑ ti yi ∑ t i (∑ t i ) 2
b=
N ∑ t i yi ∑ t i ∑ yi N ∑ t i (∑ t i )
2 i i i i i 2 2 i i
i i i 2 2 i i
lg y i
10.3.1一次指数曲线法 一次指数曲线法
由此即可得到a和 。对于时间t的原点 由此即可得到 和b。对于时间 的原点 设在时间序列中间的情况, 设在时间序列中间的情况,有
∑ lg y lg a =
lg b =
i
N ∑ ti lg yi
为了保证时间序列分析的准确性, 为了保证时间序列分析的准确性,时间 序列数据的编制应该遵循以下一些原则: 序列数据的编制应该遵循以下一些原则: 时间序列中的各项数据所代表的时期长短 或间隔时间)应该一致且连续。 (或间隔时间)应该一致且连续。 时间序列中的各项数据所代表的质的内容 应该前后一致。 应该前后一致。 统计指标数据的计算方法和计量单位应该 一致。 一致。
信息分析与预测
教师: 教师:苏敏 电话: 电话:82519545 E-mail:hrbeu.edu.cn
时间序列分析法
10 概述
所谓时间序列( ),就是具 所谓时间序列(time series),就是具 ), 有均匀时间间隔的各种社会、 有均匀时间间隔的各种社会、自然现象的 数量指标依时间次序排列起来的统计数据。 数量指标依时间次序排列起来的统计数据。 时间序列分析法是通过对历史数据变化的 分析, 分析,来评价事物的现状和估计事物的未 来变化。这种方法在科学决策、 来变化。这种方法在科学决策、R&D和市 和市 场开拓活动中的许多场合有广泛的应用, 场开拓活动中的许多场合有广泛的应用, 如市场行情分析、产品销售预测等。 如市场行情分析、产品销售预测等。
10.1.1 一次曲线
式中 Q =
∑ (y
Q
2 i
i
yi ) =
2
∧
∑e
2 i
剩余平方和
u=
∑y
6032271.52 = = 0.11 499736678
10.1.2二次曲线 二次曲线
在时间序列数据y 在时间序列数据 i散点图的倾向线呈 二次多项式曲线时, 二次多项式曲线时,可以用二次多项式去 描述它,其一般表达式为: 描述它,其一般表达式为:
i
58964 = 7370.5 8
∑t y b= ∑t
2 i
99652 = = 593.2 168
所以得到直线回归方程为 y=7370.5+593.2t
10.1.1 一次曲线
预测2008年专利申请量,对于2008年 年专利申请量,对于 预测 年专利申请量 年 ti=19,可得预测值为 ,
y0 = 7370.5 + 593.2 ×19 = 18641
10.1多项式曲线法 多项式曲线法
当进行时间序列分析时, 当进行时间序列分析时,应先将研究 对象的动态数据与所对应的时间序列反映 到直角坐标系中,得到一散点图, 到直角坐标系中,得到一散点图,然后对 散点图进行分析。当可用时间t的 次多项 散点图进行分析。当可用时间 的k次多项 式曲线(multinomial curve)较好地拟合 式曲线( ) 散点时,我们就可以用时间t的 次多项式 散点时,我们就可以用时间 的k次多项式 来描述时间序列数据, 来描述时间序列数据,并据以推测研究对 象的未来状况。 象的未来状况。
10.3.1一次指数曲线法 一次指数曲线法
年的销售量为32.07万 当t=7时,可预测 时 可预测2004年的销售量为 年的销售量为 万 架。
移动平均法
10.4.1概述 概述
倾向线的逐步修正方法是通过时间序 列数据平滑来进行分析的。 列数据平滑来进行分析的。最简单的平滑 方法就是取时间序列数据的算术平均值, 方法就是取时间序列数据的算术平均值, 它能有效地排除随机变动的影响。例如, 它能有效地排除随机变动的影响。例如, y1 时间序列数据为 , y 2 ,... , y N , 对应于时间t=1,2,…,N,其算术平均值为 对应于时间 , 其算术平均值为 y 1 + y 2 + ... + y N 1 N y = = ∑1 y t N N t=
10.1.1 一次曲线
则在此两种情况下都有
∑t
因此有
i
=0
∑y a=
N
i
∑t y b= ∑t
i i
i
2
10.1.1 一次曲线
年到2002年专利申请量的数 例:江苏省1985年到 江苏省 年到 年专利申请量的数 据如下: 据如下:
10.1.1 一次曲线
10.1.1 一次曲线
∑y a=
N
i
i
=