时间序列分析(Time Serials Analysis)2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将时间序列数据均分为三个部分, 将时间序列数据均分为三个部分,分别 求和。 求和。 根据S1,S 2,S3的三等式,求参数:
S3 − S 2 b = S 2 − S1
n
S 2 − S1 1 k = ( S1 − n ) n b −1
b −1 a = ( S 2 − S1 ) n 2 (b − 1)
生长曲线拟合
计算不一致系数u
yi 估计值 yi 估计值) ( yi -yi 估计值 ) 3218.1 739428.01 16630084 4404.5 331200.25 24800400 5590.9 63453.61 28504921 6777.3 901170.49 33965584 7963.7 713518.09 50680161 9150.1 883788.01 67404100 10336.5 2.25 106874244 11522.9 2399710.81 170877184 499736678 6032271.52 U=sqrt(∑ (yi-yi估计值)2)/ ∑yi 2 ) 估计值) 估计值
倾向线拟合
又称曲线拟合。包括一下方法: 又称曲线拟合。包括一下方法: 直线拟合 多项式拟合(包括二次、三次曲线等) 多项式拟合(包括二次、三次曲线等) 指数曲线(指数曲线、修正指数曲线等) 指数曲线(指数曲线、修正指数曲线等) 生长曲线(逻辑曲线、龚珀兹曲线、 生长曲线(逻辑曲线、龚珀兹曲线、饱 和指数曲线) 和指数曲线) 包络曲线
以史为鉴,可以正衣冠。 以史为鉴,可以正衣冠。 以往不可追,来者犹可待。 以往不可追,来者犹可待。 吴子曰:以见占隐。 吴子曰:以见占隐。 佛家:跳出三界外, 佛家:跳出三界外,不在五行中
历史资料不仅仅是一段记忆
劝君少骂秦始皇,焚坑事件要商量。 劝君少骂秦始皇 焚坑事件要商量。 焚坑事件要商量 祖龙魂死业犹在,孔学名高实秕糠 孔学名高实秕糠。 祖龙魂死业犹在 孔学名高实秕糠。 百代都行秦政法,十批不是好文章 十批不是好文章。 百代都行秦政法 十批不是好文章。 佛教说法,任何事情都是因缘聚散的结果。 佛教说法,任何事情都是因缘聚散的结果。 是历史事件就会对历史产生影响。 是历史事件就会对历史产生影响。 正在发生的事件也是历史事件。 正在发生的事件也是历史事件。
江苏省专利申请量 专利申请量yi 年份 时间 ti 专利申请量 yi 1995 -7 4078 1996 -5 4980 1997 -3 5339 1998 -1 5828 1999 1 7119 2000 3 8210 2001 5 10338 2002 7 13072
时间ti 专利申请量yi 年份 时间 专利申请量 yi 1995 -7 4078 1996 -5 4980 1997 -3 5339 1998 -1 5828 1999 1 7119 2000 3 8210 2001 5 10338 7 2002 13072 58964
t
取a < 0, < b < 1时,随着t的增加, 0
修正指数曲线 t 1 4 3.5 3 2.5 2 1.5 1 0.5 0 2 3 4 5 6 7 8 9 10 11 12 13 14
Y
k k k
k
a>0,b>1
a>0,b<1
a<0,b>1
a<0,b<1
修正指数曲线的几种形态
三和法求K、a、b
首先发现于细菌增殖和细胞分裂过程。 首先发现于细菌增殖和细胞分裂过程。 存在萌芽、发展、成熟(稳定) 存在萌芽、发展、成熟(稳定)三个大致的 态势。 态势。 技术、经济、社会现象都有这种情况出现。 技术、经济、社会现象都有这种情况出现。 常用曲线极其特点:逻辑(皮尔)曲线、 常用曲线极其特点:逻辑(皮尔)曲线、龚 珀兹曲线。 珀兹曲线。 逻辑曲线公式: 逻辑曲线公式:
故纸堆里面的数字 有价值的数字如何进行处理? 有价值的数字如何进行处理? 时间序列法既是对能够反应事物发展变 化的特征数值的一种处理方法, 化的特征数值的一种处理方法,又是一 类对其进行深度分析的数理方法。 类对其进行深度分析的数理方法。
处理时间序列数据的一般原则
1.一以贯之的指标体系 一以贯之的指标体系 2.时间单位的一致 时间单位的一致 3.计量单位一致 计量单位一致 4.数据取得过程一致 数据取得过程一致 5.研究对象基本一致(若做对比研究,也 研究对象基本一致( 研究对象基本一致 若做对比研究, 须将不同研究对象的数据分列。) 须将不同研究对象的数据分列。)
ti
2
yi *ti 49 25 9 1 1 9 25 49 168 -28546 -24900 -16017 -5828 7119 24630 51690 91504 99652
求回归方程
a= ∑yi /n=58964/8=7370.5 b= ∑tiyi /∑ti2 =99652/168=593.5 ∑ 所得回归方程为: 所得回归方程为: Y=73750.5+593.2t
建模的基本步骤
用观测、调查、抽样、 用观测、调查、抽样、统计等法取得被 观测系统时间序列动态数据。 观测系统时间序列动态数据。 做动态数据相关图,进行相关分析。 做动态数据相关图,进行相关分析。 选择合适的模型进行拟合。 选择合适的模型进行拟合。 倾向变动选用倾向线拟合或逐步修匀法。 倾向变动选用倾向线拟合或逐步修匀法。 平稳序列可选用通用ARMA(自回归平 平稳序列可选用通用 ( 滑模型)。 滑模型)。
时间序列分析(Time Serials 时间序列分析( Analysis)
传道书1:9
已有的事,后必再有。 已有的事,后必再有。 已行的事,后必再行。 已行的事,后必再行。 日光之下,并无新事。 日光之下,并无新事。 马克思哲学: 马克思哲学: 螺旋式上升,波浪式前进。 螺旋式上升,波浪式前进。
中华民族的格言
修正指数曲线法
适用于描述事物迅速发展进入平台期。 适用于描述事物迅速发展进入平台期。是一个 消化技术投入、资金投入, 消化技术投入、资金投入,开始积蓄下一次发 展力量的时期。 展力量的时期。 相反态势也可用此法。 相反态势也可用此法。 公式:有三个参数需要计算。 公式:有三个参数需要计算。
Y = k + ab Y趋于k。
bt
龚珀兹曲线和逻辑曲线 龚珀兹曲线
= k ab xt
t
ln xt = ln k + b ln a ' ' ' = ln xt , k = ln k , a = ln a 令:xt xt
'
t
=k +ab 1
'
'
t
修正指数曲线
逻辑曲线的另外一种形式(数据处理用) 逻辑曲线的另外一种形式 数据处理用) 数据处理用
指数曲线法
一次指数曲线法 适应范围:事物发展初期迅猛发展态势。 适应范围:事物发展初期迅猛发展态势。
指数函数方程有两种形式: 指数函数方程有两种形式:
y
ˆ y = ae
bx
ˆ y = ab
x
a>0,b>0
a>0,b<0
x
图11.1方程 y = ae bx 的图象 11.1方程 ˆ
二次指数曲线法
技术发展初期或者经济现象。 技术发展初期或者经济现象。 特点: 特点:都容易受到某些因素或强力调控 的影响。比如风险投资的介入、加税等。 的影响。比如风险投资的介入、加税等。 t*ct2 公式: 公式:y=a*b 处理:取对数,转化为二次曲线拟合。 处理:取对数,转化为二次曲线拟合。
四种基本变动倾向和分解模型
四种变动倾向:趋势( 四种变动倾向:趋势(trend variation)、周期变动 、 )、季节变动 (cyclical variation)、季节变动(seasonal )、季节变动( variation)、不规则 随机变动(irregular/random )、不规则 随机变动( )、不规则/随机变动 variation)。与之对应的是平稳序列(Stationary )。与之对应的是平稳序列 )。与之对应的是平稳序列( serials)。 )。 分解模型: 分解模型: Yt=T*S*C*I Yt=T+S+C+I Yt=T*S+C*I 回归模型
逐步修匀法
移动平均法(一次、二次、 移动平均法(一次、二次、三次移动平 均) 指数平滑法(一次指数平滑、 指数平滑法(一次指数平滑、二次指数 平滑和三次指数平滑) 平滑和三次指数平滑)
实例
江苏省专利申请量 专利申请量yi 专利申请量yi 年份 专利申请量 yi 年份 专利申请量 yi 1985 688 1994 4007 1986 1063 1995 4078 1987 1577 1996 4980 1988 1955 1997 5339 1989 1994 1998 5828 1990 2706 1999 7119 1991 3547 2000 8210 1992 4218 2001 10338 1993 4170 2002 13072
k y= − bx 1 + ae
Βιβλιοθήκη Baidu
(a、b、k均>0)
逻辑(皮尔)曲线
其一般形式为: 其一般形式为:
L Yt = − bt 1 + ae
其中,L为变量Yt的极限值, a,b为常数,t为时间变量
龚珀兹曲线
龚珀兹曲线可以描述一种新产品从试制期到
饱和期产量的增长趋势。 饱和期产量的增长趋势。
Yt = ka (0 < a < 1, 0 < b < 1)
历史事件的背后是什么? 历史事件的背后是什么?
回忆一段初中力学知识 速度观念的产生和力的均衡 社会事件的加速度现象: 社会事件的加速度现象:疯狂的指数增长与 末路狂奔。 末路狂奔。 经济周期分析重在经济发展的推动力和阻力 分析。 分析。 为什么不用多变量分析模型来分析时间序列 数据? 数据?
时间序列分析的回顾
江苏省专利申请量 14000 12000 10000 8000 6000 4000 2000 0 1985
专利量
系列1
1988
1991
1994 年份
1997
2000
2003
一次曲线拟合(线性回归) 一次曲线拟合(线性回归)
Y=a+bt(或者y=a+bx) (或者 ) 根据最小二乘法求得 b=(∑tiyi-∑ti∑yi/n)/(∑ti2-∑ti∑ti/n) ∑ ∑ a=(∑yi ∑ti2 - ∑tiyi ∑ti)/(n ∑ti2 - ∑ti∑ti ) 对时间轴的处理: 对时间轴的处理: 刻度化,并设法使∑ 刻度化,并设法使∑ti =0,则有 , a= ∑yi /n; b= ∑tiyi /∑ti2 ∑
xt = k + a
b
'
t
令:xt =
1
xt
xt = k + a b
'
t
修正指数曲线
两种生长曲线的图形特点
请同学们将它们画出来。 请同学们将它们画出来。 曲线特点: 值线 拐点位置和拐点时刻。 值线、 曲线特点:K值线、拐点位置和拐点时刻。 逻辑曲线:拐点时刻和位置( 逻辑曲线:拐点时刻和位置(lna/b,k/2) , ) 龚珀兹曲线: 龚珀兹曲线:拐点时刻和位置 (-ln(-lna/b)/lnb,k/e) , )
Excel中处理数据
表头
年份
时间 ti 专利申请量yi yi 专利申请量yi
2
ti
2
tiyi
ti yi
2
ti
4
理论yi 残差平方和
回归系数计算中要求和的项目: 回归系数计算中要求和的项目: ∑yi 、 ∑ti4 、∑ti2 、 ∑ ti2 yi 、 ∑tiyi 求不一致系数要求的和:残差平方和、 求不一致系数要求的和:残差平方和、 ∑yi2
2 2
=sqrt(6032271.52/499736678)=0.11
二次曲线
又称抛物线拟合法。 又称抛物线拟合法。在时间序列散点图多数倾 向于二次多项式曲线时, 向于二次多项式曲线时,可以用二次多项式去 描述它。其一般表达式为: 描述它。其一般表达式为: y=a+bt+ct2 当设置时间刻度使∑ 当设置时间刻度使∑ti =0,则有回归系数 , a={∑yi ∑ti4 - ∑ti2 ∑ ti2 yi }/ { n ∑ti4 – (∑ti2)2 } ∑ b= ∑tiyi / ∑ti2 b= {n ∑ ti2 yi - ∑yi ∑ ti2 }/ { n ∑ti4 – (∑ti2)2 } ∑
S3 − S 2 b = S 2 − S1
n
S 2 − S1 1 k = ( S1 − n ) n b −1
b −1 a = ( S 2 − S1 ) n 2 (b − 1)
生长曲线拟合
计算不一致系数u
yi 估计值 yi 估计值) ( yi -yi 估计值 ) 3218.1 739428.01 16630084 4404.5 331200.25 24800400 5590.9 63453.61 28504921 6777.3 901170.49 33965584 7963.7 713518.09 50680161 9150.1 883788.01 67404100 10336.5 2.25 106874244 11522.9 2399710.81 170877184 499736678 6032271.52 U=sqrt(∑ (yi-yi估计值)2)/ ∑yi 2 ) 估计值) 估计值
倾向线拟合
又称曲线拟合。包括一下方法: 又称曲线拟合。包括一下方法: 直线拟合 多项式拟合(包括二次、三次曲线等) 多项式拟合(包括二次、三次曲线等) 指数曲线(指数曲线、修正指数曲线等) 指数曲线(指数曲线、修正指数曲线等) 生长曲线(逻辑曲线、龚珀兹曲线、 生长曲线(逻辑曲线、龚珀兹曲线、饱 和指数曲线) 和指数曲线) 包络曲线
以史为鉴,可以正衣冠。 以史为鉴,可以正衣冠。 以往不可追,来者犹可待。 以往不可追,来者犹可待。 吴子曰:以见占隐。 吴子曰:以见占隐。 佛家:跳出三界外, 佛家:跳出三界外,不在五行中
历史资料不仅仅是一段记忆
劝君少骂秦始皇,焚坑事件要商量。 劝君少骂秦始皇 焚坑事件要商量。 焚坑事件要商量 祖龙魂死业犹在,孔学名高实秕糠 孔学名高实秕糠。 祖龙魂死业犹在 孔学名高实秕糠。 百代都行秦政法,十批不是好文章 十批不是好文章。 百代都行秦政法 十批不是好文章。 佛教说法,任何事情都是因缘聚散的结果。 佛教说法,任何事情都是因缘聚散的结果。 是历史事件就会对历史产生影响。 是历史事件就会对历史产生影响。 正在发生的事件也是历史事件。 正在发生的事件也是历史事件。
江苏省专利申请量 专利申请量yi 年份 时间 ti 专利申请量 yi 1995 -7 4078 1996 -5 4980 1997 -3 5339 1998 -1 5828 1999 1 7119 2000 3 8210 2001 5 10338 2002 7 13072
时间ti 专利申请量yi 年份 时间 专利申请量 yi 1995 -7 4078 1996 -5 4980 1997 -3 5339 1998 -1 5828 1999 1 7119 2000 3 8210 2001 5 10338 7 2002 13072 58964
t
取a < 0, < b < 1时,随着t的增加, 0
修正指数曲线 t 1 4 3.5 3 2.5 2 1.5 1 0.5 0 2 3 4 5 6 7 8 9 10 11 12 13 14
Y
k k k
k
a>0,b>1
a>0,b<1
a<0,b>1
a<0,b<1
修正指数曲线的几种形态
三和法求K、a、b
首先发现于细菌增殖和细胞分裂过程。 首先发现于细菌增殖和细胞分裂过程。 存在萌芽、发展、成熟(稳定) 存在萌芽、发展、成熟(稳定)三个大致的 态势。 态势。 技术、经济、社会现象都有这种情况出现。 技术、经济、社会现象都有这种情况出现。 常用曲线极其特点:逻辑(皮尔)曲线、 常用曲线极其特点:逻辑(皮尔)曲线、龚 珀兹曲线。 珀兹曲线。 逻辑曲线公式: 逻辑曲线公式:
故纸堆里面的数字 有价值的数字如何进行处理? 有价值的数字如何进行处理? 时间序列法既是对能够反应事物发展变 化的特征数值的一种处理方法, 化的特征数值的一种处理方法,又是一 类对其进行深度分析的数理方法。 类对其进行深度分析的数理方法。
处理时间序列数据的一般原则
1.一以贯之的指标体系 一以贯之的指标体系 2.时间单位的一致 时间单位的一致 3.计量单位一致 计量单位一致 4.数据取得过程一致 数据取得过程一致 5.研究对象基本一致(若做对比研究,也 研究对象基本一致( 研究对象基本一致 若做对比研究, 须将不同研究对象的数据分列。) 须将不同研究对象的数据分列。)
ti
2
yi *ti 49 25 9 1 1 9 25 49 168 -28546 -24900 -16017 -5828 7119 24630 51690 91504 99652
求回归方程
a= ∑yi /n=58964/8=7370.5 b= ∑tiyi /∑ti2 =99652/168=593.5 ∑ 所得回归方程为: 所得回归方程为: Y=73750.5+593.2t
建模的基本步骤
用观测、调查、抽样、 用观测、调查、抽样、统计等法取得被 观测系统时间序列动态数据。 观测系统时间序列动态数据。 做动态数据相关图,进行相关分析。 做动态数据相关图,进行相关分析。 选择合适的模型进行拟合。 选择合适的模型进行拟合。 倾向变动选用倾向线拟合或逐步修匀法。 倾向变动选用倾向线拟合或逐步修匀法。 平稳序列可选用通用ARMA(自回归平 平稳序列可选用通用 ( 滑模型)。 滑模型)。
时间序列分析(Time Serials 时间序列分析( Analysis)
传道书1:9
已有的事,后必再有。 已有的事,后必再有。 已行的事,后必再行。 已行的事,后必再行。 日光之下,并无新事。 日光之下,并无新事。 马克思哲学: 马克思哲学: 螺旋式上升,波浪式前进。 螺旋式上升,波浪式前进。
中华民族的格言
修正指数曲线法
适用于描述事物迅速发展进入平台期。 适用于描述事物迅速发展进入平台期。是一个 消化技术投入、资金投入, 消化技术投入、资金投入,开始积蓄下一次发 展力量的时期。 展力量的时期。 相反态势也可用此法。 相反态势也可用此法。 公式:有三个参数需要计算。 公式:有三个参数需要计算。
Y = k + ab Y趋于k。
bt
龚珀兹曲线和逻辑曲线 龚珀兹曲线
= k ab xt
t
ln xt = ln k + b ln a ' ' ' = ln xt , k = ln k , a = ln a 令:xt xt
'
t
=k +ab 1
'
'
t
修正指数曲线
逻辑曲线的另外一种形式(数据处理用) 逻辑曲线的另外一种形式 数据处理用) 数据处理用
指数曲线法
一次指数曲线法 适应范围:事物发展初期迅猛发展态势。 适应范围:事物发展初期迅猛发展态势。
指数函数方程有两种形式: 指数函数方程有两种形式:
y
ˆ y = ae
bx
ˆ y = ab
x
a>0,b>0
a>0,b<0
x
图11.1方程 y = ae bx 的图象 11.1方程 ˆ
二次指数曲线法
技术发展初期或者经济现象。 技术发展初期或者经济现象。 特点: 特点:都容易受到某些因素或强力调控 的影响。比如风险投资的介入、加税等。 的影响。比如风险投资的介入、加税等。 t*ct2 公式: 公式:y=a*b 处理:取对数,转化为二次曲线拟合。 处理:取对数,转化为二次曲线拟合。
四种基本变动倾向和分解模型
四种变动倾向:趋势( 四种变动倾向:趋势(trend variation)、周期变动 、 )、季节变动 (cyclical variation)、季节变动(seasonal )、季节变动( variation)、不规则 随机变动(irregular/random )、不规则 随机变动( )、不规则/随机变动 variation)。与之对应的是平稳序列(Stationary )。与之对应的是平稳序列 )。与之对应的是平稳序列( serials)。 )。 分解模型: 分解模型: Yt=T*S*C*I Yt=T+S+C+I Yt=T*S+C*I 回归模型
逐步修匀法
移动平均法(一次、二次、 移动平均法(一次、二次、三次移动平 均) 指数平滑法(一次指数平滑、 指数平滑法(一次指数平滑、二次指数 平滑和三次指数平滑) 平滑和三次指数平滑)
实例
江苏省专利申请量 专利申请量yi 专利申请量yi 年份 专利申请量 yi 年份 专利申请量 yi 1985 688 1994 4007 1986 1063 1995 4078 1987 1577 1996 4980 1988 1955 1997 5339 1989 1994 1998 5828 1990 2706 1999 7119 1991 3547 2000 8210 1992 4218 2001 10338 1993 4170 2002 13072
k y= − bx 1 + ae
Βιβλιοθήκη Baidu
(a、b、k均>0)
逻辑(皮尔)曲线
其一般形式为: 其一般形式为:
L Yt = − bt 1 + ae
其中,L为变量Yt的极限值, a,b为常数,t为时间变量
龚珀兹曲线
龚珀兹曲线可以描述一种新产品从试制期到
饱和期产量的增长趋势。 饱和期产量的增长趋势。
Yt = ka (0 < a < 1, 0 < b < 1)
历史事件的背后是什么? 历史事件的背后是什么?
回忆一段初中力学知识 速度观念的产生和力的均衡 社会事件的加速度现象: 社会事件的加速度现象:疯狂的指数增长与 末路狂奔。 末路狂奔。 经济周期分析重在经济发展的推动力和阻力 分析。 分析。 为什么不用多变量分析模型来分析时间序列 数据? 数据?
时间序列分析的回顾
江苏省专利申请量 14000 12000 10000 8000 6000 4000 2000 0 1985
专利量
系列1
1988
1991
1994 年份
1997
2000
2003
一次曲线拟合(线性回归) 一次曲线拟合(线性回归)
Y=a+bt(或者y=a+bx) (或者 ) 根据最小二乘法求得 b=(∑tiyi-∑ti∑yi/n)/(∑ti2-∑ti∑ti/n) ∑ ∑ a=(∑yi ∑ti2 - ∑tiyi ∑ti)/(n ∑ti2 - ∑ti∑ti ) 对时间轴的处理: 对时间轴的处理: 刻度化,并设法使∑ 刻度化,并设法使∑ti =0,则有 , a= ∑yi /n; b= ∑tiyi /∑ti2 ∑
xt = k + a
b
'
t
令:xt =
1
xt
xt = k + a b
'
t
修正指数曲线
两种生长曲线的图形特点
请同学们将它们画出来。 请同学们将它们画出来。 曲线特点: 值线 拐点位置和拐点时刻。 值线、 曲线特点:K值线、拐点位置和拐点时刻。 逻辑曲线:拐点时刻和位置( 逻辑曲线:拐点时刻和位置(lna/b,k/2) , ) 龚珀兹曲线: 龚珀兹曲线:拐点时刻和位置 (-ln(-lna/b)/lnb,k/e) , )
Excel中处理数据
表头
年份
时间 ti 专利申请量yi yi 专利申请量yi
2
ti
2
tiyi
ti yi
2
ti
4
理论yi 残差平方和
回归系数计算中要求和的项目: 回归系数计算中要求和的项目: ∑yi 、 ∑ti4 、∑ti2 、 ∑ ti2 yi 、 ∑tiyi 求不一致系数要求的和:残差平方和、 求不一致系数要求的和:残差平方和、 ∑yi2
2 2
=sqrt(6032271.52/499736678)=0.11
二次曲线
又称抛物线拟合法。 又称抛物线拟合法。在时间序列散点图多数倾 向于二次多项式曲线时, 向于二次多项式曲线时,可以用二次多项式去 描述它。其一般表达式为: 描述它。其一般表达式为: y=a+bt+ct2 当设置时间刻度使∑ 当设置时间刻度使∑ti =0,则有回归系数 , a={∑yi ∑ti4 - ∑ti2 ∑ ti2 yi }/ { n ∑ti4 – (∑ti2)2 } ∑ b= ∑tiyi / ∑ti2 b= {n ∑ ti2 yi - ∑yi ∑ ti2 }/ { n ∑ti4 – (∑ti2)2 } ∑