3.《金融时间序列分析》实验课件-郭文旌

合集下载

2020版金融计量学:时间序列分析视角(第三版)教学课件第3章第2节

2020版金融计量学:时间序列分析视角(第三版)教学课件第3章第2节

一个非常有用的性质:
(1 L)1 (1 L 2L2 ), 假定 1
对于二阶差分方程
yt = c 1 yt -1 2 yt -2 t
其中,c表示常数项。利用滞后算子,模
型可以写成:
(1 1L 2L2)yt c t
在等式两边同除以 (1 1L 2L2),则得到:
运用以上介绍的滞后算子运算规律,
可以将二阶差分方程写成:
yt (1L 2L2)yt t

(1 1L 2L2 ) yt t
这里(L) (1
后算子多项式。
1L
2L2) 常被称为滞
因此,差分方程也可以写成:
(L) yt t
初次学习滞后算子,可以把滞后 算子与经济学中常用的期望联系起来 理解。滞后算子操作符也属于类似的 概念范畴,也就是说,L在这里不仅仅 是一个符号,它代表了一种运算过程。
差分方程的稳定性是指由差分方 程生成的数据的收敛性。这里需要介 绍与差分方程相关的特征方程和逆特 征方程。对于一般的p阶差分方程来说, 其特征方程为:
p 1 p1 2 p2 p 0(3.40)
如果差分方程中的系数均为已知, 则可以求出特征方程(3.40)的根,称 为特征根,而这些特征根的大小决定了 相应的差分方程系统的稳定性。
可以证明,如果特征方程的所有根 (或者根的模)均落在单位圆内,那么 差分方程系统是稳定的。之所以经常使 用“单位圆” 来比照特征根的“大小”, 是因为特征根可能是实数也可能是复数。
图3.4 差分方程的特征根 与单位圆
与特征方程仅有一字之差的逆特征 方程,也经常被许多教材和相关文献使 用,所以这里同样给出逆特征方程的概 念。与p阶差分方程相对应的逆特征方 程表达式为:
Lp yt = yt - p

金融时间序列分析

金融时间序列分析

Lecture Notes of Bus41202(Spring2010)Analysis of Financial Time SeriesRuey S.TsaySimple AR models:(Regression with lagged variables.) Motivating example:The growth rate of U.S.quarterly real GNP from1947to1991.Recall that the model discussed before isr t=0.005+0.35r t−1+0.18r t−2−0.14r t−3+a t,ˆσa=0.01.This is called an AR(3)model because the growth rate r t depends on the growth rates of the past three quarters.How do we specify this model from the data?Is it adequate for the data?What are the implications of the model?These are the questions we shall address in this lecture.Another example:U.S.monthly unemployment rate.AR(1)model:1.Form:r t=φ0+φ1r t−1+a t,whereφ0andφ1are real numbers,which are referred to as“parameters”(to be estimated from the data in an application).For example,r t=0.005+0.2r t−1+a t2.Stationarity:necessary and sufficient condition|φ1|<1.Why?3.Mean:E(r t)=φ01−φ1Timeg n p19501960197019801990−0.02−0.010.000.010.020.030.04U.S. quarterly real GNP growth rate: 1947.II to 1991.IFigure 1:U.S.quarterly growth rate of real GNP:1947-19914.Alternative representation:Let E (r t )=µbe the mean of r t so that µ=φ0/(1−φ1).Equivalently,φ0=µ(1−φ1).Plugging in the model,we have(r t −µ)=φ1(r t −1−µ)+a t .(1)This model also has two parameters (µand φ1).It explicitly uses the mean of the series.It is less commonly used in the literature,but is the model representation used in R.5.Variance:Var(r t )=σ2a 1−φ21.6.Autocorrelations:ρ1=φ1,ρ2=φ21,etc.In general,ρk =φk1and ACF ρk decays exponentially as k increases,Timey19501960197019801990200020104681U.S. monthly unemployment rate 1948.1 to 2010.2Figure 2:U.S.monthly unemployment rate (total civilian,16and older)from January 1948to February 20107.Forecast(minimum squared error):Suppose the forecast origin is n.For simplicity,we shall use the model representation in(1) and write x t=r t−µ.The model then becomes x t=φ1x t−1+a t. Note that forecast of r t is simply the forecast of x t plusµ.(a)1-step ahead forecast at time n:ˆx n(1)=φ1x n(b)1-step ahead forecast error:e n(1)=x n+1−ˆx n(1)=a n+1Thus,a n+1is the un-predictable part of x n+1.It is the shock at time n+1!(c)Variance of1-step ahead forecast error:Var[e n(1)]=Var(a n+1)=σ2a.(d)2-step ahead forecast:ˆx n(2)=φ1ˆx n(1)=φ21x n.(e)2-step ahead forecast error:e n(2)=x n+2−ˆx n(2)=a n+2+φ1a n+1(f)Variance of2-step ahead forecast error:Var[e n(2)]=(1+φ21)σ2awhich is greater than or equal to Var[e n(1)],implying that uncertainty in forecasts increases as the number of steps in-creases.(g)Behavior of multi-step ahead forecasts.In general,for the-step ahead forecast at n,we haveˆx n( )=φ 1x n,the forecast errore n( )=a n+ +φ1a n+ −1+···+φ −11a n+1,and the variance of forecast errorVar[e n( )]=(1+φ21+···+φ2( −1)1)σ2a.In particular,as →∞,ˆx n( )→0,i.e.,ˆr n( )→µ.This is called the mean-reversion of the AR(1)process.The variance of forecast error approachesVar[e n( )]=11−φ21σ2a=Var(r t).In practice,it means that for the long-term forecasts serialdependence is not important.The forecast is just the samplemean and the uncertainty is simply the uncertainty about theseries.8.A compact form:(1−φ1B)r t=φ0+a t.Half-life:A common way to quantify the speed of mean reversion is the half-life,which is defined as the number of periods needed sothat the magnitude of the forecast becomes half of that of the forecast origin.For an AR(1)model,this meanx n (k )=12x n .Thus,φk 1x n =12x n .Consequently,the half-life of the AR(1)modelis k =ln(0.5)ln(|φ1|).For example,if φ1=0.5,the k =1.If φ1=0.9,thenk ≈6.58.AR(2)model:1.Form:r t =φ0+φ1r t −1+φ2r t −2+a t ,or(1−φ1B −φ2B 2)r t =φ0+a t .2.Stationarity condition:(factor of polynomial)3.Characteristic equation:(1−φ1x −φ2x 2)=04.Mean:E (r t )=φ01−φ1−φ25.ACF:ρ0=1,ρ1=φ11−φ2,ρ =φ1ρ −1+φ2ρ −1,≥2.6.Stochastic business cycle:if φ21+4φ2<0,then r t shows char-acteristics of business cycles with average lengthk =2πcos −1[φ1/(2√−φ2)],where the cosine inverse is stated in radian.If we denote thesolutions of the polynomial as a ±bi ,where i =√−1,then wehaveφ1=2a andφ2=−(a2+b2)so thatk=2πcos−1(a/√a2+b2).In R or S-Plus,one can obtain √a2+b2using the commandMod.7.Forecasts:Similar to AR(1)modelsSimulation in R:Use the command arima.sim1.y1=arima.sim(model=list(ar=c(1.3,-.4)),1000)2.y2=arima.sim(model=list(ar=c(.8,-.7)),1000) Check the ACF and PACF of the above two simulated series. Building an AR model•Order specification1.Partial ACF:(naive,but effective)–Use consecutivefittings–See Text(p.40)for details–Key feature:PACF cuts offat lag p for an AR(p)model.–Illustration:See the PACF of the U.S.quarterly growthrate of GNP.2.Akaike information criterionAIC( )=ln(˜σ2 )+2 T ,for an AR( )model,where˜σ2 is the MLE of residual vari-ance.Find the AR order with minimum AIC for ∈[0,···,P].3.BIC criterion:BIC( )=ln(˜σ2 )+ ln(T) T.•Needs a constant term?Check the sample mean.•Estimation:least squares method or maximum likelihood method •Model checking:1.Residual:obs minus thefit,i.e.1-step ahead forecast errorsat each time point.2.Residual should be close to white noise if the model is ade-e Ljung-Box statistics of residuals,but degrees offreedom is m−g,where g is the number of AR coefficientsused in the model.Example:Analysis of U.S.GNP growth rate series.R demonstration:>setwd("C:/Users/rst/teaching/bs41202/sp2010")>library(fBasics)>da=read.table("dgnp82.dat")>x=da[,1]>par(mfcol=c(2,2))%put4plots on a page>plot(x,type=’l’)%first plot>plot(x[1:175],x[2:176])%2nd plot>plot(x[1:174],x[3:176])%3rd plot>acf(x,lag=12)%4th plot>pacf(x,lag.max=12)%Compute PACF(not shown in this handout)>Box.test(x,lag=10,type=’Ljung’)%Compute Q(10)statistics Box-Ljung testdata:xX-squared=43.2345,df=10,p-value=4.515e-06>m1=ar(x,method=’mle’)%Automatic AR fitting using AIC criterion. >m1Call:ar(x=x,method="mle")Coefficients:123%An AR(3)is specified.0.34800.1793-0.1423Order selected3sigma^2estimated as9.427e-05>names(m1)[1]"order""ar""var.pred""x.mean""aic" [6]"ed""order.max""partialacf""resid""method"[11]"series""frequency""call""asy.var.coef">plot(m1$resid,type=’l’)%Plot residuals of the fitted model(not shown) >Box.test(m1$resid,lag=10,type=’Ljung’)%Model checkingBox-Ljung testdata:m1$residX-squared=7.0808,df=10,p-value=0.7178>m2=arima(x,order=c(3,0,0))%Another approach with order given.>m2Call:arima(x=x,order=c(3,0,0))Coefficients:ar1ar2ar3intercept%Fitted model is0.34800.1793-0.14230.0077%y(t)=0.348y(t-1)+0.179y(t-2) s.e.0.07450.07780.07450.0012%-0.142y(t-3)+a(t),%where y(t)=x(t)-0.0077sigma^2estimated as9.427e-05:log likelihood=565.84,aic=-1121.68 >names(m2)[1]"coef""sigma2""var.coef""mask""loglik""aic" [7]"arma""residuals""call""series""code""n.cond"[13]"model">Box.test(m2$residuals,lag=10,type=’Ljung’)Box-Ljung testdata:m2$residualsX-squared=7.0169,df=10,p-value=0.7239>plot(m2$residuals,type=’l’)%Residual plot>tsdiag(m2)%obtain3plots of model checking(not shown in handout).>>p1=c(1,-m2$coef[1:3])%Further analysis of the fitted model.>roots=polyroot(p1)>roots[1] 1.590253+1.063882e+00i-1.920152-3.530887e-17i 1.590253-1.063882e+00i>Mod(roots)[1]1.9133081.9201521.913308>k=2*pi/acos(1.590253/1.913308)>k[1]10.65638>predict(m2,8)%Prediction1-step to8-step ahead.$predTime Series:Start=177End=184Frequency=1[1]0.0012362540.0045555190.0074549060.007958518[5]0.0081814420.0079368450.0078200460.007703826$seTime Series:Start=177End=184Frequency=1[1]0.0097093220.010*******.010*******.010688994[5]0.010*******.010*******.010*******.010696190Another example:Monthly U.S.unemployment rate from Jan-uary1948to February2010.Demonstration:in class,including the R scripts fore,foreplot, and backtest.>source(‘‘fore.R’’)>source(‘‘foreplot.R’’)>source(‘‘backtest.R’’)>x=read.table("m-unrate.txt",header=T)>dim(x)[1]7464>head(x)Mon Day Year VALUE1111948 3.42211948 3.83311948 4.04411948 3.95511948 3.56611948 3.6>y=x$VALUE>plot(y)>y1=ts(y,frequency=12,start=c(1948,1))>plot(y1)>acf(diff(y))>m1=ar(diff(y),method=’mle’)>m1Call:ar(x=diff(y),method="mle")Coefficients:123456780.01000.22540.15910.10000.1274-0.0034-0.03220.008191011120.0015-0.10540.0223-0.1208Order selected12sigma^2estimated as0.03849>length(y)[1]746>t.test(diff(y))One Sample t-testdata:diff(y)t=1.0673,df=744,p-value=0.2862alternative hypothesis:true mean is not equal to095percent confidence interval:-0.0070982570.024011008sample estimates:mean of x0.008456376>m1=arima(y,order=c(12,1,0))>m1Call:arima(x=y,order=c(12,1,0))Coefficients:ar1ar2ar3ar4ar5ar6ar7ar8ar90.01050.22590.15940.10040.1276-0.0032-0.03210.00840.0018 s.e.0.03650.03660.03730.03790.03810.03840.03840.03830.0381ar10ar11ar12-0.10510.0226-0.1206s.e.0.03760.03690.0369sigma^2estimated as0.03851:log likelihood=155.65,aic=-285.29>tsdiag(m1,gof=24)>m2=arima(y,order=c(2,1,1),seasonal=list(order=c(1,0,1),period=12))>m2Call:arima(x=y,order=c(2,1,1),seasonal=list(order=c(1,0,1),period=12)) Coefficients:ar1ar2ma1sar1sma10.57930.2467-0.58070.5624-0.8199s.e.0.06220.03950.05750.07330.0536sigma^2estimated as0.03715:log likelihood=167.76,aic=-323.53>tsdiag(m2,gof=24)>p2=fore(m2,y,740,6)Time Series:Start=741End=746Frequency=1[1]9.7831779.8410139.8648439.7974719.8199089.802541Time Series:Start=741End=746Frequency=1[1]0.19288600.27282860.36345510.45141650.53947100.6263706>foreplot(p2,y,740,720)>p1=fore(m1,y,740,6)Time Series:Start=741End=746Frequency=1[1]9.7354539.7550069.7512179.6593909.6393419.545857Time Series:Start=741End=746Frequency=1[1]0.19637340.27921720.36979860.46142790.55377860.6530188>foreplot(p1,y,740,720)>>backtest(m1,y,740,1)[1]"RMSE of out-of-sample forecasts"[1]0.181902>backtest(m2,y,740,1)[1]"RMSE of out-of-sample forecasts"[1]0.1752202>backtest(m1,y,720,1)[1]"RMSE of out-of-sample forecasts"[1]0.2149663>backtest(m2,y,720,1)[1]"RMSE of out-of-sample forecasts"[1]0.2048295Moving-average(MA)modelModel withfinite memory!Some daily stock returns have minor serial correlations and can be modeled as MA or AR models.MA(1)model•Form:r t=µ+a t−θa t−1•Stationarity:always stationary.•Mean(or expectation):E(r t)=µ•Variance:Var(r t)=(1+θ2)σ2a.•Autocovariance:g1:Cov(r t,r t−1)=−θσ2ag :Cov(r t,r t− )=0for >1.Thus,r t is not related to r t−2,r t−3,···.•ACF:ρ1=−θ,ρ =0for >1.1+θ2Finite memory!MA(1)models do not remember what happen two time periods ago.•Forecast(at origin t=n):1.1-step ahead:ˆr n(1)=µ−θa n.Why?Because at time n,a n is known,but a n+1is not.2.1-step ahead forecast error:e n(1)=a n+1with varianceσ2a.3.Multi-step ahead:ˆr n( )=µfor >1.Thus,for an MA(1)model,the multi-step ahead forecasts are just the mean of the series.Why?Because the model has memory of1time period.4.Multi-step ahead forecast error:e n( )=a n+ −θa n+ −15.Variance of multi-step ahead forecast error:(1+θ2)σ2a=variance of r t.•Invertibility:–Concept:r t is a proper linear combination of a t and the past observations{r t−1,r t−2,···}.–Why is it important?It provides a simple way to obtain the shock a t.For an invertible model,the dependence of r t on r t− con-verges to zero as increases.–Condition:|θ|<1.–Invertibility of MA models is the dual property of stationarityfor AR models.MA(2)model•Form:r t=µ+a t−θ1a t−1−θ2a t−2.orr t=µ+(1−θ1B−θ2B2)a t.•Stationary with E(r t)=µ.•Variance:Var(r t)=(1+θ21+θ22)σ2a.•ACF:ρ2=0,butρ =0for >2.•Forecasts go the the mean after2periods.Building an MA model•Specification:Use sample ACFSample ACFs are all small after lag q for an MA(q)series.(See test of ACF.)•Constant term?Check the sample mean.•Estimation:use maximum likelihood method–Conditional:Assume a t=0for t≤0–Exact:Treat a t with t≤0as parameters,estimate them toobtain the likelihood function.Exact method is preferred,but it is more computing intensive.•Model checking:examine residuals(to be white noise)•Forecast:use the residuals as{a t}(which can be obtained from the data andfitted parameters)to perform forecasts.Model form in R:R parameterizes the MA(q)model asr t=µ+a t+θ1a t−1+···+θq a t−q,instead of the usual minus sign inθ.Consequently,care needs to be exercised in writing down afitted MA parameter in R.For instance, an estimateˆθ1=−0.5of an MA(1)in R indicates the model is r t=a t−0.5a t−1.Example:Daily log return of the value-weighted indexR demonstration>setwd("C:/Users/rst/teaching/bs41202/sp2010")>library(fBasics)>da=read.table("d-ibmvwew6202.txt")>dim(da)[1]101944>vw=log(1+da[,3])*100%Compute percentage log returns of the vw index.>acf(vw,lag.max=10)%ACF plot is not shon in this handout.>m1=arima(vw,order=c(0,0,1))%fits an MA(1)model>m1Call:arima(x=vw,order=c(0,0,1))Coefficients:ma1intercept0.14650.0396%The model is vw(t)=0.0396+a(t)+0.1465a(t-1).s.e.0.00990.0100sigma^2estimated as0.7785:log likelihood=-13188.48,aic=26382.96>tsdiag(m1)>predict(m1,5)$predTime Series:Start=10195End=10199Frequency=1[1]0.050362980.039608870.039608870.039608870.03960887$seTime Series:Start=10195End=10199Frequency=1[1]0.88232900.89175230.89175230.89175230.8917523Mixed ARMA model:A compact form forflexible models. Focus on the ARMA(1,1)model for1.simplicityeful for understanding GARCH models in Ch.3for volatilitymodeling.ARMA(1,1)model•Form:(1−φ1B)r t=φ0+(1−θB)a t orr t=φ1r t−1+φ0+a t−θ1a t−1.A combination of an AR(1)on the LHS and an MA(1)on theRHS.•Stationarity:same as AR(1)•Invertibility:same as MA(1)•Mean:as AR(1),i.e.E(r t)=φ01−φ1•Variance:given in the text•ACF:Satisfiesρk=φ1ρk−1for k>1,butρ1=φ1−[θ1σ2a/Var(r t)]=φ1.This is the difference between AR(1)and ARMA(1,1)models.•PACF:does not cut offatfinite lags.Building an ARMA(1,1)model•Specification:use EACF or AIC•What is EACF?How to use it?[See text].•Estimation:cond.or exact likelihood method•Model checking:as before•Forecast:MA(1)affects the1-step ahead forecast.Others are similar to those of AR(1)models.Three model representations:•ARMA form:compact,useful in estimation and forecasting•AR representation:(by long division)r t=φ0+a t+π1r t−1+π2r t−2+···It tells how r t depends on its past values.•MA representation:(by long division)r t=µ+a t+ψ1a t−1+ψ2a t−2+···It tells how r t depends on the past shocks.For a stationary series,ψi converges to zero as i→∞.Thus,the effect of any shock is transitory.The MA representation is particularly useful in computing variances of forecast errors.For a -step ahead forecast,the forecast error ise n( )=a n+ +ψ1a n+ −1+···+ψ −1a n+1.The variance of forecast error isVar[e n( )]=(1+ψ21+···+ψ2 −1)σ2a.Unit-root NonstationarityRandom walk•Form p t=p t−1+a t•Unit root?It is an AR(1)model with coefficientφ1=1.•Nonstationary:Why?Because the variance of r t diverges to infinity as t increases.•Strong memory:sample ACF approaches1for anyfinite lag.•Repeated substitution showsp t=∞i=0a t−i=∞i=0ψi a t−iwhereψi=1for all i.Thus,ψi does not converge to zero.The effect of any shock is permanent.Random walk with drift•Form:p t=µ+p t−1+a t,µ=0.•Has a unit root•Nonstationary•Strong memory•Has a time trend with slopeµ.Why?differencing•1st difference:r t=p t−p t−1If p t is the log price,then the1st difference is simply the log return.Typically,1st difference means the“change”or“incre-ment”of the original series.•Seasonal difference:y t=p t−p t−s,where s is the periodicity,e.g.s=4for quarterly series and s=12for monthly series.If p t denotes quarterly earnings,then y t is the change in earning from the same quarter one year before.Meaning of the constant term in a model•MA model:mean•AR model:related to mean•1st differenced:time slope,etc.Practical implication infinancial time seriesExample:Monthly log returns of General Electrics(GE)from1926 to1999(74years)Sample mean:1.04%,std(ˆµ)=0.26Very significant!is about12.45%a year$1investment in the beginning of1926is worth•annual compounded payment:$5907•quarterly compounded payment:$8720•monthly compounded payment:$9570•Continuously compounded?Unit-root testLet p t be the log price of an asset.To test that p t is not predictable (i.e.has a unit root),two models are commonly employed:p t=φ1p t−1+e tp t=φ0+φ1p t−1+e t.The hypothesis of interest is H o:φ1=1vs H a:φ1<1.Dickey-Fuller test is the usual t-ratio of the OLS estimate ofφ1being 1.This is the DF unit-root test.The t-ratio,however,has a non-standard limiting distribution.Let∆p t=p t−p t−1.Then,the augmented DF unit-root test for an AR(p)model is based on∆p t=c t+βp t−1+p−1i=1φi∆p t−i+e t.The t-ratio of the OLS estimate ofβis the ADF unit-root test statis-tic.Again,the statistic has a non-standard limiting distribution. Example:Consider the log series of U.S.quaterly real GDP se-ries from1947.I to2009.IV.(data from Federal Reserve Bank of St. Louis).See q-gdpc96.txt on the course web.R demonstration>library(fUnitRoots)>help(UnitrootTests)%See the tests available>da=read.table(‘‘q-gdpc96.txt’’,header=T)>gdp=log(da[,4])>adfTest(gdp,lag=4,type=c("c"))#Assume an AR(4)model for the series.Title:Augmented Dickey-Fuller TestTest Results:PARAMETER:Lag Order:4STATISTIC:Dickey-Fuller:-1.7433P VALUE:0.4076#cannot reject the null hypothesis of a unit root.***A more careful analysis>x=diff(gdp)>ord=ar(x)#identify an AR model for the differenced series.>ordCall:ar(x=x)Coefficients:1230.34290.1238-0.1226Order selected3sigma^2estimated as8.522e-05>#An AR(3)for the differenced data is confirmed.#Our previous analysis is justified.Discussion:The command arima on R.1.dealing with the constant term.If there is any differencing,noconstant is used.2.fixing some e subcommand fixed in arima.S-Plus demonstration>da=read.table("q-gdp05.txt")>dim(da)[1]2364>plot(da[,4],type=’l’)>module(finmetrics)>gdp=log(da[,4])>plot(gdp,type=’l’)>x=diff(gdp)%take the first difference>ord=ar(x)>ord$order:[1]4>adf=unitroot(gdp,trend=’c’,lags=5,method=’adf’)>adfTest for Unit Root:Augmented DF TestNull Hypothesis:there is a unit rootType of Test:t-testTest Statistic:-1.12P-value:0.7083Coefficients:lag1lag2lag3lag4lag5constant-0.00120.29540.1358-0.0864-0.11080.0168Degrees of freedom:231total;225residualResidual standard error:0.009283S-Plus demonstration>module(finmetrics)>gnp=scan(file=’dgnp82.dat’)>plot(gnp,type=’l’)>acf(gnp,lag.max=12)Call:acf(x=gnp,lag.max=12)%Plot not shown in the handout. Autocorrelation matrix:lag gnp10 1.0000210.3769320.2539430.012554-0.085965-0.107176-0.057587-0.018298-0.0772109-0.070211100.01041211-0.02301312-0.0967>acf(gnp,lag.max=12,type=’partial’)%Compute PACFCall:acf(x=gnp,lag.max=12,type="partial")Partial Correlation matrix:lag gnp110.3769220.130433-0.142144-0.098855-0.0199660.0325770.012088-0.110699-0.041510100.09811111-0.03701212-0.1533>ord=ar(gnp,order.max=10)%Perform order selection via AIC>ord$aic[1]27.5691310 2.6081086 1.58955500.00000000.2734771 2.2034466[7] 4.0171066 5.9916210 5.82648337.52300257.8223499>ord$order[1]3>m1=arima.mle(gnp,model=list(order=c(3,0,0)))%This fit misses the mean.>summary(m1)Call:arima.mle(x=gnp,model=list(order=c(3,0,0)))Method:Maximum Likelihood with likelihood conditional on3observationsARIMA order:300Value Std.Error t-value%No intercept because the program assumes it is zero. ar(1)0.454200.07597 5.9780ar(2)0.266800.08095 3.2960ar(3)-0.038170.07597-0.5024Variance-Covariance Matrix:ar(1)ar(2)ar(3)ar(1)0.005771926-0.002566306-0.001441892ar(2)-0.0025663060.006552753-0.002566306ar(3)-0.001441892-0.0025663060.005771926Estimated innovations variance:0.0001Optimizer has convergedConvergence Type:relative function convergenceAIC:-1085.0397>x=gnp-mean(gnp)%Remove sample mean.>m1=arima.mle(x,model=list(order=c(3,0,0)))>summary(m1)Call:arima.mle(x=x,model=list(order=c(3,0,0)))Method:Maximum Likelihood with likelihood conditional on3observationsARIMA order:300Value Std.Error t-valuear(1)0.35090.07523 4.664%Fitted model isar(2)0.18090.07863 2.301%x(t)=0.351x(t-1)+0.181x(t-2)-0.144x(t-3)+a(t). ar(3)-0.14430.07523-1.919Variance-Covariance Matrix:ar(1)ar(2)ar(3)ar(1)0.0056599161-0.001877448-0.0007529176ar(2)-0.00187744800.006182526-0.0018774480ar(3)-0.0007529176-0.0018774480.0056599161Estimated innovations variance:0.0001Optimizer has convergedConvergence Type:relative function convergenceAIC:-1104.1574>names(m1)[1]"model""var.coef""method""series""aic"[6]"loglik""sigma2""ed""n.cond""converged"[11]"conv.type""call">names(m1$model)[1]"order""ar""ndiff">m1$model$ar[1]0.35091070.1809056-0.1443412>>arima.diag(m1)%Model checking,plots not shown.>p1=c(1,-m1$model$ar)%Further analysis of the fitted model. >roots=polyroot(p1)>roots[1] 1.582837+1.057071e+000i-1.912355-6.609277e-017i[3] 1.582837-1.057071e+000i>Mod(roots)[1]1.9033591.9123551.903359>k=2*pi/acos(1.582837/1.903359)>k[1]10.67098>>arima.forecast(x,m1$model,8)%prediction$mean:[1]-0.00651901645-0.00317061250-0.000236329850.00028445018 [5]0.000514713150.000266189120.000145465240.00002490612 $std.err:[1]0.0097793140.010*******.010*******.010*******.010785783 [6]0.010*******.010*******.010792592S-Plus demonstration>vw=d6202[,3]%Identify the vw-index returns.>lnvw=log(1+vw)%compute log returns.>acf(lnvw,lag.max=10)%ACF plot i snot shown in this handout. Call:acf(x=lnvw,lag.max=10)Autocorrelation matrix:lag lnvw10 1.0000210.140232-0.012043-0.0027540.0029650.007576-0.014987-0.006698-0.0034109-0.00851110-0.0074>length(lnvw)[1]10194>x1=rep(1,10194)%Create a constant to handle non-zero mean>m1=arima.mle(lnvw,xreg=x1,model=list(order=c(0,0,1)))>summary(m1)Call:arima.mle(x=lnvw,model=list(order=c(0,0,1)),xreg=x1) Method:Maximum Likelihood with likelihood conditional on0observationsARIMA order:001Value Std.Error t-valuema(1)-0.14650000.009797-14.96x10.0003962NA NA%Model is vw=.000396+a(t)+0.1465a(t-1) Variance-Covariance Matrix:ma(1)ma(1)0.00009599039Estimated innovations variance:0.0001Optimizer has convergedConvergence Type:relative function convergenceAIC:-67509.2476>arima.diag(m1)%Plots not shown in this handout.>arima.forecast(lnvw,model=m1$model,6)$mean:[1]0.00015816540.00000000000.00000000000.00000000000.0000000000[6]0.0000000000%Need to add the constant0.000396to the forecast. $std.err:[1]0.0088300560.0089243610.0089243610.0089243610.008924361[6]0.008924361。

金融时间序列

金融时间序列
为了刻画这种相关性,恩格尔提出自回归条件异方差
(ARCH)模型。ARCH的主要思想是时刻 t 的ut 的方差(= t2 )依 赖于时刻(t 1)的残差平方的大小,即依赖于 ut2- 1 。
金融时间序列
• 自ARCH模型始创以来,经历了两次突破。一次是 广义ARCH(Generalized ARCH),也即GARCH模型 的提出。从此以后,几乎所有的ARCH模型新成果 都是在GARCH模型基础上得到的。第二次则是长 记忆在经济学上的研究取得突破,与ARCH模型相 结合所产生的一系列长记忆ARCH的研究从1996年 至今方兴未艾。
金融时间序列
LMSV模型
金融时间序列
其他方法——高频数据的应用
金融时间序列
其他方法
金融时间序列
金融时间序列
金融时间序列
金融时间序列
GARCH模型的峰度
金融时间序列
3rew
演讲完毕,谢谢听讲!
再见,see you again
2024/2/1
金融时间序列
从事于股票价格、通货膨胀率、外汇汇率等金融时间序列预 测的研究工作者,曾发现他们对这些变量的预测能力随时期的不同而 有相当大的变化。预测的误差在某一时期里相对地小,而在某一时期 里则相对地大,然后,在另一时期又是较小的。这种变异很可能由于 金融市场的波动性易受谣言、政局变动、政府货币与财政政策变化等 等的影响。从而说明预测误差的方差中有某种相关性。
金融时间序列
2024/2/1
金融时间序列
自 回 归 条 件 异 方 差 (Autoregressive Conditional Heteroscedasticity Model, ARCH)模型是特别用来建立条件方 差模型并对其进行预测的。

经管类时间序列分析PPT优秀课件

经管类时间序列分析PPT优秀课件
r(t,t)E(ztut)2D (zt) r(s,s)E(zsus)2D (zs)
自相关函数:
(t,s) r(t,s)
r(t,t) r(s,s)
当t,s取遍所有可能的整数时,就形成了时间序 列的自相关函数,它描述了序列的自相关结 构。它的本质等同于相关系数。
第二节 平稳时间序列
一、平稳时间序列 1、穷定的义二:阶时中间心序矩列,{而zt}且是满平足稳:的。如果{zt}有有 (1)ut= Ezt =c; (2)r(t,s) = E[(zt-c)(zs-c)] = r(t-s,0) 则称{zt}是平稳的。
(2)动态数据。
二、时间序列分析
1、 时间序列分析:是一种根据动态数据揭示 系统动态结构和规律的统计方法。其基本思 想:根据系统的有限长度的运行记录(观察 数据),建立能够比较精确地反映序列中所 包含的动态依存关系的数学模型,并借以对 系统的未来进行预报(王振龙)
2、计量经济学中的建模方法和思想
确定性变化分析 时间序列分析
趋势变化分析 周期变化分析 循环变化分析
随机性变化分析 AR、MA、ARMA模型
四、发展历史
1、时间序列分析奠基人:
20世纪40年代分别由Norbort Wiener 和Andrei Kolemogoner 独立给出的,他 们对发展时间序列的参数模型拟和和推 断过程作出了贡献,提供了与此相关的 重要文献,促进了时间序列分析在工程 领域的应用。
使用的分析方法有:移动平均法、指数平滑法、 模型拟和法等;
(2)季节性周期变化 受季节更替等因素影响,序列依一固
定周期规则性的变化,又称商业循环。 采用的方法:季节指数; (3)循环变化
周期不固定的波动变化。
(4)随机性变化

金融时间序列分析—总结

金融时间序列分析—总结

统计学院
整理ppt金融时间序列分析》
3
建模注意要点-2
4、当变量之间存在协整关系时,可以建立ECM进一步考察 短期关系,Eviews这里还提供了一个Wald-Granger检验, 但此时的格兰杰已经不是因果关系检验,而是变量外生性检 验,请注意识别。
5、格兰杰检验只能用于平稳序列!这是格兰杰检验的前提, 而其因果关系并非我们通常理解的因与果的关系,而是说x 的前期变化能有效地解释y的变化,所以称其为“格兰杰原 因”。
第三步,如果变量不仅存在滞后影响,还存在同期影响关系, 则建立VAR模型不太合适,这种情况下需要进行结构分析, 可考虑SVAR模型。
统计学院
整理ppt金融时间序列分性条件,可进行脉冲及
方差分解。注意在做因果检验前要先确定滞后长度,方法见
高铁梅 《计量分析方法与建模 》第2版 P302。
如不满足因果关系,则所有不满足因果关系的变量将视为外
生变量 ,至此要重新构建VAR模型,新的VAR模型将要引
入外生变量的VAR模型(只放在模型右边,不放在左边)
2、当检验的数据是平稳的(即不存在单位根),要想进一 步考察变量的因果联系,可以采用格兰杰因果检验,但要做 格兰杰检验的前提是数据必须是平稳的,否则不能做。(不 是因果关系,看是否有关系,有关系该变量可放入模型)
3、当检验的数据是非平稳(即存在单位根),并且各个序 列是同阶单整(协整检验的前提),想进一步确定变量之间 是否存在协整关系,可以进行协整检验,协整检验主要有 EG两步法和JJ检验:EG两步法是基于回归残差的检验,可 以通过建立OLS模型检验其残差平稳性;JJ检验是基于回归 系数的检验,前提是建立VAR模型(即模型符合ADL模 式)。
如果变量之间不仅存在滞后影响,而且存在同期影响关系, 则适合建立SVAR模型。

金融时间序列分析Matlab时间序列分析课件下载

金融时间序列分析Matlab时间序列分析课件下载

多变量随机数模拟
❖ MU = [1 2;-3 -5]; ❖ SIGMA = cat(3,[2 0;0 .5],[1 0;0 1]); ❖ p = ones(1,2)/2; ❖ obj = gmdistribution(MU,SIGMA,p); ❖ Y = random(obj,1000); ❖ scatter(Y(:,1),Y(:,2),10,'.')
Copulas ▪ Example: Fitting Copulas to Data
回归分析
❖ robustdemo
3.2 计量工具箱 Econometric toolbox
u,v: (0,1)2, C:(0,1) ❖ a model:面向对象(类似于结构变量)
the starting point of the simulation is never forgotten. SIGMA = cat(3,[2 0;0 . >>autocorr(res) Change images to the one you like, then it will apply to all the other slides. >>subplot(2,1,1) You can briefly add outline of this slide page in this text box. >>r = mvnrnd(mu,SIGMA,100); %随机数对 MU = [1 2;-3 -5]; Parameters for copulas fit to data (copulafit) * [1 rho; rho 1] Establish the stationarity of your time series. Difference the data. >>qqplot(res):正态分布对比 specify your own presample data. 递增型:M(u,v) = min(u,v) 数据的随机拟合:单变量 通过一定的转变方法,将各自的分布、及依赖结构分离出来。 >>e = r - mean(r); 相关性可能都需要从实际数据中获取。

金融时间序列分析教材

金融时间序列分析教材

金融时间序列分析教材金融时间序列分析是金融学中的一个重要领域,它旨在研究金融市场中的时间序列数据,并利用统计模型和方法来预测未来的金融市场走势。

本教材将介绍金融时间序列分析的基本概念、理论框架和常用方法,帮助读者掌握这一领域的基本知识和技能。

第一章介绍了金融时间序列的基本概念和特点。

金融时间序列是指金融市场中某一资产价格(如股票价格、外汇汇率等)或指标随时间变化的一组数据。

它具有时间相关性、波动性和非正态性等特点,需要特殊的方法进行分析和预测。

第二章介绍了金融时间序列的统计特征和描述统计方法。

通过观察和分析时间序列的均值、方差、自相关性和偏度等统计特征,可以揭示时间序列数据中存在的规律和趋势,为后续的分析提供基础。

第三章介绍了平稳时间序列的概念和检验方法。

平稳时间序列是指具有固定的均值和方差,并且其自相关性不随时间变化的时间序列。

通过检验时间序列的平稳性,可以为后续的建模和分析提供准确的结果。

第四章介绍了时间序列数据的建模方法。

包括传统的经典时间序列模型(如AR、MA、ARMA模型)和现代时间序列模型(如ARCH、GARCH、VAR模型)等。

这些模型可以根据时间序列的特点和要求来选择和应用,通过建立合适的模型,对金融时间序列进行预测和分析。

第五章介绍了金融时间序列中的异常值和波动性模型。

在金融市场中,时间序列中常常存在异常波动和极端事件,需要采用特殊的模型(如HAR模型、SV模型)来对其进行建模和分析,以更准确地预测金融市场的波动和风险。

第六章介绍了金融时间序列的预测方法和模型评估。

通过利用已有的时间序列数据,可以采用传统的统计方法(如滚动窗口法、指数平滑法)和机器学习方法(如回归模型、神经网络模型)来进行预测,然后通过模型评估来评估预测的准确性和可靠性。

第七章介绍了金融时间序列的因果关系和协整模型。

通过检验时间序列之间的因果关系和建立协整模型,可以揭示金融市场中不同资产之间的相互影响和长期平衡关系,为投资决策和风险管理提供依据。

金融时间序列分析

金融时间序列分析

第1章金融时间序列及其特征金融时间序列分析考虑的是资产价值随时间演变的理论与实践.它是一个带有高度经验性的学科,但也像其他科学领域一样,理论是形成分析推断的基础.然而,金融时间序列分析有一个区别于其他时间序列分析的主要特点:金融理论及其经验的时间序列都包含不确定因素.例如,资产波动率有各种不同的定义,对一个股票收益率序列,波动率是不能直接观察到的.正因为带有不确定性,统计的理论和方法在金融时间序列分析中起重要作用.本书的目的是提供一些金融时间序列的知识,介绍一些对分析金融时间序列有用的统计工具,从而使读者获得各种经济计量方法在金融中应用的经验 .第1章引入资产收益率的基本概念,并简要介绍本书所讨论的一些过程 .第2章回顾了一些线性时间序列分析中的基本概念,如平稳性、自相关函数,引入了一些简单的线性模型来处理序列的序列相关性,并讨论了带时间序列误差、季节性、单位根非平稳性和长记忆过程的回归模型.当存在条件异方差性和序列相关时,该章给出了协方差阵相合估计的方法 .第3章着重讨论了条件异方差性(资产收益率的条件方差)的建模,讨论了新近发展起来的用来描述资产收益率的波动率随时间演变的各种经济计量模型.该章还讨论了波动率建模的其他方法,包括使用高频交易数据和一项资产的日最高价格和日最低价格进行建模 .第4章讨论了金融时间序列中的非线性性,引入了能区别非线性序列与线性序列的检验统计量,并讨论了几个非线性模型.该章还介绍了非参数估计方法和神经网络,并且展示了非线性模型在金融中的各种应用 .第5章考虑的是高频金融数据的分析,市场微观结构的影响及高频金融的应用,阐明了不同步(或不同时)的交易和买卖价格间的跳跃可能带来股票收益的序列相关性.该章还研究了不同交易之间持续时间的动态规律和一些分析交易数据的计量经济模型 .第6章引入了连续时间扩散模型和伊滕(Ito)引理,导出了Black-Scholes期权定价公式,并应用一个简单的跳跃扩散模型来刻画期权市场常见的一些特征 .第7章讨论了极值理论、厚尾分布及其在金融风险管理中的应用.该章还特别讨论了计算金融头寸风险值(VaR)及金融头寸的预期赤字的各种方法 .第8章着重讨论多元时间序列分析和简单的多元模型,重点在于分析时间序列之间的交叉延迟关系.该章还介绍了协整、一些协整检验以及门限协整,并用协整的概念来研究金融市场中的套利机会,包括配对交易 .第9章讨论了简化多元时间序列动态结构的方法和降低维数的方法,并介绍和演示了3种因子模型来分析多个资产的收益率 .第10章介绍了多元波动率模型,其中包括带时变相关系数的模型,同时还讨论了怎样对一个条件协方差阵进行重新参数化,使之满足正定性的限制,并降低波动率建模的复杂性 .第11章介绍了状态空间模型和卡尔曼滤波,还讨论了状态空间模型和本书中所讨论的其他计量经济模型之间的关系.该章还给出了在金融方面应用的几个例子.最后 ,第12章介绍了统计文献中一些新近发展起来的马尔可夫链蒙特卡罗方法,并把这些方法应用于各种金融研究的问题,如随机波动率模型和马尔可夫转换模型的估计.本书着重强调应用和实证分析.每章都有实际例子,很多时候经济计量模型的发展是由金融时间序列的实证特征来推动的.必要时,本书还提供了用来分析数据的计算机程序和命令.在某些案例中,程序已在附录中给出.书中各章的练习题也要用到很多实际数据.1.1资产收益率多数金融研究针对的是资产收益率而不是资产价格. Campbell, Lo和MacKinlay (1997)给出了使用收益率的两个主要理由:第一,对普通的投资者来说,资产收益率完全体现了该资产的投资机会 ,且与其投资规模无关 ;第二 ,收益率序列比价格序列更容易处理,因为前者有更好的统计性质.然而,资产收益率有多种定义.设 P t 是资产在 t 时刻的价格 .下面给出全书中要用到的一些收益率的定义 .暂时假定资产不支付分红. 单期简单收益率若从第 t − 1天到第 t 天 (一个周期)持有某种资产,则简单毛收益率为1+ R t = P t或 P t = P t −1 (1 + R t ) . (1.1)P t −1对应的单期简单净收益率或称简单收益率为P t Pt − P t −1R t = − 1= . (1.2)P t −1 P t −1多期简单收益率若从第 t − k 天到第 t 天这 k 个周期内持有某种资产 ,则 k-期简单毛收益率为P t Pt P t −1 P t −k+11+ R t [k]= = × ×· ··×P t −k P t −1 P t −2 P t −k=(1 + R t )(1 + R t −1) ··· (1 + R t −k+1)k −1= � (1 + R t −j ) .j=0这样, k-期简单毛收益率就是其所包含的这 k 个单期简单毛收益率的乘积 ,称为复合收益率 . k-期简单净收益率是 R t [k]=(P t − P t −k ) /P t −k .1.1资产收益率在实际中 ,确切的时间区间对讨论和比较收益率是非常重要的 (例如是月收益率还是年收益率 ).若时间区间没有给出 ,那么就隐含地假定时间区间为 1年.如果持有资产的期限为 k 年,则 (平均的)年化收益率定义为1/kk −1年化的{R t [k]} = (1+ R t −j ) − 1.j=0⎤⎦⎡⎣这是由它所包含的这 k 个单期简单毛收益率的几何平均得到的 ,可以用下式计算:⎤⎦年化的{R t [k]} = exp k1 k −1ln(1 + R t −j ) − 1,j=0⎡⎣其中 exp(x)表示指数函数, ln(x)是正数 x 的自然对数.因为计算算术平均值比计算几何平均值容易 ,并且单期收益率一般很小 ,我们可以用一阶泰勒 (Taylor)展开来近似年度化的收益率,得到k −1年化的{R t [k]}≈k1 R t −j . (1.3)j=0然而,在有些应用中, (1.3)式近似的精度可能不够.连续复合在引进连续复合收益率之前 ,我们讨论一下复合的效果 .假定银行存款的年利率为 10%,最初存款为 1美元 .如果该银行每年支付一次利息 ,那么 1年之后存款的净值变为 1美元 ×(1 + 0.1) = 1.1美元 .如果该银行半年付息一次 ,6个月的利息率是 10%/2 = 5%,第 1年之后净值是 1美元 × (1 + 0.1/2)2=1.102 5美元 .一般地,如果银行 1年付息 m 次,那么每次支付的利息率为 10%/m,1年后存款的净值变成 1 × (1 + 0.1/m)m美元 .表 1-1给出了年利率为 10%时一些常用的时间间隔下存款 1美元的结果 .特别地 ,净值趋于 1.1052美元 ≈ exp(0.1)美元 ,这个值就是连续复合的结果.于是,我们可以清楚地看到复合的效果.一般地,连续复合的资产净值 A 为A = C exp (r × n) , (1.4)其中 r 是年利率, C 是初始资本, n 是年数①.由 (1.4)式,我们有C = A exp (−r × n) , (1.5)叫作 n 年后价值为 A 的资产的现值 ,这里我们假定连续复合的年利率为 r.1-1复合效果的演示:期限为 1年,年利率为 10%类型支付次数每期的利率净值一年 1 0.1 $1.100 00半年 2 0.05 $1.102 50季度 4 0.025 $1.103 81月 12 0.008 3 $1.104 71周 52 0.1/52 $1.105 06天 365 0.1/365 $1.105 16连续地 ∞ $1.105 17连续复合收益率资产的简单毛收益率的自然对数称为连续复合收益率或对数收益率 (log-return)Pt�r t = ln(1+ R t )=ln = p t − p t −1, (1.6)P t −1其中 p t = ln P t .与简单净收益率 R t 相比 ,连续复合收益率 r t 有一些优点 .首先 ,对多期收益率,我们有r t [k]= ln(1+ R t [k]) = ln[(1+ R t)(1 + R t−1) ···(1 + R t−k+1)] = ln(1+ R t) + ln(1 + R t−1)+ ···+ln(1 + R t−k+1) = r t + r t−1 + ···+ r t−k+1.这样,连续复合多期收益率就是它所包含的连续复合单期收益率之和.其次,对数收益率具有更容易处理的统计性质.资产组合收益率若一个资产组合由N个资产组成,则该资产组合的简单净收益率是它所包含的各个资产的简单净收益率的加权平均,其中每个资产所占的权重是该资产的价值占资产组合总价值的百分比.设p是一个资产组合,它在资产i上的权重为w i,那N么p在t时刻的简单收益率R p,t = w i R it,其中R it是资产i的简单收益率.i=1 然而,资产组合的连续复合收益率没有上述方便的性质.如果简单收益率R itN的绝对值都很小,则我们有r p,t ≈w i r it,其中r p,t是该组合在t时刻的连续复合i=1收益率.这种近似经常被用来研究资产组合的收益率.分红支付如果一个资产周期性地支付分红,我们必须修改资产收益率的定义.设D t是一个资产在第t −1天和第t天之间的分红, P t是该资产在第t个周期末的价格.这样,分红并没有包含在P t中.因此, t时刻简单净收益率和连续复合收益率分别1.1资产收益率变为P t + D tR t = −1,r t = ln(P t + D t) −ln(P t−1).P t−1超额收益率一个资产在t时刻的超额收益率是该资产的收益率与某个参考资产的收益率之差.这个参考资产通常是无风险的,如美国短期国债的收益率.简单超额收益率和对数超额收益率分别定义为Z t = R t −R0t,z t = r t −r0t, (1.7)其中R0t和r0t分别是该参考资产的简单收益率和对数收益率.在金融文献中,超额收益率被认为是某个套利投资组合的赢利.在这个投资组合中,对某资产持多头头寸而对参考资产持空头头寸,且初始投资净值为0.注释多头金融头寸意味着持有某资产.空头头寸则指卖出不属于自己的资产.这需通过从已购买该资产的投资者那里借入资产来完成.在之后的某天,卖空者有义务买进和借入完全相同数量的股份偿还给借出者.因为偿还时要求的是相等数量股份,而不是相等数量的美元,卖空者会由于该资产价格的下跌而获利.如果在空头持续期间该资产有现金分红,则支付给做空买卖的买者.卖空者也必须从自己的资源里配备相应的现金分红来补偿借出者.换句话说,卖空者有义务支出所借资产的现金分红给借出者. �关系小结简单收益率R t与连续复合收益率r t的关系是r t = ln(1+ R t) ,R t =e r t − 1.如果收益率R t与r t是百分比,则�R t �r t = 100ln 1 + ,R t = 100(e r t/100 −1).100收益率的时间累加使得1+ R t [k] = (1+ R t)(1 + R t−1) ···(1 + R t−k+1) ,r t [k]= r t + r t−1 + ···+ r t−k+1.如果连续复合年利率为r,则资产的现值与资产的未来价值之间的关系为A = C exp (r ×n) ,C = A exp (−r ×n) .例 1.1若某项资产的月对数收益率为 4.46%,则相应的月简单收益率为100[exp(4.46/100)−1]=4.56%.同样,若某项资产在一个季度内的月对数收益率分别为 4.46%, −7.34%, 10.77%,则该资产的季度对数收益率为(4.46−7.34+10.77)%=7.89%.1.2收益率的分布性质要研究资产收益率,最好从它们的分布性质开始.目的是要理解不同资产、不同时间收益率的表现.考虑N个资产,持有这N个资产T个时间周期,如t = 1, ···,T .对每个资产i, r it表示它在t时刻的对数收益率.所要研究的对数收益率为{r it; i =1, ···,N; t =1, ···,T }.也可以考虑简单收益率{R it; i =1, ···,N; t = 1, ···,T }和对数超额收益率{ z it; i =1, ···,N; t =1, ···,T }.1.2.1统计分布及其矩的回顾我们简要地回顾一下统计分布的一些基本性质和随机变量的矩.设R k表示k维欧几里得空间, x∈R k表示x是R k中的点,考虑两个随机向量X =(X1, ···,X k)�和Y =(Y1, ···,Y q)�.令P (X ∈A, Y ∈B)表示X在子空间 A ⊂R k中且Y在子空间 B ⊂R q中的概率.本书的大部分场合,都假定这两个随机向量是连续的.联合分布函数F X,Y (x, y; θ)= P (X � x, Y � y; θ) ,是参数为θ的X与Y的联合分布,其中不等号“�”是分量对分量的运算. X和Y的规律由F X,Y (x, y; θ)刻画.如果X和Y的联合概率密度函数f x,y (x, y; θ)存在,则�x�y F X,Y (x, y; θ)= f x,y (w, z; θ)dzdw.−∞−∞这时, X和Y是连续型随机向量.边际分布X的边际分布是F X (x; θ)= F X,Y (x, ∞, ···, ∞; θ) .这样, X的边际分布可通过对Y求积分得到.同理, Y的边际分布也可类似得到.如果k = 1, X是一个一元随机变量,其分布函数为F X (x)= P (X � x; θ) ,称为X的累积分布函数(Cumulative Distribution Function, CDF).一个随机变量的CDF是非降的[即对x1 � x2有F X (x1) � F X (x2)],且有F X (−∞) = 0,1.2收益率的分布性质F X (∞) = 1.对给定的概率p,使p �F X (x p)成立的最小实数x p称为随机变量X的100 p-分位点,更具体地,x p = inf {x |p � F X (x) } .x本书中我们用CDF来计算检验统计量的p值.条件分布给定Y � y的条件下X的条件分布为P (X � x, Y � y; θ)F X|Y �y (x; θ)= .P (Y � y; θ)若所对应的概率密度函数存在,则给定Y = y的条件下, X的条件密度为f x,y (x, y; θ)f x|y (x; θ)= , (1.8)f y (y; θ)其中边际密度函数f y (y; θ)由下式得到∞�f y (y; θ)= f x,y (x, y; θ)dx.−∞由(1.8)式知,联合分布、边际分布和条件分布之间的关系为f x,y (x, y; θ)= f x|y (x; θ) ×f y (y; θ) . (1.9)上述等式关系在时间序列分析中经常用到(如在进行最大似然估计时).最后, X与Y 是相互独立的随机向量当且仅当f x|y (x; θ)= f x (x; θ),这时f x,y (x, y; θ)= f x (x; θ) f y (y; θ).随机变量的矩一个连续型随机变量X的l阶矩定义为∞�m =E �X l� = x lf (x)dx,l−∞其中 “E ”表示期望 (expectation), f (x)是 X 的概率密度函数 .一阶矩称为 X 的均值 (mean)或期望 ,它度量的是分布的中心位置 ,记为 µx . X 的 l 阶中心矩定义为�∞m l =E �(X − µx )l �=(x − µx )lf (x)dx,−∞假定上式中积分存在 .二阶中心矩可度量 X 取值的变化程度 ,称为 X 的方差 (variance),记为 σx2 .方差的正平方根 σx 称为 X 的标准差 .一个正态分布由它的前两阶矩决定.对其他分布,可能要了解其更高阶矩.三阶中心矩度量 X 关于其均值的对称性 ,而四阶中心矩度量 X 的尾部 .在统计学中 ,标准化的三阶矩叫偏度 (skewness),标准化的四阶矩叫峰度 (kurtosis),它们分别用来描述随机变量的对称程度和尾部厚度 .具体地 , X 的偏度和峰度分别定义 为�(X − µx )3��(X − µx )4� S (x)=E ,K (x)=E .σ3 σ 4xx量 K (x) − 3叫作超额峰度 (excess kurtosis),因为正态分布的峰度 K (x) = 3.这样,一个正态随机变量的超额峰度为 0.若一个分布有正的超额峰度 ,则称此分布具有厚尾性 ,厚尾的含义是指该分布在其支撑 (support)的尾部有比正态分布更多的 “质量 ”.在实际中 ,这就意味着来自于这样一个分布的随机样本会有更多的极端值,故称这样的分布为尖峰的(leptokurtic).另外 ,一个具有负的超额峰度的分布是轻尾的 (例如,有限区间上的均匀分布),这样的分布称为低峰的.在应用中 ,我们可以用相应的样本偏度和样本峰度来估计偏度和峰度 .设 {x 1, ··· ,x T }是 X 的 T 个观察值,样本均值为1 Tµˆx = �x t , (1.10)Tt=1样本方差为t=1 在正态分布的假定下 , Sˆ(x)和 K ˆ(x)−3均渐近地服从均值为零、而方差分别为 6/T 和 24/T 的正态分布 [参见 Snedecor 和 Cochran(1980),第 78页].我们可以用这些渐近性质来检验资产收益率是否具有正态性 .给定一个资产收益率序列 {r 1, ··· ,r T },要检验其偏度 ,即要考虑零假设 H 0 : S(r)=0对备择假设 H a : S(r)= 0.�由 (1.12)式所定义的样本偏度的 t-比统计量为 ˆ S(r) t = . �6/T决策规则如下:在显著性水平 α下,若 |t| >Z α/2,则拒绝零假设 ,其中 Z α/2是标准正态分布的100(α/2)上分位点 .另外一个方法是计算检验统计量 t 的 p 值,当且仅当 p 值小于 α时拒绝 H 0.1.2收益率的分布性质类似地 ,我们可以用假设检验 H 0 : K(r)− 3=0与 H a : K(r) − 3 = 0,�来检验收益率序列的超额峰度.检验统计量为 ˆK(r) − 3 t = , �24/T并且该统计量渐近标准正态分布 .决策规则为当且仅当检验统计量的 p 值小于显著性水平α时拒绝 H 0. Jarque 和 Bera(1987)结合了这两个先验检验 ,并利用了下述统计量S ˆ2(r)[K ˆ(r)− 3]2JB= + ,6/T 24/T 其中 ,该统计量的渐近分布是自由度为 2的 χ2分布 .如果 JB 统计量的 p 值小于显著性水平 α,则拒绝正态性的 H 0假设.例 1.2考虑表 1-2中所用的 IBM 股票的日简单收益率 .作为描述性统计量的一部分 ,收益率的样本偏度和峰度可以用各种统计软件包很容易地得到 .我们给出了实例中用到的 SCA 和 S-Plus 命令 ,其中 d-ibm3dx7008.txt 是数据文件名 .需要注意的是 ,在 SCA 中峰度指的是超额峰度 .输出ˆσ2 x=1 T − 1T � (x t − ˆµx )2 ,(1.11)t=1样本偏度为ˆS (x) =1 (T −1) ˆσ3 xT � t=1 (x t −ˆµx )3 ,(1.12)样本峰度为1 (T −�(x − ˆµ).结果中超额峰度很高,表明IBM股票的日简单收益率具有厚尾性.为了检验收益率分布的对称性,我们用检验统计量0.0614 0.061 4t = ==2.49,�6/9845 0.024 7该检验统计量的p值大约为0.013,表明在5%的显著性水平下, IBM股票的日简单收益率显著地右偏.表1-2几种股指和股票日或月简单收益率和对数收益率的描述性统计量aˆσ 2 x =1 T−1T� (x t −ˆµx)2 ,(1.11)t=1 样本偏度为ˆS (x) = 1 (T −1) ˆσ3 xT�t=1 (x t −ˆµx)3 ,(1.12)样本峰度为ˆK (x) = 1 (T −1) ˆσ4 xT�(x t −ˆµx)4 .(1.13)证券起始日期样本量均值标准差偏度超额峰度最小值最大值日简单收益率(%)SP 70/01/02 9845 0.029 1.056 −0.73 22.81 −20.4711.5。

金融时间序列分析——第2周

金融时间序列分析——第2周

DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
期望
对于连续型随机变量X,有概率密度函数f(x),则定义∞ຫໍສະໝຸດ ������ ������ =
������ ������ ������������
−∞
为X的数学期望。
DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
方差
低成本获取高端知识 技术成就梦想
炼数成金

DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
Thanks
FAQ时间
DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
为随机变量X与Y的相关系数
DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
随机游动
随机游动
对于所有的t
DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
随机游动
DATAGURU专业数据分析社区 金融时间序列分析 讲师 何翠仪
平稳性
严平稳
弱平稳:

– –
������������������ ������������ ,������������ ������������������(������������ )������������������(������������ )
= ������ ������������ ������������ − ������������ ������������ , ������, ������ =
若时间序列{������������ }是弱平稳时间序列,满足������������ = ������ +
������ ������=0 ������������ ������������−������ ,其中������0

《金融时间序列分析》讲稿

《金融时间序列分析》讲稿

《金融时间序列分析》讲稿第一章 绪论第一节 时间序列分析的一般问题人们在日常生活和工作中会遇到大量的金融数据,如存款的利率、股票的价格、债券的收益等等,例 某支股票的价格。

如何从这些数据中总结、发现其变化规律,从而预测或控制现象的未来行为,这就是时间序列分析这门课程所要研究的问题。

研究方式数据的类型。

横剖面数据:由若干现象在某一时点上所处的状态所形成的数据,称为横剖面数据,又称为静态数据。

它反映一定时间、地点等客观条件下诸现象之间存在的内在数值联系。

例如,上海证券交易所所有股票在某一时刻的价格;某一时刻全国各省会城市的温度,都是横剖面数据;研究方法:多元统计分析。

纵剖面数据:由某一现象或若干现象在不同时点上的状态所形成的数据,称为纵剖面数据,又称为动态数据。

它反映的是现象与现象之间关系的发展变化规律。

例如,南京市1980年至2005年每年末的人口数;上海证券交易所所有股票在一年中每个周末收盘价,都是纵剖面数据研究方法:时间序列分析时间序列概念。

时间序列: 简单地说,时间序列就是按照时间顺序排成的一个数列,其中每一项的取值是随机的。

严格的时间序列的定义需要随机过程的概念。

设),,(P βΩ是一个概率空间,其中Ω是样本空间,β是Ω上的σ-代数,P是Ω上的概率测度。

又设T 是一个有序指标集。

概率空间),,(P βΩ上的随机变量}:{T t X t ∈的全体称为随机过程。

注: 指标集T 可以是连续的也可以是离散的,相应地,随机过程也有连续和离散之分。

定义:若}{i t 是R 中的一个离散子集,则称随机过程}{}}{:{i t i t X t t X =∈是一个时间序列。

简言之,一个离散随机过程被称为一个时间序列。

注: 1、从统计意义上说,时间序列是一个统计指标在不同时刻上的数值,按照时间顺序排成的数列,由于统计指标数值受到各种偶然因素影响,因此这数列表现出随机性。

2、从系统论上说,时间序列是某一系统在不同时刻的响应,是系统运行的历史行为的客观记录。

2020版金融计量学:时间序列分析视角(第三版)教学课件第1章

2020版金融计量学:时间序列分析视角(第三版)教学课件第1章
其中: 为联合分布函数中的参数。假定 X与Y的联合概率密度函数 fx,y (x, y;) , 并且严格有定义,则有:
xy
FX ,Y (x, y;) fx,y (w, z;)dzdw
与联合分布相对的概念是边际分布。 例如,X的边际分布可以通过将联合分 布中与X不相关的赋值设为 来获得:
FX (x;) FX ,Y (x, , , ;)
中国人民银行经作者计算从这几幅图中可以看到不同的金融时间序列变量展示出各种各样的变动轨迹经济学者经常把金融时间序列变量的这种随时间变化的轨迹称为动态路径其中动态一词的含义实质上就是指随时间变化简单净收益率simplenetreturn
金融计量学
第一章 金融计量学初步
1.1 金融计量学的范畴 1.2 金融时间序列数据 1.3 金融计量分析中的基本概念
从具体内容上看,金融计量学涵 盖了宏微观金融理论检验、资本资产 定价、金融变量相关关系的假设检验 、经济状态对金融市场的影响分析以 及金融变量预测等多方面的内容。
1.2 金融时间序列数据 广义地讲,将某种金融随机变量
按出现时间的顺序排列起来称为金融 时间序列。
从现实世界的角度看,金融时间 序列就是指在一定时期内按时间先后 顺序排列的金融随机变量。
1.3.2 随机变量与随机过程 例如: yt c xt t t N (0, 2 )
其中:t N (0, 2 )表示t服从均值为0、 方差为 2的正态分布。注意,在很多教
材中,经常把正态分布也称为高斯分布 (Gaussian distribution)。
随机变量:
yt c xt t , t N (0, 2 )
当X是一个一维的随机变量而不是 向量形式时,边际分布的定义就成为下 面常见的形式:

金融时间序列分析第二章

金融时间序列分析第二章

rh 1 ˆh 1 r ˆh 1 E rh1 Fn min E rh 1 r
ˆh 1 r ? 2
MSE
rh 1 c0 ah 1 1ah E ah Fh ah ˆh 1 E rh 1 Fh c0 1ah r eh 1 ah 1
l
因此
2 l 0 l 1 1 q q l a
lq
0
l 0 l 11 q q l 1 12 q2
lq
lq
l
例: 对于 MA
0
1 :
lq
1
l 0
1 1 12
l 0
2 0 1 1 a l 0 l 1 l 1
l0 l 1 l 1
l l 1 1 0 0 l 1 l 1
l
AR(2)模型
l 1
rt 0 1rt 1 2 rt 2 at
E rt
2 t 2
rt r
2.4.4 预测
2 ˆh l Fh min E rh l r
向前一步预测
rh 1 0 1rh p rh 1 p ah 1
ˆh 1 E rh 1 Fh r E 0 1rh p rh 1 p ah 1 Fh E 0 Fh 1 E rh Fh p E rh 1 p Fh E ah 1 Fh 0 1rh p rh 1 p
3、自协方差及其性质
0 var rt
l l
2.2 相关系数和自相关函数 1、相关系数 2、自相关函数(ACF)

金融时间序列分析教材

金融时间序列分析教材

金融时间序列分析教材1. 引言金融时间序列分析是金融研究中重要的一部分,它涉及到对金融市场中的数据进行分析、预测和建模。

时间序列分析能够帮助我们了解金融市场中的规律和趋势,对投资决策和风险管理具有重要意义。

本教材旨在介绍金融时间序列分析的基本概念、方法和应用,并结合实例进行讲解,帮助读者快速掌握这门学科。

2. 时间序列的基本概念2.1 时间序列的定义与特点时间序列是一系列按一定时间间隔排列的观测值的集合。

它可以用于描述金融市场中各种指标随时间的演变情况。

时间序列数据通常具有以下特点:趋势、季节性、周期性和随机性。

本节将详细介绍这些特点及其对时间序列分析的影响。

2.2 时间序列的分类根据时间序列数据所反映的性质和规律性,我们可以将时间序列分为统计序列和非统计序列。

统计序列是具有一定规律性的序列,例如季节性数据;非统计序列则是没有明显规律的序列,例如随机游走序列。

本节将介绍不同类型的时间序列及其特点,并适当引入实例进行说明。

3. 时间序列的基本统计特征3.1 平稳性平稳性是时间序列分析的重要前提与基本假设。

它指的是时间序列的均值和方差不随时间改变。

本节将介绍平稳时间序列的定义,以及判断和处理非平稳时间序列的常用方法。

3.2 相关性和自相关性时间序列数据的相关性和自相关性是分析其规律和趋势的重要手段。

相关性用于度量两个或多个时间序列之间的线性关系,自相关性则用于度量时间序列自身不同时间点之间的线性关系。

本节将详细介绍相关性和自相关性的概念、计算方法和应用。

3.3 平滑和季节性调整平滑和季节性调整是时间序列分析中常用的数据处理技术。

平滑可以去除时间序列中的噪声和波动,使趋势变得更加明显;季节性调整可以消除时间序列中的季节因素,使其更符合规律。

本节将介绍平滑和季节性调整的常用方法和实例应用。

4. 时间序列的建模方法4.1 自回归移动平均模型 (ARMA)ARMA模型是一种常用的时间序列建模方法,它基于时间序列数据自身的历史值进行预测和建模。

线性时间序列分析

线性时间序列分析
时间序列模型(time series modeling)是指仅用它的过 去值及随机扰动项所建立起来的模型,其一般形式为
Xt=F(Xt-1, Xt-2, …, t) 建立具体的时间序列模型,需解决如下三个问题: (1)模型的具体形式 (2)时序变量的滞后期 (3)随机扰动项的结构 例如,取线性方程、一期滞后以及白噪声随机扰动项( t = t ),模型将是一个1阶自回归过程AR(1)(Autoregressive process):
8
12
j
二、线性时间序列
时间序列{rt} 称为线性序列,如果它能写成

rt a i ti i0
其中 是rt 的均值,0 1 {a,t} 是白噪声序列
若 rt 是弱平稳的,利用{at} 的独立性得到rt 的均值和方

E(rt )

Var (rt
)


2 a
美元
下表为连续复合效果的演示
类型
支付次数
每期利率
净值
一年
1
半年
2
季度
4

12

52

365
连续地

0.1 0.05 0.025 0.0083 0.1/52 0.1/365
$1.100 00 $1.102 50 $1.103 81 $1.104 71 $1.105 06 $1.105 16 $1.105 17

2 i
i0



l Cov(rt , rtl ) E[(
iati )(

aj tl
j
)]


2 a
j jl
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《金融时间序列分析》实验
讲授教师:郭文旌 南京财经大学金融学院
实验一 EViews软件的基本操作 软件的基本操作
【实验目的】 实验目的】 了解EViews软件的基本操作对象,掌握软件的基本操作。 实验内容】 【实验内容】 1、EViews软件的安装; 2、数据的输入、编辑与序列生成; 3、图形分析与描述统计分析; 4、数据文件的存贮、调用与转换。 实验步骤】 【实验步骤】 1、安装EViews软件 2、数据的输入、编辑与序列生成 3、图形分析与描述统计分析 4、数据文件的存贮、调用与转换
实验二 AR(I)MA模型的估计与预测 模型的估计与预测
【实验目的】 实验目的】 了解AR,MA以及ARIMA模型的特点,了解三者之间的区别 联系,以及AR与MA的转换,掌握如何利用自相关系数和偏 自相关系数对ARIMA模型进行识别,利用最小二乘法等方法 对ARIMA模型进行估计,利用信息准则对估计的ARIMA模 型进行诊断,以及如何利用ARIMA模型进行预测。掌握在实 证研究如何运用Eviews软件进行ARIMA模型的识别、诊断、 估计和预测。 基本概念】 【基本概念】 所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序 列,然后将因变量仅对它的滞后值以及随机误差项的现值和 滞后值进行回归所建立的模型。ARIMA模型根据原序列是否 平稳以及回归中所含部分的不同,包括移动平均过程 (MA)、自回归过程(AR)、自回归移动平均过程 (ARMA)以及ARIMA过程。
实验三 (G)ARCH模型在金融数据 ) 模型在金融数据 中的应用
【实验目的】 实验目的】 理解自回归异方差(ARCH)模型的概念及建立的必要性和 适用的场合。了解(G)ARCH 模型的各种不同类型,如 GARCH-M 模型(GARCH in mean ),EGARCH模型 (Exponential GARCH ) 和TARCH模型 (又称GJR)。掌握对 (G)ARCH 模型的识别、估计及如何运用Eviews软件在实证 研究中实现。 基本概念】 【基本概念】 p阶自回归条件异方程ARCH(p)模型
2、实验要求: (1)深刻理解上述基本概念; (2)思考:如何通过观察自相关,偏自相关系数 及其图形,利用最小二乘法,以及信息准则建立合 适的ARIMA模型;如何利用ARIMA模型进行预测; (3)熟练掌握相关Eviews操作。 实验指导】 【实验指导】 ARIMA模型的识别 2、模型的估计 3、模型的诊断 4、模型的预测
实验五 VAR模型的概念和构造 模型的概念和构造
【实验目的】 实验目的】 理解VAR模型的概念,掌握VAR模型的形式和特点,掌握 VAR模型的识别、估计、软件进行相关 的检验。 基本概念】 【基本概念】 VAR模型即向量自回归模型
Zt =
k
∑AZ
i i =1
t − i
+ Vt
【实验内容及要求】 实验内容及要求】 1、实验内容: 在Eviews软件中利用VAR模型对我国货币政策的有效性进行 检验。取我国狭义货币供应量M1,商品零售物价指数P,以 及代表产出水平的国内生产总值GDP的季度数据,时间为 1994年第一季度到2004年第二季度。所有的数据我们都取 它们的增长率,以保证序列的平稳性。 2、实验要求: (1)深刻理解VAR模型的基本概念,以及脉冲响应的基本 概念; (2)思考:如何建立适当的VAR模型;如何利用VAR模型 进行预测; (3)熟练掌握相关Eviews操作。 【实验指导】 实验指导】 导入数据 2、建立模型 3、检验脉冲响应
实验四 VaR的估计方法 的估计方法
【实验目的】 实验目的】 掌握风险测度VaR的两种估计方法:t(d)分布的拟合法和极 值方法。 实验内容】 【实验内容】 1、t(d)分布的极大似然估计; 2、t(d)分布的拟合度检验; 3、VaR的计算; 4、极值方法的参数估计; 5、VaR的计算。 数据来源:样本数据r是“中证国债”2003年1月2日至2009 年2月23日的月度收益率。 实验指导】 【实验指导】 1、VaR的t(d)分布的极大似然估计 2、VaR的极值方法
【实验内容及要求】 实验内容及要求】 1、实验内容: 以上证指数和深证成份指数为研究对象,选取1997年1月2 日~2002年12月31日共6年每个交易日上证指数和深证成份 指数的收盘价为样本,完成以下实验步骤: (一) 沪深股市收益率的波动性研究 (二) 股市收益波动非对称性的研究 (三) 沪深股市波动溢出效应的研究 2、实验要求: (1)深刻理解本章的概念; (2)对实验步骤中提出的问题进行思考; (3)熟练掌握实验的操作步骤,并得到有关结果。 实验指导】 【实验指导】 1、 沪深股市收益率的波动性研究 2、 股市收益波动非对称性的研究 3、沪深股市波动溢出效应的研究
在ARIMA模型的识别过程中,我们主要用到两个工具:自相 关函数(简称ACF),偏自相关函数(简称PACF)以及它们各 自的相关图(即ACF、PACF相对于滞后长度描图)。对于 一个序列 来说,它的第j阶自相关系数(记作 )定义为它 的j阶自协方差除以它的方差,即 = ,它是关于j的函数, 因此我们也称之为自相关函数,通常记ACF(j)。偏自相关函 数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的 相关关系。 实验内容及要求】 【实验内容及要求】 1、实验内容: 根据1991年1月~2005年1月我国货币供应量(广义货币M2) 的月度时间数据来说明在Eviews3.1 软件中如何利用B-J方 法论建立合适的ARIMA(p,d,q)模型,并利用此模型进行 数据的预测。
yt = β xt + ε t
ht = var(ε t | Ωt −1 ) = a0 + a1ε t2−1 + a2ε t2− 2 + ...... + a pε t2− p
广义自回归条件异方差GARCH(p,q)模型
yt = β xt + ε t
ht = var(ε t | Ωt −1 ) = a0 + a1ε t2−1 + ... + a pε t2− p + λ1ht −1 + ... + λq ht − q
相关文档
最新文档