人口增长率的非参数自回归预测模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2006201204
作者简介:巩永丽(1980—),女,山西永济人,西安理工大学硕士研究生,主要从事应用概率统计方面的研究.
山西师范大学学报(自然科学版)第21卷第1期Journal of Shanxi Nor mal University
Vol .21 No .12007年3月
Natural Science Editi on
M ar .2007
文章编号:100924490(2007)0120038205
人口增长率的非参数自回归预测模型
巩永丽1
,张德生1
,武新乾2
,姜爱平
1
(11西安理工大学理学院,陕西西安710054;21西北工业大学,陕西西安710072)
摘 要:针对传统的人口增长预测模型不能理想地捕获我国人口增长率数据的非线性性特征,本文基于局部线性非参数估计理论,对我国建国以来的年人口增长率建立了非参数自回归NAR (1)模型,并对
2000年~2003年的年人口增长率进行了预测,计算结果表明,相对于参数自回归模型而言,非参数自回
归模型能够很好地解决人口增长预测这一非线性问题,预测精度较高.关键词:非参数估计;非参数自回归模型;预测中图分类号:O29 文献标识码:A
0 引言
我国是一个发展中国家,又是世界上人口最多的国家,人口问题一直是制约我国经济和社会发展的首要因素,因此,能否对人口增长做出比较准确的预测,对于加速推进我国现代化建设有着极为重要的现实
意义.对于人口增长预测,传统的方法有增长曲线模型、灰色系统模型、系统动力学模型、自回归模型等.增长曲线模型预测方法
[1]
相对简单,但是精度不高;灰色系统模型
[1]
主要是对人口增长趋势波动进行分析,
它在预测资料不全或资料的波动太大、不平稳的发展趋势效果较好;系统动力学模型[1]
在分析问题、收集
资料、建立模型和求证的过程中都要消耗一定的财力、物力和人力,还需要占用大量的计算机工作时间,而且建模人员的专业水平也直接影响模型的质量和结果.自回归模型由于是线性参数化形式,难以较好的解决人口增长预测这一非线性问题.因此,本文尝试利用非参数估计方法,建立我国人口增长率的非参数自回归预测模型,结果表明非参数自回归模型用于人口预测可以获得令人满意的结果,可为相关部门制定人口政策提供科学的依据.
1 非参数自回归预测模型基本原理
1.1 非参数自回归模型
非参数自回归模型(NAR (p ))为:Y t =m (X t )+εt ,其中,解释性变量X t ∈R p
由响应变量(或被解释性变量)Y t ∈R 的一些滞后项所组成(p 为正整数);随机误差序列{εt }独立同分布,E (εt )=0,
E (ε2t )=σ2
,并且εt 与X s ,s ≤t 相互独立;未知函数m (・
)称为条件均值函数(或自回归函数).1.2 非参数预测
对一组平稳时间序列{Y t },t =1,2,...,n,我们的目的是对确定的正整数k,k ≥1,预测Y n +k 的值.非参数自回归模型对未知值Y n +k 进行预测的计算步骤如下:
(1)对这组平稳时间序列建立相应的非参数自回归模型
Y t =m (X t )+εt
(1)
其中X
t
=(Y t-1,Y t-2,...,Y t-p),随机误差序列{εt}独立同分布,并且εt与Y t-1,Y t-2,...,Y t-p相互独立, E(εt)=0,E(ε2t)=σ2.
(2)对上述非参数自回归模型(1)中的自回归函数m(・)采用非参数的方法进行估计,记作m^(・).
(3)利用m^(・)对未知值Y n+k(k≥1)进行非参数预测.
2 非参数自回归预测模型的建立
2.1 模型阶数p的选择
为了应用非参数自回归模型(1)对未知值Y
n+k
(k≥1)进行预测,必须首先确定滞后变量个数p的值.本文采用Cheng和Tong提出的一种相合的定阶方法[2],即C ross2Validation方法对p进行确定.
C ross2Validation方法的原理:对上述的非参数自回归模型(1)的一段样本Y1,Y2,...,Y n,令X t(k)=
(Y
t-1,Y t-2,...,Y t-k),定义cv(k)=
1
n-k6
n
t=k+1
{Y t-m^-t(X t(k))}2W(X t(k)),其中m^-t(・)是去掉第t个数
据后,对自回归函数m(・)的核估计,其阶数p用尝试阶数k代替,其估计为
m^-t(X t(k))=6n
s=k+1
s≠t
7k
i=1
K(
Y i-Y s-i
h
)Y
s 6n
s=k+1
s≠t
7k
i=1
K(
Y i-Y s-i
h
)
其中k(・)是核函数,W(・)为适当选取的非负权函数,对预先给定的模型(1)的阶数的上界L,在{1, 2,...,L}上极小化cv(k),这时模型阶数的估计p^满足cv(p^)=m in
1≤k≤L
cv(k).
2.2 自回归函数m(・)的估计
估计自回归函数m(・)的常用方法是N adaraya2W atson(N2W)核估计[3]和局部线性估计[4~6].相对于N2W核估计而言,局部线性估计可以减少N2W估计量的偏差,能自动适应设计点的边界,无须边界修正;在估计自回归函数的导数方面优于N2W估计,特别是无须核函数的可微性.因此,本文采用局部线性估计方法对自回归函数进行估计.
局部线性估计的思想:设m(X)在X=x处p+1阶导数存在(x可取x
i
,i=1,2,...,n).我们要估计m(x),为此,先把m(X)在X=x处进行泰勒展开
Y i=m(x)+m′(x)(X i-x)+εi,i=1,2,...,n
局部线性估计即为
m in{6n i=1[Y i-m(x)-m′(x)(X i-x)]2k h(X i-x)}
其中K
h (・)=K(
・
h
)/h,h为带宽,h的大小依赖于数据,一般与n有关.K(・)为核函数,本文使用抛物线核
K(u)=0.75(1-u2)+作为核函数.
2.3 窗宽的选择
对一组样本观测值{X
i
,Y i}而言,在给定核函数K(・)下,在X i处局部估计的核权函数为W i(X)=K h(X-X i).选择宽窗h的常用方法是1977年Stone提出的交错鉴定方法[3]
(C ro ss2V alidation2M ethod):在每个局部观察点X=X
i
,先从样本中剔除该观察点(X i,Y i);再将剩下的n-1个观察点在X=X i处进行核权局部估计;最后,通过比较平方拟合误差:cv(h)=n-16n i=1(Y i-m^n,-i(X))2W(X),选择使平方拟和误差达到最小的窗宽h.其中m^n,-i(・)是剔除第i个数据后,对自回归函数m(・)的局部线性估计.
2.4 非参数预测方法
本文采用循环预测法[7]进行预测.这种预测方法的主旨就是对一步向前预测值的循环使用,其基本
思想是:对于非参数自回归模型Y
t =m(X t)+εt,当k=1时(即对Y n+1预测时),和直接预测法相同,我们
・
9
3
・
第1期 巩永丽 张德生 武新乾 姜爱平:人口增长率的非参数自回归预测模型