基于核密度估计的上证a股收益率分析

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 基于核密度估计的上证A 股收益率分析

一、模型的相关理论知识

(一)问题的提出

经济计量研究中常用的是参数估计,即假定经济变量之间具有一定的函数关系,且函数形式是可以确定的,可以写成带参数的形式进行估计,经典的线性回归和非线性回归就属于参数估计方法。但经济变量之间的关系未必是线性关系或可线性化的非线性关系,而变量之间的真实关系到底是什么又很难确定。因而当模型及参数的假定与实际背离时,就容易造成模型设定误差。此时,基于经典假设模型所做出的预测,很难达到预期的效果。针对该问题,非参数估计方法提供了最佳的解决办法,它使我们能寻找到最精确的非线性系统来描述变量之间的内在关系。非参数估计的回归函数的形式可以任意,没有任何约束,解释变量和被解释变量的分布也很少限制,因而有较大的适应性,其目的在于放松回归函数形式的限制,为确定或建议回归函数的参数表达式提供有用的工具,从而能在广泛的基础上得出更加带有普遍性的结论。核估计就是一种非参数估计方法,主要用于对随机变量密度函数进行估计。 (二)核密度估计方法的原理

设12,,

n x x x 是从具有未知密度函数()f x 的总体中抽出的独立同分布样本,

要依据这些样本对每一x 去估计()f x 的值。

密度估计最基本的方法是直方图估计,我们可以从直方图估计导出密度核估计。作直方图时,先用点{}1k

i i a =把直线分成若干小的计数区间。这样,计数区间的端点与宽度都是固定的。记i N 为样本点12,,

n x x x 落在第i 个计数区间[)

1,i i a a +里的个数,则密度函数()f x 在[)1,i i a a +里的函数估计值就取为:

k

i a x a a a n N x f

i i i i i

,,1,,)

()(ˆ11 =<≤-=++

这样的直方图估计结果是阶梯函数,如果对每个x ,各作一个以x 为中点的

小计数区间[),x h x h -+, 再对落在该计数区间的样本点计数,设为,N x h (),则

密度估计为:(,)ˆ()2N x h f

x nh

=。其与直方图不同在于它的计数区间端点划分不是固定的,而是随x 而变,可以自始至终保持x 点在计数区间中间。不过此时计数

区间宽度h 一般是固定的。如果引进均匀核函数00.5 11

()0 x K x -≤<⎧=⎨⎩当其他,则

上述变端点计数区间的密度估计可写为: 011ˆ()n i i x x f x K nh h =-⎛⎫= ⎪⎝⎭

∑。 后来Parzen(1962)提出,可以将这种核函数形式放宽限制,只须积分为1(最好还为恒正)即可。这就导出了一般的密度核估计:

11ˆ()n i i x x f x K nh h =-⎛⎫= ⎪⎝⎭

∑ (6-1) 其中()K •为核函数,h 为窗宽。

另外也可以从经验分布函数导出密度核估计。

经验分布函数121

()(,,,)n F x x x x x n

=中小于的个数也是一种计数,不过从-∞

一直计到x 为止。利用它表示一个以x 为中心,窗宽为2h 计数区间里的样本点数,于是密度估计为:

[]1111ˆ()()()2()()()()2x h n

i i x h x x x t f x F x h F x h h dF t K dF t K h h h nh h ++∞

=--∞--=+--===∑⎰⎰

对核函数形式放宽了,一般来说,要求核函数满足以下条件: ⎪⎪

⎩⎪⎪

⎨⎧=⋅+∞<+∞<=≥∞

→∞+∞-+∞∞-⎰⎰0)(lim )(,)(sup 1

)(,0)(2

x x K dx x K x K dx x K x K x 对于一般概率密度函数,这些条件是能满足的,所以可以选一个概率密度函数作核函数。对窗宽h 的要求,显然样本数越多,窗宽应越小,但不能太小,即h 是n 的函数,且lim ()0,lim ()x n h n nh n n →∞

→∞

==→∞。在上述要求的核函数及窗宽条件

下,密度()f x 的核估计ˆ()f

x 是()f x 的渐近无偏估计与一致估计。 (三)几种常用的和函数

下面介绍几种常用的核函数:

1,均匀核00.5 11

()0 x K x -≤<⎧=⎨⎩

当其他,

2,高斯核)2ex p()2((x )K 2211x -=-π, 3,Epanechnikov 核22()0.75(1)K x x +=-, 4,三角形核3()(1)K x x +=-,

5,四次方核2

2415()((1))16K x x +=

-, 6,六次方核3

3570()((1))81

K x x +=-。

通常在大样本的情况下,非参数估计对核函数的选择并不敏感,但是,窗宽h 的选择对估计的效果影响较大。一般来说,窗宽取得越大,估计的密度函数就越平滑,但偏差可能会较大。如果选的h 太小,估计的密度曲线和样本拟合得较好,但可能很不光滑,即方差过大。所以,窗宽的变化不可能既使核估计的偏差减小,同时又使核估计的方差较小。因此,最佳窗宽的选择标准必须在核估计

的偏差和方差之间作一个权衡,即使积分均方误差))(ˆ(x f

AMISE 达到最小。选择h 的方法有许多,比如交错鉴定选择法,直接插入选择法,在各个局部取不同的

窗宽,或者估计出一个光滑的窗宽函数)(ˆx h

等等1。 ⎰⎰

+-=-=dx x f Var x f x f E dx x f x f E x f

AMISE ))](ˆ())()(ˆ[())()(ˆ())(ˆ(22

1

见于吴喜之.非参数统计[M].中国统计出版社,p188-p189.

相关文档
最新文档