《金融数量分析 》第21章 资产收益率分布的拟合与检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

21.3.5 lillietest函数
当总体均值和方差未知时,Lilliefors(1967)提出用样本均值和标准差s代替总体 的均值μ和标准差σ,然后使用KolmogorovSmirnov检验,这就是所谓的Lilliefors检验。
lillietest函数用来作Lilliefors检验,检验样本是否服从指定的分布,这里分布的参 数都是未知的,需根据样本作出估计。可用的分布有正态分布、指数分布和极值分布, 它们都属于位置尺度分布族(分布中包含位置参数和尺度参数),lillietest函数不能用 于非位置尺度分布族分布的检验。
21.3 分布的检验
21.3.1 chi2gof函数
chi2gof函数用来作分布的χ2(卡方)拟合优度检验,检验样本是否服从指 定的分布。它用若干个小区间把样本观测数据进行分组(默认情况下分成10个 组),使得理论上每组(或区间)包含5个以上的观测,即每组的理论频数大 于或等于5,若不满足这个要求,可以通过合并相邻的组来达到这个要求。
21.3.4 kstest2函数
kstest2函数用来作两个样本的KolmogorovSmirnov检验,它可以作双侧检 验,检验两个样本是否服从相同的分布,也可以作单侧检验,检验一个样本 的分布函数是否在另一个样本的分布函数之上或之下,这里的分布是完全确 定的,不含有未知参数。kstest2函数对比两样本的经验分布函数,构造检验统 计量。
21.1 案例描述
为使得整个分析过程更贴近实际,选取2007—2008年沪深300指数价格与博 时主题(复权)净值数据( 如图1所示)作为分析对象进行分布的拟合与检验。
图1 12007—2008年沪深300指数与博时主题
21.2 数据的描述性统计
21.2.1 描述性统计量
1. 均值 mean函数用来计算样本均值,样本均值描述了样本观测数据取值相对集中的中心 位置。 2. 标准差 样本标准差描述了样本观测数据变异程度的大小,它有如下两种定义:
本的4阶中心矩。样ቤተ መጻሕፍቲ ባይዱ峰度反映了总体分布密度曲线在其峰值附近的陡峭程度。正态
分布的峰度为3,若样本峰度大于3,说明总体分布密度曲线在其峰值附近比正态分
布来得陡;若样本峰度小于3,说明总体分布密度曲线在其峰值附近比正态分布来得
平缓。
21.2.2 统计图
1. 箱线图 箱线图非常直观的反映了样本数据的分散程度以及总体分布的对称性和
8. 变异系数
变异系数是衡量数据资料中各变量观测值变异程度的一个统计量。
9. 偏度
skewness函数用来计算样本的偏度,样本偏度反映了总体分布密度曲线的对称性信
息,偏度越接近于0,说明分布越对称,否则分布越偏斜。
10. 峰度
kurtosis函数按
来计算样本的峰度,其中B2为样本的2阶中心矩,B4为样
chi2gof函数的语法如下: h = chi2gof(x) [h,p] = chi2gof(…) [h,p,stats] = chi2gof(…) […] = chi2gof(X,name1,val1,name2,val2, …)
21.3.2 jbtest函数
jbtest函数用来作JarqueBera检验,检验样本是否服从正态分布,调用该函 数时不需要指定分布的均值和方差。由于正态分布的偏度为0,峰度为3,若样 本服从正态分布,则样本偏度应接近于0,样本峰度应接近于3,基于此, JarqueBera检验利用样本偏度和峰度构造检验统计量为
尾重,利用箱线图还可以直观地识别样本数据中的异常值。 MATLAB统计工具箱中提供了boxplot函数,用来绘制箱线图。
2. 经验分布函数图 MATLAB统计工具箱中提供了cdfplot和ecdf函数,用来绘制样本经验分布函
数图。
3. 频率直方图
4. 正态概率图 MATLAB统计工具箱中提供了normplot函数,用来绘制正态概率图。
式中:n 为样本容量;s为样本偏度;k 为样本峰度。当样本容量n 足够大 时,Jarque Bera公式的检验统计量近似服从自由度为2的χ2 分布。
21.3.3 kstest函数
kstest函数用来作单个样本的KolmogorovSmirnov检验,它可以作双侧检验, 检验样本是否服从指定的分布;也可以作单侧检验,检验样本的分布函数是否 在指定的分布函数之上或之下,这里的分布是完全确定的,不含有未知参数。 kstest函数根据样本的经验分布函数Fn(x)和指定的分布函数G(x)构造检验统计量
从表中可以看出,在显著性水平α=0.05下,2007—2008年沪深300指数收益
率序列不服从正态分布。
21.4 投资组合分布图比较
通常比较资产组合的方法是投资组合绩效指标,例如累积收益率、波动率、 夏普比率等指标。换一个角度,或许可以使用分布图对不同的投资组合进行比 较。在分布图中,可以更直观地看到两个组合差异的原因,在收益率高或低的 时候与基准的收益差距。
3.最大值 max函数用来计算样本最大值。 4. 最小值 min函数用来计算样本最小值。 5. 极差 range函数用来计算样本的极差,极差可以作为样本观测数据变异程度大小的一 个简单度量。 6. 中位数 将样本观测值从小到大依次排列,位于中间的那个观测值,称为样本中位数, 它描述了样本观测数据的中间位置。median函数用来计算样本的中位数。 7. 众数 mode函数用来计算样本的众数,众数描述了样本观测数据中出现次数最多的数。
在统计推断中,通常假定总体服从一定的分布(例如正态分布),然 后在这个分布的基础上,构造相应的统计量,根据统计量的分布作出一些 统计推断,而统计量的分布通常依赖于总体分布的假设,也就是说总体所 服从的分布在统计推断中是至关重要的,会影响到结果的可靠性。从这个 意义上来说,由样本观测数据去推断总体所服从的分布是非常必要的。指 数与基金的收益率,介绍根据样本观测数据拟合总体的分布,并进行分布 的检验。
式中:F1(x)和F2(x)分别为两样本的经验分布函数。 kstest2函数的语法如下: h= kstest2(x1,x2) h= kstest2(x1,x2,alpha) h= kstest2(x1,x2,alpha,type) [h,p]= kstest2(…) [h,p,ks2stat]= kstest2(…)
Lilliefors检验是双侧拟合优度检验,它根据样本经验分布函数和指定分布的分布 函数构造检验统计量。
式中:SCDF(x)是样本经验分布函数;CDF(x)是指定分布的分布函数。
21.3.6 最终的结论
前面介绍了chi2gof、jbtest、kstest、kstest2、lillietest等函数的用法,并分 别调用这些函数对2007—2008年沪深300指数收益率中的总成绩数据进行了正 态性检验(如下表所列),原假设是总成绩数据服从均值为-2.6398e-004,标准 差为0.0275。
例 将2007—2008年博时主题与沪深300指数的组合收益率分别进行分布 图比较。(详细步骤见教材)
kstest函数中也有内置的临界值表,这个临界值表对应5种不同的显著性水平。 对于用户指定的显著性水平,当样本容量小于或等于20时,kstest函数通过在临界 值表上作线性插值来计算临界值;当样本容量大于20时,通过一种近似方法求临 界值。如果用户指定的显著性水平超出了某个范围(双侧检验是0.01~0.2,单侧检 验是0.005~0.1)时,计算出的临界值为NaN。
相关文档
最新文档