Copula函数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、 Copula 函数理论
Copula 理论的是由Sklar 在1959年提出的,Sklar 指出,可以将任意一个n 维联合累积分布函数分解为n 个边缘累积分布和一个Copula 函数。边缘分布描述的是变量的分布,Copula 函数描述的是变量之间的相关性。也就是说,Copula 函数实际上是一类将变量联合累积分布函数同变量边缘累积分布函数连接起来的函数,因此也有人称其为“连接函数”。
Copula 函数是定义域为[0,1]均匀分布的多维联合分布函数,他可以将多个随机变量的边缘分布连.起来得到他们的联合分布。
Copula 函数的性质
定理1 (Sklar 定理1959) 令F 为一个n 维变量的联合累积分布函数,其中各变量的边缘累积分布函数记为F i ,那么存在一个n 维Copula 函数C ,使得
111(,,)((),,())n n n F x x C F x F x ⋅⋅⋅=⋅⋅⋅
(1) 若边缘累积分布函数F i 是连续的,则Copula 函数C 是唯一的。不然,Copula 函
数C 只在各边缘累积分布函数值域内是唯一确定的。
对于有连续的边缘分布的情况,对于所有的[0,1]n ∈u ,均有 1111()((),,())n n C F F u F u --=⋅⋅⋅u
(2)
在有非减的边缘变换绝大多数的 从Sklar 定理可以看出, Copula 函数能独立于随机变量的边缘分布反映随机变量的相关性结构, 从而可将联合分布分为两个独立的部分来分别处理: 变量间的相关性结构和变量的边缘分布, 其中相关性结构用Copula 函数来描述。Copula 函数的优点在于不必要求具有相同的边缘分布, 任意边缘分布经Copula 函数连接都可构造成联合分布, 由于变量的所有信息都包含在边缘分布里, 在转换过程中不会产生信息失真。
Copula 函数总体上可以划分为三类: 椭圆型、Archimedean (阿基米德) 型和二次型, 其中含一个参数的Archimedean Copula 函数应用最为广泛, 多维Archimedean Copula 函数的构造通常是基于二维的,根据构造方式的不同可以分为对称型和非对称型两种. 三种常用的3-维非对称型Archimedean Copula 函数: Frank Archimedean Copula 函数 , Clayton Archimedean Copula 函数, Gumbe Archimedean Copula 函数
二、Copula函数的应用
Copula 函数的应用具体包括以下几个步骤: ①确定各变量的边缘分布; ②确定Copula 函数的参数"; ③根据评价指标选取Copula 函数, 建立联合分布;
④根据所建分布进行相应的统计分析。:
参数估计
Copula 函数的参数估计方法大致可分为三种:
○1关性指标法, 根据上面提到的Kendall 秩相关系数$ 与" 的关系间接求得。
②适线法, 即在一定的适线准则下, 求解与经验点据拟合最优的频率曲线的
统计参数。③极大似然法, 对于三维及以上的Copula 函数,相关性指标法显
然不再适用, 此时大多采用极大似然法进行参数估计。肖义在分析前两种方
法的基础上,认为相对于单变量分布, Copula 函数的参数估计对资料的长度
要求更高, 对于中小样本可能导致估计值抽样误差大, 估计值不稳定, 他采
用自助法耦合这两种方法进行参数估计。统计试验表明, 相关性指标法参数
估计值的置信区间较窄、结果更稳定, 自助法能够提高相关性指标法的估计
能力, 对于适线法效果却不佳, 会造成估计值严重偏大。○4均方差(RMSE):
可以用来评价参数估计的有效性
Copula 函数的假设检验
卡方检验 Kolmogorov- Smirnov( K-S)检验
Copula 函数的拟合优度评价
( 1) 离差平方和准则法。采用离差平方和最小准则(OLS) 来评价Copula 方法的有效性, 并选取OLS 最小的Copula 作为联结函数。OLS
(2)AIC 信息准则法。AIC 信息准则包括两个部分: Copula 函数拟合的偏差和Copula 函数的参数个数导致的不稳定性
( 3)Genest–Rivest 方法。Genest 和Rivest提出了一种比较直观地选择Copula 函数的方法,
Copula 函数主要应用方向如下
(1)在分期设计洪水中的应用
分期设计洪水既要满足防洪标准,又能反映洪水的季节性变化特征。现行分期设计洪水模式假定各分期频率均等于防洪标准T 的倒数,使得分期设计洪水值不能满足防洪标准的要求。选择合适的Copula 函数构建汛期分期为三分期、边缘分布为PIII 分布的分期设计洪水的联合分布。在假定分期设计洪水的联合重现期等于防洪标准T 的前提下,推导基于Copula 函数的分期设计洪水频率和防洪标准的关系,进而推求分期洪水设计值,并与现行分期设计洪水模式的计算成果相比较,分析论证了基于Copula 函数分期设计洪水的合理性,从理论和方法上回答和解决现行分期设计洪水中存在的问题,为分期设计洪水研究提供了一种新的途径。
现行方法采用分期最大洪水选样,根据这种洪水系列计算的洪水频率不同于通常根据全年最大洪水系列计算的频率。现行的分期设计洪水模式假定分期设计洪水频率均采用原来的年防洪标准,分期最大洪水系列中的部分(有时候甚至为全部)洪水不是年最大洪水,这些洪水在一年内就可能被超过多次。也就是,在各分期分别取样以后,其分期设计洪水值均小于或等于年最大设计洪水值,不能保证分期设计洪水能够真正达到规定的防洪标准,主汛期设计洪水一般较年最大值取样得到的设计洪水小,这样可能导致主汛期汛限水位较原设计汛限水位抬高这一明显不合理的现象,从而降低水库的防洪标准。为避免这种现象的发生,规范与设计手册中将主汛期设计洪水值强制等于年最大取样计算的设计洪水值,但这种处理方法只能确保主汛期设计洪水达到指定的防洪标准,并不包含其它分期,因而仍不能够达到指定的年防洪标准。现行方法反映了洪水的季节性规律,却不能满足设计标准。正确计算分期设计洪水的途径应既要反映洪水的季节性规律,又要使计算的分期设计洪水符合防洪设计标准(以年为单位的重现期表示)。