均衡m×2交叉验证方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中文摘要
估计统计模型的期望预测误差是统计机器学习的核心任务之一。
期望预测误差估计的好坏对后续的模型选择问题、不同模型预测误差差异的显著性检验问题以及变量选择问题均有着显著的影响。
为了找到一个优良的估计,研究者们提出了大量的估计方法,例如,MDL方法,交叉验证方法,Bootstrap方法以及它的改进.632Bootstrap方法。
其中,交叉验证是一种最常用的泛化误差估计方法。
本文主要针对统计机器学习分类问题,对已有交叉验证方法的优缺点进行了分析和总结,并在此基础上对交叉验证方法进行了改进。
对于组块3×2交叉验证来说,它虽然具有折数低、对数据集切分均匀、实验次数少等特点,但是5×2交叉验证、10×2交叉验证对于分类问题也同样具有不错的效果,而且对于分组2折交叉验证的方法,随着实验次数的增加会一定程度上提高实验结果。
但是如何解决实验性能与实验开销间的矛盾,如何确定合理的实验次数一直都是机器学习领域的难题,为此我们尝试对组块3×2交叉验证进行了改进和推广,提出均衡7×2交叉验证和均衡11×2交叉验证,并在此基础上总结出更一般化的均衡mx2交叉验证(BCV。
,),I
同时给出了其具体构造方法。
我们推荐使用均衡mx2交叉验证方法来确定实验次数,以此来提高实验效果,并且通过理论分析和模拟实验佐证了我们的设想。
对于分类学习中的模型选择任务,我们同样应用均衡mx2交叉验证方法。
综合考虑均衡mX2交叉验证模型选择方法的各种影响因素,可以判断运用m×2交叉验证进行模型选择效果要优于常用的5折、10折交叉验证。
我们通过模拟实验支持了以上判断,并且从理论上证明了均衡mx2交叉验证同样具有选择一致性。
因此,可以说明均衡m×2交叉验证是一种更适合分类问题的模型选择方法。
关键词:交叉验证;均衡rex2交叉验证;模型选择;
第四章均衡In×2交叉验证的模型选择研究
证明:设4和嚷为候选分类器,不是一般性设西渐进优于嘎。
因为样本为独立同分布的,T#o与L.独立,其中"gxo为数据最初排列。
于是有
E(K‘1∑:。
r.j)=Er.o=P(他(匹)<硒(疋))
由定理…可得
E(壶∑2,∑k)2哦
je(X。
1∑:,r.j)--》1
易知
o≤E(K叫∑:l易,)≤l
综上可得
E(K一∑:,%,)与1
故推论得证。
·
4.3均衡m×2交叉验证的模型选择方法
模型选择致力于从候选模型集中选出最能反应数据真实规律的模型,同时又最大程度的避免数据中噪声因素的干扰。
在具体操作中,常常通过估计各个模型的性能的优劣而选出最优的模型。
具体过程如下:
给定训练数据DⅣ,样本量为N。
设%。
为候选模型集合,So表示真模型。
则从s肌中选出使得某评价指标达到最优的模型s‘的过程称为模型选择,即
S‘=arg咖'n{crit(S:巩)}(4.1)其中crit(S:DⅣ)=crit(S)∈R是对模型S性能的某种评价标准,比如风险函数。
通过均衡m×2交叉验证来估计泛化误差,并以此作为模型性能度量指标,并根据不同模型泛化误差的大小进行模型选择。
均衡m×2交叉验证模型选择方法为:根据2.8式计算每个候选模型的c圪。
:值,从ep选择cv.。
:值最小的模型作为卑优模型。
4.4实验
4.4.1实验一常见交叉验证方差比较
参照文献协3模拟实验的设置,产生500个样本,重复100000次模拟实验得到分类回归树(CART)模型下泛化误差的5种交叉验证估计的真实方差。
由表l的实验结果可以看出均衡mx2交叉验证的真实方差明显小于标准5折、10折交叉验证。
另外,相对于组块3×2交叉验证来说,由于重复次数增多,均衡7×2交叉验证和均衡。