均衡m×2交叉验证方法

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

均衡m×2交叉验证方法

【摘要】：估计统计模型的期望预测误差是统计机器学习的核心任务之一。期望预测误差估计的好坏对后续的模型选择问题、不同模型预测误差差异的显著性检验问题以及变量选择问题均有着显著的影响。为了找到一个优良的估计,研究者们提出了大量的估计方法,例如,MDL方法,交叉验证方法,Bootstrap方法以及它的改进.632Bootstrap方法。其中,交叉验证是一种最常用的泛化误差估计方法。本文主要针对统计机器学习分类问题,对已有交叉验证方法的优缺点进行了分析和总结,并在此基础上对交叉验证方法进行了改进。对于组块3×2交叉验证来说,它虽然具有折数低、对数据集切分均匀、实验次数少等特点,但是5×2交叉验证、10×2交叉验证对于分类问题也同样具有不错的效果,而且对于分组2折交叉验证的方法,随着实验次数的增加会一定程度上提高实验结果。但是如何解决实验性能与实验开销间的矛盾,如何确定合理的实验次数一直都是机器学习领域的难题,为此我们尝试对组块3×2交叉验证进行了改进和推广,提出均衡7×2交叉验证和均衡11×2交叉验证,并在此基础上总结出更一般化的均衡m×2交叉验证(BCVM×2)同时给出了其具体构造方法。我们推荐使用均衡m×2交叉验证方法来确定实验次数,以此来提高实验效果,并且通过理论分析和模拟实验佐证了我们的设想。对于分类学习中的模型选择任务,我们同样应用均衡m×2交叉验证方法。综合考虑均衡m×2交叉验证模型选择方法的各种影响因素,可以判断运用m×2交叉

验证进行模型选择效果要优于常用的5折、10折交叉验证。我们通过模拟实验支持了以上判断,并且从理论上证明了均衡m×2交叉验证同样具有选择一致性。因此,可以说明均衡m×2交叉验证是一种更适合分类问题的模型选择方法。【关键词】：交叉验证均衡m×2交叉验证模型选择

【学位授予单位】：山西大学

【学位级别】：硕士

【学位授予年份】：2013

【分类号】：O212.1

【目录】：中文摘要8-9ABSTRACT9-11第一章引言11-171.1研究背景及意义11-121.2国内外研究现状12-151.3本文研究方法和内容151.4文章结构安排15-17第二章均衡m×2交叉验证17-232.1定义及记号17-192.2均衡m×2交叉验证的构造方法19-23第三章均衡m×2交叉验证的方差分析23-313.1方差理论分析23-273.2实验一不同重叠个数CV值协方差比较27-283.3实验二RCV_(3×2)和BCV_(3×2)方差比较28-313.3.1实验设置28-293.3.2实验结果及分析29-31第四章均衡m×2交叉验证的模型选择研究31-374.1选择一致性的定义31-324.2均衡m×2交叉验证选择一致性及理论证明32-334.3均衡m×2交叉验证的模型选择方法334.4实验33-354.4.1实验一常见交叉验证

方差比较33-344.4.2实验二常见交叉验证模型选择比较34-354.5总结35-37第五章总结与展望37-385.1总结375.2展望37-38附录38-39参考文献39-41攻读学位期间取得的研究成果41-42致谢42-43个人简况及联系方式43-45 本论文购买请联系页眉网站。