模型选择标准
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模型选择上主要有两个考虑方向,分别是模型精度和可解释性。预测精度和模型可解释性之间存在着一种内在的权衡,也就是说,随着模型在函数(f)的选择方式上变得越来越灵活,它们就变得越来越模糊,难以解释。灵活的方法更适合推理,不灵活的方法更适合预测。
机器学习业务应用以输出决策判断为目标。可解释性是指人类能够理解决策原因的程度。机器学习模型的可解释性越高,人们就越容易理解为什么做出某些决定或预测。模型可解释性指对模型内部机制的理解以及对模型结果的理解。其重要性体现在:建模阶段,辅助开发人员理解模型,进行模型的对比选择,必要时优化调整模型;在投入运行阶段,向业务方解释模型的内部机制,对模型结果进行解释。比如基金推荐模型,需要解释:为何为这个用户推荐某支基金。
可解释性特质:
重要性:了解“为什么”可以帮助更深入地了解问题,数据以及模型可能失败的原因。
分类:建模前数据的可解释性、建模阶段模型可解释性、运行阶段结果可解释性。
范围:全局解释性、局部解释性、模型透明度、模型公平性、模型可靠性。
评估:内在还是事后?模型特定或模型不可知?本地还是全局?
特性:准确性、保真性、可用性、可靠性,鲁棒性、通用性等。
人性化解释:人类能够理解决策原因的程度,人们可以持续预测模型结果的程度标示。