【CN110276369A】基于机器学习的特征选择方法、装置、设备及存储介质【专利】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910342060.4
(22)申请日 2019.04.24
(71)申请人 武汉众邦银行股份有限公司
地址 430000 湖北省武汉市黄陂区盘龙城
经济开发区汉口北大道88号汉口北国
际商品交易中心D2区1-2层、22-23层
(72)发明人 陈刚 兰翔 钟磊
(74)专利代理机构 深圳市世纪恒程知识产权代
理事务所 44287
代理人 胡海国
(51)Int.Cl.
G06K 9/62(2006.01)
G06N 20/00(2019.01)
(54)发明名称
基于机器学习的特征选择方法、装置、设备
及存储介质
(57)摘要
本发明公开了一种基于机器学习的特征选
择方法、装置、设备及存储介质,所述方法包括:
获取用户的交易数据以及预设个参考特征选择
模型;提取所述交易数据中的参考特征信息;通
过所述参考特征选择模型对所述参考特征信息
进行特征选择;根据选择出的参考特征信息对所
述参考特征选择模型进行评分,得到模型评分结
果;根据所述模型评分结果选择出目标特征选择
模型,将所述目标特征选择模型选择出的参考特
征信息作为目标特征信息,从而通过多种模型结
合,选择出最优的特征选择模型进特征选择,相
较于单一变量选择方法有很大的效率提升,显著
提升了模型对变量选择的分类精度和泛化能力。权利要求书2页 说明书9页 附图5页CN 110276369 A 2019.09.24
C N 110276369
A
权 利 要 求 书1/2页CN 110276369 A
1.一种基于机器学习的特征选择方法,其特征在于,所述基于机器学习的特征选择方法包括:
获取用户的交易数据以及预设个参考特征选择模型;
提取所述交易数据中的参考特征信息;
通过所述参考特征选择模型对所述参考特征信息进行特征选择;
根据选择出的参考特征信息对所述参考特征选择模型进行评分,得到模型评分结果;
根据所述模型评分结果选择出目标特征选择模型,将所述目标特征选择模型选择出的参考特征信息作为目标特征信息。
2.如权利要求1所述的基于机器学习的特征选择方法,其特征在于,所述参考特征选择模型包括单变量回归模型;
所述通过所述参考特征选择模型对所述参考特征信息进行特征选择,包括:
获取单变量回归模型,根据所述单变量回归模型查找所述参考特征信息的取值范围,根据所述取值范围将所述参考特征信息划分为K个小区间;
从所述小区间中选择参考区间,并获取所述参考区间中的参考特征信息的参考特征个数;
获取所述小区间的区间个数,根据所述区间个数及对应的参考特征个数得到特征容量信息;
根据所述特征容量信息得到特征概率信息,根据所述特征概率信息对所述参考特征信息进行特征选择。
3.如权利要求1所述的基于机器学习的特征选择方法,其特征在于,所述参考特征选择模型还包括相关性模型;
所述通过所述参考特征选择模型对所述参考特征信息进行特征选择,包括:
获取第一预设变量,根据所述相关性模型评估所述参考特征信息与第一预设变量的相关性;
根据评估结果对所述参考特征信息进行特征选择。
4.如权利要求1所述的基于机器学习的特征选择方法,其特征在于,所述参考特征选择模型还包括预设分组模型,所述预设分组模型包括主要成分分析模型、聚类模型、线性回归模型以及逻辑回归模型;
所述通过所述参考特征选择模型对所述参考特征信息进行特征选择,包括:
根据所述预设分组模型将所述参考特征信息进行分组;
在所述预设分组模型为主要成分分析模型时,创建预设组件并获取第二预设变量,通过所述预设组件评估分组后的参考特征信息与第二预设变量的相关性,在评估结果满足第一预设条件时对所述参考特征信息进行特征选择;
在所述预设分组模型为聚类模型时,创建预设集群,通过所述预设集群评估分组后的所述参考特征信息的相关性,在评估结果满足第二预设条件时对所述参考特征信息进行特征选择;
在所述预设分组模型为线性回归模型或逻辑回归模型时,分别通过线性回归模型或逻辑回归模型对分组后的参考特征信息进行特征选择。
5.如权利要求1所述的基于机器学习的特征选择方法,其特征在于,所述参考特征选择
2