2019年人工智能系列研究:机器学习中的随机数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019年人工智能系列研究:机器学习中的随机数
正文目录
本文研究导读 (4)
机器学习中的随机数 (5)
从计算机中的随机数生成谈起 (5)
数据集的随机划分 (5)
优化算法中的随机数 (6)
赋予参数随机初始值 (6)
随机梯度下降 (6)
集成学习中的随机数 (8)
神经网络中的随机数 (9)
Python环境下如何设置随机数种子 (10)
机器学习选股模型随机性的来源 (11)
方法 (12)
人工智能选股模型测试流程 (12)
全连接神经网络模型参数设定 (14)
单因子测试 (14)
回归法和IC值分析法 (14)
分层回测法 (15)
结果 (16)
模型性能 (16)
回归法和IC值分析法 (17)
分层测试法 (18)
不同随机性来源的横向比较 (20)
总结 (22)
风险提示 (23)
图表目录
图表1:机器学习中随机数所涉及的环节、作用和代表模型 (5)
图表2:二元损失函数示意图 (7)
图表3:损失函数为凸函数(左)和非凸函数(右) (7)
图表4:梯度下降法(左)和随机梯度下降法(右) (7)
图表5:Bootstrap重采样示意图 (8)
图表6:Bagging并行集成方法示意图 (9)
图表7:Dropout方法示意图 (10)
图表8:Python常用机器学习包中随机数种子参数设置方法 (11)
图表9:keras包(tensorflow作为后端)设置随机数种子代码实例 (11)
图表10:机器学习选股模型随机性的可能来源和对应的考察方式 (11)
图表11:人工智能选股模型测试流程示意图 (12)
图表12:年度滚动训练示意图 (12)
图表13:选股模型中涉及的全部因子及其描述 (13)
图表14:模型历年滚动训练最优超参数 (14)
图表15:2011~2018年四种模型样本外平均正确率分布 (16)
图表16:2011~2018年四种模型样本外平均AUC分布 (16)
图表17:2018年四种模型样本外平均正确率分布 (16)
图表18:2018年四种模型样本外平均AUC分布 (16)
图表19:2011~2018年四种模型平均t 值分布 (17)
图表20:2011~2018年四种模型平均|t|值分布 (17)
图表21:2011~2018年四种模型平均因子收益率分布 (17)
图表22:2011~2018年四种模型平均Rank IC分布 (17)
图表23:2011~2018年逻辑回归模型累积Rank IC及波动情况 (18)
图表24:2011~2018年XGBoost模型累积Rank IC及波动情况 (18)
图表25:2011~2018年随机森林模型累积Rank IC及波动情况 (18)
图表26:2011~2018年全连接神经网络模型累积Rank IC及波动情况 (18)
图表27:2011~2018年四种模型多空组合年化收益率分布 (18)
图表28:2011~2018年四种模型多空组合夏普比率分布 (18)
图表29:2011~2018年四种模型Top组合年化收益率分布 (19)
图表30:2011~2018年四种模型Top组合夏普比率分布 (19)
图表31:2011~2018年逻辑回归模型多空组合净值及波动情况 (19)
图表32:2011~2018年XGBoost模型多空组合净值及波动情况 (19)
图表33:2011~2018年随机森林模型多空组合净值及波动情况 (19)
图表34:2011~2018年全连接神经网络模型多空组合净值及波动情况 (19)
图表35:2011~2018年逻辑回归模型多空组合平均和最优最差净值 (20)
图表36:2011~2018年XGBoost模型多空组合平均和最优最差净值 (20)
图表37:2011~2018年随机森林模型多空组合平均和最优最差净值 (20)
图表38:2011~2018年全连接神经网络多空组合平均和最优最差净值 (20)
图表39:XGBoost模型四种随机性来源比较 (21)