量化投资策略的因子选股
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
量化投资策略的因子选股
——2011年中期金融工程投资策略专题
金融工程研究团队 2011年6月16日
证券研究报告
主要内容 1. 因子选股流程 2. 已研究的量化因子 3. 我们的定期产品 4. 未来研究方向
2
主要内容 1. 因子选股流程 2. 已研究的量化因子 3. 我们的定期产品 4. 总结及未来研究方向
58.7% 65.2% 0.0%
P10
单指标检验举例:EPE
图 1:EPE 各分位数组合的累积收益
4000 3500 3000 2500 2000 1500 1000
500 0
累积收益
2006‐12 2007‐03 2007‐06 2007‐09 2007‐12 2008‐03 2008‐06 2008‐09 2008‐12 2009‐03 2009‐06 2009‐09 2009‐12 2010‐03 2010‐06 2010‐09
累积分布(左)
0.00%
-0.41
图 3:交易成本对 EPE30 组合的影响
6000 5000 4000 累 积 3000 收 益 2000 1000
0
交易成本
数据来源:光大证券、Wind
0.96%
0.90%
0.84%
0.78%
0.72%
0.66%
0.60%
0.54%
0.48%
0.42%
0.36%
0.30%
0.24%
0.18%
0.12%
0.06%
图 2:EPE30 组合的绝对收益率分布
0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00
1.2 1.0 0.8 0.6 0.4 0.2 0.0
Baidu Nhomakorabea
0.10
0.07
0.03
0.00
-0.08
-0.11
-0.15
-0.18
频率(右)
2007‐07
2007‐04
2007‐01
换手率
2010‐07
2009‐07
P12
(5)策略优化
策略优化:因子权重的动态调整和优化,最优时间区间等;
原始策略
PE/EPE/PB/EPB 等权重 每月筛选
优化目标函数设定 优化算法选择
优化算法历史回溯期 最优指标权重 优化后的策略
P13
(6)因子选股的整体流程
– 综合模型QM、QM_GA及单因素模型RPE、EPE表现最好 ;
– 在多因素模型中,QM及其优化模型QM_GA的表现最好, 而在各个模块中表现较好的是价值模型VM和成长模型GM, 然后是稳定性模型PM和动量MM;
– 单因素模型中表现最好的RPE、EPE、NPE、DY和ER,表 现最差的是ROE、TM、ES;
上证指数收盘价
P23
(3)时间分析- (C)阶段分析
• RPE • EPE
• QM • QM_GA
20.9%
2.9%
26.5%
标准差
13.5% 13.2% 13.6%
胜出比率
56.5% 58.7% 58.7%
组合 等级 4 等级 5 沪深 300
平均收益率 年化收益率
3.2%
30.6%
3.6%
36.3%
1.7%
12.2%
数据来源:光大证券、Wind
标准差
13.8% 13.9% 12.5%
胜出比率
0.05 0
‐0.05 ‐0.1
‐0.15 ‐0.2
‐0.25
平均信息系数4.7% 信息系数
2007‐01 2007‐04 2007‐07 2007‐10 2008‐01 2008‐04 2008‐07 2008‐10 2009‐01 2009‐04 2009‐07 2009‐10 2010‐01 2010‐04 2010‐07 2010‐10
回溯测试
单调性; 可预测性; 收益率分析; 交易分析;
P8
因子有效性的两个重要方面
单调性 – 检验指标是否具有一致性,得分高的股票收益 率是否高于得分低的股票;
可预测性 – 检验指标是否具有预测能力,即指标与收益率 之间是否存在相关性;
P9
单指标检验举例:EPE
分位数组合
– 平均/年化收益率、胜率 单指标组合
2007年1月至2010年10月:
– 综合模型QM、QM_GA及单因素模型RPE、EPE表现最好; – 多因素模型中,QM、QM_GA表现最好,而在各个模块中表
现较好的是GM、VM,然后是MM和PM; – 单因素模型中,表现最好的RPE、EPE、ER和DY,表现最
差的是TM、ROE、ES; – 优化未必能提高组合的绩效;
更新频率 每月 每月 每月 每月 每月 每月 每季 每季 每季 每月 每季 每月 每季 每季 每季 每月 每月 每月 每月 每季 每月 每季
P17
(2)回溯分析
多数因子具有一定的单调性和可预测性
模块
指标
RPE
EPE
价值
NPE DDM
DY
PB
EG
RG
DG
成长
PG
ROE
EROE
NROE
EM
RM
动量
三阶段股利折现模型 股息收益率 市净率 动量模块 净利润动量
营业收入动量 总收益动量
一致预期变动 盈利惊喜
价值
成长
量化模型
动量
可预测性
成长模块 净利润增长率 营业收入增长率 股利增长率
价格增长 净资产收益率 预测净资产收益率 剔除周期影响的净资产收益
率 可预测性模块 总收益率稳定性
盈利稳定性 一致预期准确度 非经常性项目占比
– 优化作用有限;
P20
(3)时间分析-(B)年度分析
• RPE • EPE
• QM • QM_GA
表现最好 表现最好
单因素模型 多因素模型
表现最差 表现最差 单因素模型 多因素模型
• TM • ROE • ES
数据来源:光大证券、Wind
• VM_GA • PM
P21
(3)时间分析-(B)年度分析
P16
(1)因子算法
模块
指标
剔除非经常性项目影响的市盈率
预测市盈率
剔除经济周期影响的市盈率 价值模块
三阶段股利折现模型
市净率
股息收益率
净利润增长率
营业收入增长率
股利增长率
成长模块 价格增长
净资产收益率
预测净资产收益率
剔除经济周期影响的净资产收益率
净利润动量
营业收入动量
动量模块 总收益动量
一致预期变动
等级1
等级2
等级3
等级4
等级5
图 3:EPE30 组合的累计收益/相对收益
5000 4000 3000 2000 1000
0
25% 20% 15% 10% 5% 0% ‐5% ‐10% ‐15% ‐20%
2007‐01 2007‐04 2007‐07 2007‐10 2008‐01 2008‐04 2008‐07 2008‐10 2009‐01 2009‐04 2009‐07 2009‐10 2010‐01 2010‐04 2010‐07 2010‐10
累积分布(左)
2009‐10
0.14
2010‐01
0.17
2010‐04
2008‐04
-0.04
图 4:EPE30 组合的换手率
45% 40% 35% 30% 25% 20% 15% 10%
5% 0%
平均换手率44.1%
2009‐04
2009‐01
2008‐10
2008‐07
2008‐01
2007‐10
30组合 相对收益率(右) 市场 累积收益率(左)
30组合 累积收益率(左)
数据来源:光大证券、Wind
图 2:EPE 各分位数组合的年化收益率
40% 35% 30% 25% 20% 15% 10%
5% 0%
等级1
等级2
等级3
等级4
等级5
图 4:EPE30 组合的信息系数
0.25 0.2
0.15 0.1
PE
0.99 0.99 0.95 0.52 0.99 0.98
EPE 1 1
0.95 0.63
1 0.99
P6
(3)从股票评级到股票筛选
组合构建:设定筛选规则,构建投资组合;
股票评级
股票名称 股票评级
兴业银行 交通银行 华夏银行 国元证券 民生银行 中国银行
☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆ ☆☆☆☆ ☆☆☆☆
P11
单指标检验举例:EPE
图 1:EPE30 组合的相对收益率分布
0.14
1.2
0.12
1.0
0.10
0.8
0.08 0.6
0.06
0.04
0.4
0.02
0.2
0.00
0.0
0.33
0.27
0.21
0.14
0.08
0.02
-0.04
-0.10
-0.16
-0.22
-0.29
-0.35
-0.47
频率(右)
指标构建
•选择因子
股票评级
•设定权重
组合构建
•筛选股票
回溯测试
•评估模型
策略优化
•优化权重
投资思想
量化
交易
P14
主要内容 1. 因子选股流程 2. 已研究的量化因子 3. 我们的定期产品 4. 总结及未来研究方向
15
已研究的量化因子
价值模块 剔除非经常性项目的市盈率
基于一致预期的市盈率 剔除经济周期影响的市盈率
PE
0.99 0.99 0.95 0.52 0.99 0.98
EPE
1 1 0.95 0.63 1 0.99
投资组合
得分最高的10%的股票; 得分最高的30只股票; 得分最高的金融行业的10只股票; …….
P7
(4)回溯测试
回溯测试:对因子和模型进行统计测试和检验;
投资组合
得分最高的30只股票;
3
因子选股:从想法到交易
一个不错的 投资想法
买还是卖? 量是多少?
P4
(1)从投资想法到指标
指标构建:
设计选择能够描述投资思想的可量化指标;
市盈率
PE EPE
例:价值被低估的股 票未来价值会回归
市净率
PB EPB
P5
(2)从量化指标到股票评级
股票评级:设定股票池/时间
区间/权重,计算个股得分;
P18
(3)时间分析-(A) 整体分析
• RPE • EPE
• QM • QM_GA
表现最好 表现最好
单因素模型 多因素模型
表现最差 表现最差 单因素模型 多因素模型
• ROE • TM • ES
数据来源:光大证券、Wind
• MM_GA • GM_GA
P19
(3)时间分析-(A) 整体分析
2007年1月至2010年10月:
盈利惊喜
总收益率稳定性
盈利稳定性 可预测性模块
一致预期准确度
非经常性项目频率
含义 总市值/净利润 总市值/未来12个月的预测净利润 过去5年的平均市盈率 按照三阶段股利折现模型计算的股价的隐含收益率 总市值/净资产 股息/总市值 过去5年的净利润复合增长率 过去5年的营业收入复合增长率 过去5年的股息复合增长率 股价隐含收益率的变化 净利润/净资产 未来12个月的预测净利润/净资产 过去5年的平均净资产收益率 净利润增长率的年度变化 营业收入增长率的年度变化 总收益增长率的月度变化 预测净利润的月度变化率 预测净利润增长率 总收益率过去2年的标准差 净利润过去2年的标准差 预测净利润最大值/最小值-1 非经常项目/净资产
平均换手率 28.60% 22.10% 20.10% 76.90% 24.40% 20.00% 17.40% 12.20% 11.90% 91.60% 34.50% 29.50% 12.20% 22.70% 16.80% 96.80% 92.40% 29.50% 39.70% 24.90% 39.20% 21.10% 38.30% 38.40% 78.60% 24.70% 44.20%
– 收益率分析:累计/相对/绝对收益率,累计分布、信息系数 – 交易分析:交易成本影响,组合换手率
表 1:2007 年 1 月-2010 年 10 月 EPE 各分位数组合的业绩
2007 年 1 月-2010 年 10 月
组合 等级 1 等级 2 等级 3
平均收益率 年化收益率
2.3%
18.5%
2.5%
TM
ER
EP
TS
稳定性
ES CEE
NRIF
VM
GM
多因素
MM
PM
QM
数据来源:光大证券、Wind
平均信息系数 2.30% 4.70% 5.10% 0.30% 7.60% 4.10% -2.50% -1.50% -1.90% 2.10% -3.40% 1.10% -2.10% 1.00% 1.10% -1.80% 3.00% 0.40% 2.10% 0.70% 1.20% 0.60% 4.80% -2.70% -1.40% 1.20% 0.30%
市盈率
PE EPE
设定股票池:全部A股 设定时间区间:2007年1月-2010年12月
指标标准化:方向/量纲;
市净率
PB EPB
数据来源:光大证券、Wind
设定权重:(.25,.25,.25,.25)
个股评级:
股票名称
兴业银行 交通银行 华夏银行 国元证券 民生银行 中国银行
股票评级
☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆ ☆☆☆☆ ☆☆☆☆
P22
(3)时间分析-(C)阶段分析
根据市场走势,划分为四个阶段:
●2007年1月-2007年10月; ● 2007年11月-2008年11月; ●2008年12月-2009年7月; ● 2009年8月-2010年10月;
7000 6000 5000 4000 3000 2000 1000
0
数据来源:光大证券、Wind
——2011年中期金融工程投资策略专题
金融工程研究团队 2011年6月16日
证券研究报告
主要内容 1. 因子选股流程 2. 已研究的量化因子 3. 我们的定期产品 4. 未来研究方向
2
主要内容 1. 因子选股流程 2. 已研究的量化因子 3. 我们的定期产品 4. 总结及未来研究方向
58.7% 65.2% 0.0%
P10
单指标检验举例:EPE
图 1:EPE 各分位数组合的累积收益
4000 3500 3000 2500 2000 1500 1000
500 0
累积收益
2006‐12 2007‐03 2007‐06 2007‐09 2007‐12 2008‐03 2008‐06 2008‐09 2008‐12 2009‐03 2009‐06 2009‐09 2009‐12 2010‐03 2010‐06 2010‐09
累积分布(左)
0.00%
-0.41
图 3:交易成本对 EPE30 组合的影响
6000 5000 4000 累 积 3000 收 益 2000 1000
0
交易成本
数据来源:光大证券、Wind
0.96%
0.90%
0.84%
0.78%
0.72%
0.66%
0.60%
0.54%
0.48%
0.42%
0.36%
0.30%
0.24%
0.18%
0.12%
0.06%
图 2:EPE30 组合的绝对收益率分布
0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00
1.2 1.0 0.8 0.6 0.4 0.2 0.0
Baidu Nhomakorabea
0.10
0.07
0.03
0.00
-0.08
-0.11
-0.15
-0.18
频率(右)
2007‐07
2007‐04
2007‐01
换手率
2010‐07
2009‐07
P12
(5)策略优化
策略优化:因子权重的动态调整和优化,最优时间区间等;
原始策略
PE/EPE/PB/EPB 等权重 每月筛选
优化目标函数设定 优化算法选择
优化算法历史回溯期 最优指标权重 优化后的策略
P13
(6)因子选股的整体流程
– 综合模型QM、QM_GA及单因素模型RPE、EPE表现最好 ;
– 在多因素模型中,QM及其优化模型QM_GA的表现最好, 而在各个模块中表现较好的是价值模型VM和成长模型GM, 然后是稳定性模型PM和动量MM;
– 单因素模型中表现最好的RPE、EPE、NPE、DY和ER,表 现最差的是ROE、TM、ES;
上证指数收盘价
P23
(3)时间分析- (C)阶段分析
• RPE • EPE
• QM • QM_GA
20.9%
2.9%
26.5%
标准差
13.5% 13.2% 13.6%
胜出比率
56.5% 58.7% 58.7%
组合 等级 4 等级 5 沪深 300
平均收益率 年化收益率
3.2%
30.6%
3.6%
36.3%
1.7%
12.2%
数据来源:光大证券、Wind
标准差
13.8% 13.9% 12.5%
胜出比率
0.05 0
‐0.05 ‐0.1
‐0.15 ‐0.2
‐0.25
平均信息系数4.7% 信息系数
2007‐01 2007‐04 2007‐07 2007‐10 2008‐01 2008‐04 2008‐07 2008‐10 2009‐01 2009‐04 2009‐07 2009‐10 2010‐01 2010‐04 2010‐07 2010‐10
回溯测试
单调性; 可预测性; 收益率分析; 交易分析;
P8
因子有效性的两个重要方面
单调性 – 检验指标是否具有一致性,得分高的股票收益 率是否高于得分低的股票;
可预测性 – 检验指标是否具有预测能力,即指标与收益率 之间是否存在相关性;
P9
单指标检验举例:EPE
分位数组合
– 平均/年化收益率、胜率 单指标组合
2007年1月至2010年10月:
– 综合模型QM、QM_GA及单因素模型RPE、EPE表现最好; – 多因素模型中,QM、QM_GA表现最好,而在各个模块中表
现较好的是GM、VM,然后是MM和PM; – 单因素模型中,表现最好的RPE、EPE、ER和DY,表现最
差的是TM、ROE、ES; – 优化未必能提高组合的绩效;
更新频率 每月 每月 每月 每月 每月 每月 每季 每季 每季 每月 每季 每月 每季 每季 每季 每月 每月 每月 每月 每季 每月 每季
P17
(2)回溯分析
多数因子具有一定的单调性和可预测性
模块
指标
RPE
EPE
价值
NPE DDM
DY
PB
EG
RG
DG
成长
PG
ROE
EROE
NROE
EM
RM
动量
三阶段股利折现模型 股息收益率 市净率 动量模块 净利润动量
营业收入动量 总收益动量
一致预期变动 盈利惊喜
价值
成长
量化模型
动量
可预测性
成长模块 净利润增长率 营业收入增长率 股利增长率
价格增长 净资产收益率 预测净资产收益率 剔除周期影响的净资产收益
率 可预测性模块 总收益率稳定性
盈利稳定性 一致预期准确度 非经常性项目占比
– 优化作用有限;
P20
(3)时间分析-(B)年度分析
• RPE • EPE
• QM • QM_GA
表现最好 表现最好
单因素模型 多因素模型
表现最差 表现最差 单因素模型 多因素模型
• TM • ROE • ES
数据来源:光大证券、Wind
• VM_GA • PM
P21
(3)时间分析-(B)年度分析
P16
(1)因子算法
模块
指标
剔除非经常性项目影响的市盈率
预测市盈率
剔除经济周期影响的市盈率 价值模块
三阶段股利折现模型
市净率
股息收益率
净利润增长率
营业收入增长率
股利增长率
成长模块 价格增长
净资产收益率
预测净资产收益率
剔除经济周期影响的净资产收益率
净利润动量
营业收入动量
动量模块 总收益动量
一致预期变动
等级1
等级2
等级3
等级4
等级5
图 3:EPE30 组合的累计收益/相对收益
5000 4000 3000 2000 1000
0
25% 20% 15% 10% 5% 0% ‐5% ‐10% ‐15% ‐20%
2007‐01 2007‐04 2007‐07 2007‐10 2008‐01 2008‐04 2008‐07 2008‐10 2009‐01 2009‐04 2009‐07 2009‐10 2010‐01 2010‐04 2010‐07 2010‐10
累积分布(左)
2009‐10
0.14
2010‐01
0.17
2010‐04
2008‐04
-0.04
图 4:EPE30 组合的换手率
45% 40% 35% 30% 25% 20% 15% 10%
5% 0%
平均换手率44.1%
2009‐04
2009‐01
2008‐10
2008‐07
2008‐01
2007‐10
30组合 相对收益率(右) 市场 累积收益率(左)
30组合 累积收益率(左)
数据来源:光大证券、Wind
图 2:EPE 各分位数组合的年化收益率
40% 35% 30% 25% 20% 15% 10%
5% 0%
等级1
等级2
等级3
等级4
等级5
图 4:EPE30 组合的信息系数
0.25 0.2
0.15 0.1
PE
0.99 0.99 0.95 0.52 0.99 0.98
EPE 1 1
0.95 0.63
1 0.99
P6
(3)从股票评级到股票筛选
组合构建:设定筛选规则,构建投资组合;
股票评级
股票名称 股票评级
兴业银行 交通银行 华夏银行 国元证券 民生银行 中国银行
☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆ ☆☆☆☆ ☆☆☆☆
P11
单指标检验举例:EPE
图 1:EPE30 组合的相对收益率分布
0.14
1.2
0.12
1.0
0.10
0.8
0.08 0.6
0.06
0.04
0.4
0.02
0.2
0.00
0.0
0.33
0.27
0.21
0.14
0.08
0.02
-0.04
-0.10
-0.16
-0.22
-0.29
-0.35
-0.47
频率(右)
指标构建
•选择因子
股票评级
•设定权重
组合构建
•筛选股票
回溯测试
•评估模型
策略优化
•优化权重
投资思想
量化
交易
P14
主要内容 1. 因子选股流程 2. 已研究的量化因子 3. 我们的定期产品 4. 总结及未来研究方向
15
已研究的量化因子
价值模块 剔除非经常性项目的市盈率
基于一致预期的市盈率 剔除经济周期影响的市盈率
PE
0.99 0.99 0.95 0.52 0.99 0.98
EPE
1 1 0.95 0.63 1 0.99
投资组合
得分最高的10%的股票; 得分最高的30只股票; 得分最高的金融行业的10只股票; …….
P7
(4)回溯测试
回溯测试:对因子和模型进行统计测试和检验;
投资组合
得分最高的30只股票;
3
因子选股:从想法到交易
一个不错的 投资想法
买还是卖? 量是多少?
P4
(1)从投资想法到指标
指标构建:
设计选择能够描述投资思想的可量化指标;
市盈率
PE EPE
例:价值被低估的股 票未来价值会回归
市净率
PB EPB
P5
(2)从量化指标到股票评级
股票评级:设定股票池/时间
区间/权重,计算个股得分;
P18
(3)时间分析-(A) 整体分析
• RPE • EPE
• QM • QM_GA
表现最好 表现最好
单因素模型 多因素模型
表现最差 表现最差 单因素模型 多因素模型
• ROE • TM • ES
数据来源:光大证券、Wind
• MM_GA • GM_GA
P19
(3)时间分析-(A) 整体分析
2007年1月至2010年10月:
盈利惊喜
总收益率稳定性
盈利稳定性 可预测性模块
一致预期准确度
非经常性项目频率
含义 总市值/净利润 总市值/未来12个月的预测净利润 过去5年的平均市盈率 按照三阶段股利折现模型计算的股价的隐含收益率 总市值/净资产 股息/总市值 过去5年的净利润复合增长率 过去5年的营业收入复合增长率 过去5年的股息复合增长率 股价隐含收益率的变化 净利润/净资产 未来12个月的预测净利润/净资产 过去5年的平均净资产收益率 净利润增长率的年度变化 营业收入增长率的年度变化 总收益增长率的月度变化 预测净利润的月度变化率 预测净利润增长率 总收益率过去2年的标准差 净利润过去2年的标准差 预测净利润最大值/最小值-1 非经常项目/净资产
平均换手率 28.60% 22.10% 20.10% 76.90% 24.40% 20.00% 17.40% 12.20% 11.90% 91.60% 34.50% 29.50% 12.20% 22.70% 16.80% 96.80% 92.40% 29.50% 39.70% 24.90% 39.20% 21.10% 38.30% 38.40% 78.60% 24.70% 44.20%
– 收益率分析:累计/相对/绝对收益率,累计分布、信息系数 – 交易分析:交易成本影响,组合换手率
表 1:2007 年 1 月-2010 年 10 月 EPE 各分位数组合的业绩
2007 年 1 月-2010 年 10 月
组合 等级 1 等级 2 等级 3
平均收益率 年化收益率
2.3%
18.5%
2.5%
TM
ER
EP
TS
稳定性
ES CEE
NRIF
VM
GM
多因素
MM
PM
QM
数据来源:光大证券、Wind
平均信息系数 2.30% 4.70% 5.10% 0.30% 7.60% 4.10% -2.50% -1.50% -1.90% 2.10% -3.40% 1.10% -2.10% 1.00% 1.10% -1.80% 3.00% 0.40% 2.10% 0.70% 1.20% 0.60% 4.80% -2.70% -1.40% 1.20% 0.30%
市盈率
PE EPE
设定股票池:全部A股 设定时间区间:2007年1月-2010年12月
指标标准化:方向/量纲;
市净率
PB EPB
数据来源:光大证券、Wind
设定权重:(.25,.25,.25,.25)
个股评级:
股票名称
兴业银行 交通银行 华夏银行 国元证券 民生银行 中国银行
股票评级
☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆☆ ☆☆☆☆ ☆☆☆☆ ☆☆☆☆
P22
(3)时间分析-(C)阶段分析
根据市场走势,划分为四个阶段:
●2007年1月-2007年10月; ● 2007年11月-2008年11月; ●2008年12月-2009年7月; ● 2009年8月-2010年10月;
7000 6000 5000 4000 3000 2000 1000
0
数据来源:光大证券、Wind