Chinascope数库多因子量化投资平台

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(无需平均)时:

所有指标取最近报告期值即可

2. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(需平均)时:

资产负债表平均指标=(期初值+最近报告期值)/2,其他指标取最近报告期值

3. 同时涉及利润表(或现金流量表)指标和资产负债表指标(无需平均)时:资

产负债表非平均指标直接取最近报告期值;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.

4. 同时涉及利润表(或现金流量表)指标和资产负债表指标(需平均)时:资产

负债表平均指标=(年初值+本期期末值)/2;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.

•LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM

1. LTM因子同时涉及利润表(或现金流量表)指标和资产负债表指标时:利润表

指标取最近12个月数值;资产负债表指标取平均值,平均值=(本期报告值+上年同期值)/2

2. LTM因子仅涉及利润表和现金流量表指标时:利润表和现金流量表指标取最近

12个月数值。

财务因子数据映射说明

由于财务数据一般每季度公布一次,且通常会延迟公布(一季度与上一年四季度数据一般在今年4月底全部公布,二季度在8月底公布,三季度在10月底公布),所以将季度数据转换为更高频率数据时采用以下逻辑:

•1、2、3月底采用上一年Q3的数据;

Ⅱ. 因子目录

1. 数据概览

单因子有效性评价首页为数据概览界面,基本参数设置同上,该界面呈现如下内容:

•近12期所选股票池的因子值分布箱形图

•近12期所选股票池的收益率分布箱形图

•近12期股票覆盖率序列图(股票覆盖率:即每期被纳入到选股范围的股票占股票池所有股票的百分比)

•单期因子值分布直方图

•单期股票收益率和因子值散点图

•单期各档收益率分布:横轴为按照所选‘因子方向’排序后划分为10组,纵轴为每组内股票收益率的分布

箱形图

又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。

2 . IC分析

信息系数相关算法

•图-因子自相关序列:即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。

3 . 收益率分析收益率相关指标算法

4 .换手率分析换手率算法

5 . 选股结果

6 . 月历效应

金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。

•因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应;

•因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。

Ⅳ因子对比

Ⅴ因子收藏

等;

Ⅶ算法说明

单因子评价算法逻辑

因子数据获取与处理流程:

•根据回测起始日期确定所涉及到的财报报告期;

•根据起始日期与调仓频率确定回测期间的调仓期(具体的日期);

•根据调仓期与财务数据映射原则确定所用到财报报告期;

•跟据用户输入的参数从数据库中提取原始数据,原始数据有三个维度:报告期,股票名,因子值;

•对原始数据进行去极值和标准化处理;

•将原始数据的频率转换至用户设定的调仓周期。

MAD去极值处理

去极值算法的主要目的是为了使因子数据在一个合理的范围之内。去极值的方法主要有两种:MAD去极值法和标准差去极值法,主要区别是对极值定义不一样。

f′i=⎧⎩⎨f m+nf MAD f m−nf MAD f i if f i>u+nf MAD if f iu+nfMADfm−nfMADif fi

nfMAD

f m为f i序列中位数fm为fi序列中位数

f MAD为|f i−f m|的中位数fMAD为|fi−fm|的中位数

标准化处理

标准化处理使得每个报告期的所有因子的横截面数据都在一个固定范围内,处理的逻辑是用每个元素减去均值再除以标准差,主要有普通标准化和行业标准化,区别是因子暴露值的均值和标准差计算方式不同,行业标准化需要分别计算各股票所在行业的因子值的均值和标准差。

f i=f rawi−uσfi=firaw−uσ

f i为标准化后的修正值fi为标准化后的修正值

f rawi:原始数值firaw:原始数值

u:f i序列均值u:fi序列均值

σ:f i序列标准差σ:fi序列标准差

IC信息系数

IC(Information Coefficient,信息系数):

•normalIC,即某时点某因子在全部股票的暴露值与其下期回报的截面相关系数;

normalIC=corr(factor t−1,return t)normalIC=corr(factort−1,returnt) factor t−1为t-1期的因子值factort−1为t-1期的因子值

return t为t期的因子收益率returnt为t期的因子收益率•rankIC,即某时点某因子在全部股票暴露值排名与其下期回报排名的截面相关系数;

rankIC=corr(order factort−1,order returnt)rankIC=corr(ordert−

1factor,ordertreturn)

order factort−1为各股票t-1期的因子值排名ordert−1factor为各股票t-1期的因

子值排名

order returnt为各股票t期的因子收益率排名ordertreturn为各股票t期的因子

收益率排名

因子收益率相关指标

平均收益率

R avg=1t∑i=1t R t Ravg=1t∑i=1tRt

t为总样本期数t为总样本期数

R t为因子t期的当期收益率Rt为因子t期的当期收益率

累计收益率

R cumt=Π((1+R1)⋯(1+R t))−1Rtcum=Π((1+R1)⋯(1+Rt))−1

年化收益率

相关文档
最新文档