基于多因子选股策略的量化投资研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.4 多因子策略及其实证研究
4.4.1 回归模型的建立 确认最终的选股因子后,我们选择上证 50 指数成份股作为本策略的实证研 究对象,利用回归法来解决问题。由于无法从 Matlab 中读取数据,所以通过其 他途径搜集到相关因子数据,具体数据见附录。 首先,我们通过 6 月末的因子和 9 月末的收益率,建立以下回归模型:
0 1
5.2601
[4.1764,12.1134]
5
2
3
8.1449 -0.7637 -0.4700
Fra Baidu bibliotek
[-1.4823,0.5422]] [-1.7995,0.2722] [-0.8286,1.2868] [-0.1218,0.2906]
4
5
0.2291
6 7
8
0.0844
[ -0.2199,0.2500]
基于多因子选股策略的量化投资研究 摘要
选股问题一直是众多股市投资者极为关心的问题,选出具有投资价格的个 股进行投资,能使得投资者的财富快速增长。量化投资作为一种投资方法,运用 数学与计算机技术的手段,按照一定的规则进行投资、交易,具有可规模化、 自 动化的特点。 本文设定在经济学家罗斯的量化多因子模型框架之下,利用套利定价理论 (APT)相关知识,选用回归法,以上证 50 指数成份股作为研究对象,对多因子 量化选股策略进行研究。研究结果表明,每股资本公积金、每股经营性现金流、 净利率、毛利率、营业利润率、资金周转率因素作为选股因子,以 2014.03.22-2014.6.20 为回验期,运用该策略可以获得更高的收益。 最后, 本文对上述多因子策略研究, 进行总结, 对研究存在的问题提出建议, 并指明研究的进一步方向。
4.3 因子库的建立
一般来说, 依据证券投资学中的理论,证券投资的基本面分析需要从宏观经 济、行业、公司三个维度来挑选因子,其次本文研究的是量化选股策略,着重于 量化研究,一些无法量化或难以量化的因素将不纳入研究范围。基于上述原则, 我们可以从盈利能力、营运能力、资本结构、基本面这四个角度搜集因子。 从常规角度进行因子选取后,我们也不应忽略对市场异象的研究。从 Fama, French,Carhart 等人的研究结果,我们可以了解到估值,市值规模、市场行情, 也是值得我们在意的三个方面。 4.3.1 盈利能力 (1)收益率 是指投资的回报率,一般以年度百分比表达,根据当时市场价格、面值、 息 票利率以及距离到期日时间计算。对公司而言,收益率指净利润占使用的平均资 本的百分比。收益率研究的是收益率作为一项个人(以及家庭)和社会(政府公 共支出)投资的收益率的大小,可以分为个人收益率与社会收益率,主要关注的 是前者。 (2)毛利率(Profit margin) 又称销售毛利率,是一个衡量盈利能力的指标,通常用百分数表示。在经济 含义中,毛利率越高则说明企业的盈利能力越高,控制成本的能力越强。但是对 于不同规模和行业的企业,毛利率的可比性不强。 (3)净利率 也可以叫净利润率、销售净利率、销售利润率、经营净利率、主营业务利润 率,其实指的都是一样东西,说明企业收入 1 块钱能净赚多少钱,看该指标的时 候可以和毛利率比较一下,两者越接近说明企业的期间费用越低。 (4)营业利润率 是指企业的营业利润与营业收入的比率。它是衡量企业经营效率的指标, 反 映了在不考虑非营业成本的情况下,企业管理者通过经营获取利润的能力。 4.3.2 营运能力 资金周转率是反映资金周转速度的指标。企业资金(包括固定资金和流动资 金)在生产经营过程中不间断地循环周转,从而使企业取得销售收入。企业用尽 可能少的资金占用,取得尽可能多的销售收入,说明资金周转速度快,资金利用 效果好。 4.3.3 基本面 (1)每股净资产值 反映了每股股票代表的公司净资产价值,为支撑股票市场价格的重要基础。 每股净资产值越大,表明公司每股股票代表的财富越雄厚,通常创造利润的能力 和抵御外来因素影响的能力越强。 净资产收益率是公司税后利润除以净资产得到 的百分比率,用以衡量公司运用自有资本的 效率。
1
二、策略假设
1. 未来的行情由现在的行情决定; 2. 对于一些难以量化或者无法量化的因素不纳入研究范围; 3. 市场投资具有一致的预期,他们都是风险厌恶者,并且具有单调递增的效用 函数; 4. 资本市场是无摩擦的,即不存在交易成本、所得税等额外的费用; 5. 资本市场达到均衡时,市场上不存在套利机会,这种均衡也叫做无套利均衡。
三、符号说明
变量 含义 每股收益 每股净资产 每股未分配利润 每股资本公积 每股经营性现金流 净利率 毛利率 营业利润率 资金周转率
x1 x2 x3 x4 x5 x6
x7 x8 x9
四、策略的建立与求解
4.1 策略建立
多因子模型是目前应用最广的选股模型, 其基本思想是选出一系列有效因子 来作为选股标准,买入因子看多的是股票组合,从而获得组合收益。国内常用的
关键词: 多因子策略
量化选股
回归法
Matlab 程序

、研究背景
由于国内金融产品创新受限, 目前量化投资对象大多集中在股指期货和股票 上,自 2010 年 3 月 31 日起正式开通融资融券交易系统以来,在 A 股卖空需求的 促进下,融资融券规模节节攀升,已成为一支不可忽视的力量。随后 2013 年 2 月 28 日转融资试点的正式启动更是意味着全面做空 A 股时代的来临,可以说, 转融资的推出对量化投资者来说是一个重要的机遇,也是一个新的启程点。 量化投资,是近十几年来,业内新兴的一种投资方式。通过建立量化投资指 标体系,选用一系列数理工具及数理模型,并辅以计算机编程,量化投资对投资 者的投资决策提供支持和帮助。 与传统的投资策略相比,量化投资策略更注重策 略的纪律遵守, 更注重交易机会的精确判断, 更注重交易机会的及时把握。 因此, 量化投资策略受到投资者,尤其是机构投资者的广泛关注。 多因子模型是量化投资选股中最重要的一类模型, 其基本思想就是找到某些 和收益率最相关的指标。并根据该指标,构建一个股票组合,期望该组合在未来 的一段时间跑赢或者跑输指数。如果跑赢,则可以做多该组合,同时做空期指, 赚取正向阿尔法收益;如果是跑输,则可以做多期指,融券做空该组合,赚取反 向阿尔法收益。多因子模型的关键是找到因子与收益率之间的关联性 。一般而 言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权 得到一个总分, 根据总分再对股票进行筛选。回归法就是用过去的股票的收益率 对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得 到一个对未来股票收益的预判,然后再以此为依据进行选股。
2
多因子选股方法有打分法与回归法两种。多因子策略思想由套利定价公式理论 (简称 APT)而来,套利是一个经济学术语,是指利用完全相同的一个实物资产 或证券的不同价格赚取无风险利润的行为, 在投资学中是指保证在某些情况下获 取正收益并没有遭受损失的投资策略, 套利定价理论考虑了影响证券收益率的多 种因素, 其对证券收益率的解释以多因子模型为基础,认为证券的收益率是一组 影响证券收益基本因素的线性函数。 4.1.1 套利定价理论的基本假设 1.市场投资者具有一致的预期, 他们都是风险厌恶者,并且具有单调递增的有效 函数 2.资本市场是无摩擦的,即不存在交易成本、所得税等额外的费用。 3.资本市场达到均衡时,市场上不存在套利机会,这种均衡也叫做无套利均衡。 4.1.2 套利定价理论的基本公式 罗斯提出的套利定价理论公式是一份多因素模型, 假设所有证券的收益率受 到 K 个共同因素的 F1 , F2 ,....Fx 的影响,则证券的收益率由如下方程表示:
3
2.利用上月末的因子与本月末的收益率进行横截面回归得到因子回报系数, 若因 子回报系数绝对值大于 2 则认为是极端值,删除该因子; 3.利用得到的因子回报系数与本月末的因子进行回归,得到下月末的预期收益 率; 4.根据预期收益率大小排序,前面的最大的做多,后面最小的做空,最后得出投 资组合收益率。
E ( Rit ) i bi1 E ( F1 ) bi 2 ( F2 ) ...... bik E ( Fk ) i bik E ( Fk )
k 1
k
如果上述套利定价理论公式成立,那么证券市场上是不存在套利机会的
4.2 实证检验思路
在多因子策略的模型下, 我们选用回归法来进行选股。多因子回归法就是用 过去的股票的收益率对多因子进行回归,得到一个回归方程,然后把最新的因子 值带入回归方程得到一个对未来股票收益的预判,最后以此为依据进行选股。 具 体步骤如下: 1.选择实证对象为哪一家的多少成分股,回验周期为多少;
4
(2)每股盈利 即 EPS,又称每股收益、每股税后利润、每股盈余,指税后利润与股本总数 的比率。 它是测定股票投资价值的重要指标之一,是分析每股价值的一个基础性 指标, 是综合反映公司获利能力的重要指标,它是公司某一时期净利润与股份数 的比率。 (3)每股经营现金流 是最具实质的财务指标, 其用来反映该公司的经营流入的现金的多少,如果 一个公司的每股收益很高 或者每股未分配利润也很高,如果现金流差的话,意 味该上市公司没有足够的现金来保障股利的分红派息, 那只是报表上的数字而已 没有实际的意义。 4.3.4 资本结构 (1)每股未分配利润 每股未分配利润=企业当期未分配利润总额/总股本,未分配利润是企业留待 以后年度进行分配的结存利润, 未分配利润有两个方面的含义:一是留待以后年 度分配的利润; 二是尚未指定特定用途的利润。资产负债表中的未分配利润项目 反映了企业期末在历年结存的尚未分配的利润数额, 若为负数则为尚未弥补的亏 损。 (2)资本公积金 是指从公司的利润以外的收入中提取的一种公积金。 其主要来源有股票溢价 收入,财产重估增值,以及接受捐赠资产等。每股资本公积金,主要是弥补公司 亏损、扩大公司生产经营活动和增加公司注册资本。
0.0150 0.0045 0.0402
[-0.0994,0.1083] [ -0.1731,0.2535] [ 0.5831,7.4090]
9
R 2 0.6167, F 7.1510, p 0.000
F1t , F2t ,......, Fkt 都为零时,证券 i 的收益率。这些参数之间还满足如下关系:
1. COV ( Fi , Fj ) COV ( Fi , j ) COV ( J , J ) 0 2. E ( i ) 0 3. Var ( Fk ) 1 对上面的方程取数学期望,因此得到证券收益率为:
Rit i bi1 F1t bi 2 F2t ...... bik Fkt it i bik Fik it
k 1
k
其中。 R it 表示证券 i 在 t 时期的收益率; F1t , F2t ,......, Fkt 表示对证券收益率存在 影响的 K 个因素 t 时期的收益率; bi1 , bi 2 ,......, bik 表示这 K 个因素对收益率的影响 系数; i 为截距项,表示当
y 0 1 x1 2 x2 3 x3 4 x4 5 x5 6 x6 7 x7 8 x8 9 x9
(其中 y 表示 9 月末的收益率, x1 , x2 , x3 , x4 x5 x6 , x7 , x8 , x9 表示 6 月末的相关因 子数据, 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 表示因子回报系数, 0 表示误差) 利用 matlab 的统计工具拟合得到回归系数以及置信区间(置信度为 0.05), 检验统计量 R 2 , F , p 的结果如下表: 表1 参数 模型参数的估计结果 1 参数估计值 3.9960 置信区间 [2.3581,8.1620]
相关文档
最新文档