Chinascope数库多因子量化投资平台

合集下载

47. 如何在量化分析中实现多因子模型？

47. 如何在量化分析中实现多因子模型？47、如何在量化分析中实现多因子模型？在当今的金融投资领域，量化分析已经成为一种重要的工具，而多因子模型则是量化分析中的核心方法之一。

多因子模型通过综合考虑多个因素来预测资产的收益和风险，为投资决策提供有力的支持。

那么，如何在量化分析中实现多因子模型呢？这可不是一个简单的问题，需要我们从多个方面进行深入的探讨和研究。

首先，我们要明确多因子模型的基本概念。

多因子模型认为，资产的收益可以由多个共同的因子来解释。

这些因子可以是宏观经济因素，比如通货膨胀率、利率、经济增长率等；也可以是公司基本面因素，如盈利能力、偿债能力、成长能力等；还可以是市场情绪因素，例如投资者的恐慌指数、市场的波动率等。

通过对这些因子的分析和建模，我们可以预测资产的未来表现。

接下来，就是数据的收集和预处理。

这是实现多因子模型的重要基础。

数据的质量和完整性直接影响到模型的准确性和可靠性。

我们需要收集大量的历史数据，包括资产的价格、财务报表数据、宏观经济数据等等。

同时，还要对这些数据进行清洗和预处理，去除异常值、缺失值，进行标准化和归一化处理，以确保数据的一致性和可比性。

在数据准备好之后，就可以进行因子的选择了。

这是一个关键的步骤，需要结合理论和实践经验。

我们可以通过对经济理论的研究、对市场的观察以及对历史数据的分析，来初步筛选出可能影响资产收益的因子。

然后，通过统计检验和经济意义检验，进一步确定有效的因子。

比如，我们可以使用 t 检验、F 检验等方法来检验因子的显著性，判断它们是否对资产收益有显著的影响。

有了因子之后，就要对因子进行量化和构建因子指标。

这需要我们根据因子的特点和数据的特点，选择合适的量化方法。

比如，对于盈利能力这个因子，我们可以用净利润率、净资产收益率等指标来量化；对于市场情绪因子，我们可以用波动率、恐慌指数等指标来量化。

在构建因子指标时，要注意指标的合理性和有效性，避免过度拟合和数据挖掘偏差。

多因子量化模型简介

o 市场中的小市值、价值股表现明显超过市场，
而这一效应不能用CAPM模型解释
o 1981年，大卫·布斯和雷克斯·桑奎菲尔德成立
了维度投资顾问公司（Dimensional Fund
Advisors），买入小市值、估值低的股票，获
得了高额回报
超额收益
组合波动性高于市场
beta<1:
组合波动性低于市场
11
CAPM模型的应用：
被动型基金
o 统计分析发现，股票扣除交易费用后净回报的平均
alpha为接近0的负数，说明股票市场对风险的补偿非
常有效
o 迈克尔·詹森、约翰·博格发现，股票型共同基金的
alpha接近0，四分之三的股票型基金回报不及市场指
=0
= −

∙
2
久期与大类资产
Discount rate change and Duration for selected assets from 2009-10 to year-end 2015
1.0%
MSCI
Emerging
0.5%
Change in Discount Rate
M
有效组合的超额收益来自其风险Leabharlann rF0P9
证券市场线
o 单个证券i的期望收益率与其对市场方差的贡献率 i 之间存在线性关系，
而不像有效组合那样与标准差（总风险）有线性关系
o 这一线性关系在以 E[ri ] 为纵坐标、 i 为横坐标的坐标系中代表一条直线，
这条直线被称为证券市场线（security market line, SML）
多因子量化模型简介
量化 vs 非量化 (有非量化吗?)
修正持久期是衡量价格对收益率变化的敏感度的指标。在市场利率水平发生一

同心圆众智伟业创投理财系统数据库说明

同心圆众智伟业创投理财系统数据库说明同心圆众智伟业创投理财系统数据库设计说明书1 引言 ..................................................................... (3)1.1 编写目的 ..................................................................... . (3)1.2 背景 ..................................................................... .. (3)1.3 定义 ..................................................................... .. (3)1.4 参考资料 ..................................................................... ........................................ 3 2(外部设计 ..................................................................... .. (3)2.1标识符和状态 ..................................................................... (3)2.2 使用它的程序 ..................................................................... (3)2.3 约定 ..................................................................... . (4)2.4 支持软件 ..................................................................... . (4)3 结构设计 ..................................................................... .. (4)3.1 概念结构设计 ..................................................................... (4)3.2物理结构设计...................................................................... (6)4 运用设计 ..................................................................... .. (7)4.1 数据字典设计 ..................................................................... (7)4.2 安全保密设计 ..................................................................... ................................. 8 5.需求的可追踪性 ..................................................................... (8)1 引言1.1 编写目的数据库设计说明书的编制目的是对于设计中的数据库所有标识、逻辑结构和理结构作出具体的设计规定，是为了让参与本项目的项目主管、业务分析师、项目开发人员、数据库管人员及以后的系统维护人员了解本系统的数据库设计思路、数据库整体架构及各种详细信息，也为了以后的各个项目可以参与借鉴该项目的经验，特编写此文档。

数库多因子量化平台帮助文档

《数库多因子量化平台| 操作指引手册》多因子模型通过寻找与股票未来收益最相关的因子作为选股标准，综合运用多因子构建模型对股票进行评价，选取综合得分高的股票，以期获得超额收益。

数库多因子量化平台，是数库团队依托金融大数据开发的量化平台，克服了传统策略开发过程中的种种问题，力求做到数据权威、因子丰富、回测精准、评价全面、个性化功能更加丰富。

传统策略开发过程中的问题1.数据维护耗时耗力：数据量庞大，从原始数据到因子数据，任何环节出错就会造成策略失真2.计算处理能力受限：个人电脑在处理批量计算时，速度缓慢3.回测结果无法有效保存：无法有效的形成统一规划的可视化输出，策略结果随意保存4.策略不能及时跟踪：策略更新需重复运行代码，无法有效跟踪策略绩效数库能做到的1.更高效、权威、及时的原始数据2.更加全面、丰富的因子库、3.更加精准的回测算法4.更加权威、全面的因子评价指标5.更丰富的自定义功能因子分类【因子目录】财务因子的计算逻辑YTD因子:即后缀为YTD的因子，表示该因子计算所需指标的取值逻辑为YTD1.仅涉及利润表（或现金流量表）指标或仅涉及资产负债表指标（无需平均）时：所有指标取最近报告期值即可2.仅涉及利润表（或现金流量表）指标或仅涉及资产负债表指标（需平均）时：资产负债表平均指标=（期初值+最近报告期值）/2，其他指标取最近报告期值3.同时涉及利润表（或现金流量表）指标和资产负债表指标（无需平均）时：资产负债表非平均指标直接取最近报告期值；利润表或现金流量表的指标，需乘以年化调整系数进行处理，一季度年化系数为4，二季度为2，三季度为4/3，四季度为1.4.同时涉及利润表（或现金流量表）指标和资产负债表指标（需平均）时：资产负债表平均指标=（年初值+本期期末值）/2;利润表或现金流量表的指标，需乘以年化调整系数进行处理，一季度年化系数为4，二季度为2，三季度为4/3，四季度为1.∙LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM1.LTM因子同时涉及利润表（或现金流量表）指标和资产负债表指标时：利润表指标取最近12个月数值；资产负债表指标取平均值，平均值=（本期报告值+上年同期值）/22.LTM因子仅涉及利润表和现金流量表指标时：利润表和现金流量表指标取最近12个月数值。

CSMAR中国股票市场交易数据库

版权与所有权声明
CSMAR®中国股票市场交易数据库（CSMAR® China Stock Market Trading Database）系统是由深圳市国泰安信息技术有限公司设计、开发。系统及其文档的所有权归属于深圳市国泰安信息技术有限公司（以下简称“国泰安信息技术有限公司”、“国泰安公司”或者“ 本公司”），并受中华人民共和国国家《著作权法》、《商标法》和国际协约条款的保护。由国泰安公司负责系统的更新、维护和销售等活动。用户不得从本系统中删去版权声明，要保证为本系统的拷贝（全部或部分）复制版权声明，并同意制止以任何形式非法拷贝本系统及文档。未经授权擅自复制或散布本数据库的部分或全部内容，将会面对民事起诉。 “CSMAR®中国股票市场交易数据库” 的名称已受到注册商标和其它形式的所有权的保护。
一、产品开发说明
做研究难，对中国的证券市场进行研究更难，其中难点之一就是数据的不完整、不准确，尤其是数据的不规范，使得对中国证券市场的研究十分困难。美国股票市场内在机理及发展规律能得到世界各国学者非常全面、细致、彻底的研究，且其研究成果大大推动了金融理论的发展和美国股票市场的规范，这在很大程度上得益于美国股票市场有一个统一的、规范的市场交易数据库 CRSP 和公司财务数据库 Compustat。研究人员可以利用 Fortran、C、Pascal 等语言直接调用 CRSP 和 Compustat 数据库中的数据，对金融理论或模型进行验证。研究人员还可以用多种统计软件包，如 SAS，SPSS 等直接运用 CRSP 和 Compustat 数据库进行实证研究，所以统一与规范的 CRSP 和 Compustat 数据库大大提高了美国股票市场的研究效率。股票市场价格数据用于研究时，有一个很大的麻烦，就是价格或回报率的可比性问题。比如说，某公司股票 1992 年初的发行价为每股 10 元，到 1998 年底的最后一个交易日的交易价为每股 12 元，其间经历了 7 年。如果仅仅根据股票价格原始数据进行比较，这 7 年的回报率仅为 20%，但实际上这家公司在 1993 年拆细（1 拆 2），1994 年送红股（每 10 股送 5 股）， 1995 年进行配股（每 10 股配 3 股），而每年又有红利。因而这家公司的实际回报率远远高于 20%，1998 年底的实际可比价格也远远高于每股 12 元。所以在对股票市场进行研究时，必须对所有的日交易价格或日回报率根据前后可比性原理进行调整，而这需要巨大的工作量。美国芝加哥大学开发的 CRSP 数据库对美国所有上市公司几十年来每天的交易价格进行了调整，这为研究人员带来了很大的方便。同时统一与规范的数据库也方便研究人员对不同的研究结论进行比较和讨论。国内的学者一直没有中国的 CRSP 和 Compustat，使得有关中国股票市场的研究，尤其是实证研究严重滞后，且研究效率极低。比如一篇对中国股市作实证研究的博士论文或研究项目，研究人员一般要花数个月的时间对大量原始的股票交易数据与财务数据进行整理，找出所需要的项目，这样往往涉及大量的手工收集及手工数据录入工作，而且得到的数据常常缺乏系统性、准确性与可信性。此外相当多的研究人员不了解如何对股票价格的前后可比性进行调整。所以，中国股票市场由于缺乏统一与规范的数据库，不仅大大降低了研究效率，增加了研究成本（研究人员的时间是最大的成本），而且也降低了研究结论的可比性和可信性。有鉴于此，国泰安公司希望开发一个中国股票市场研究数据库，经过不懈努力，我们于 2000 年 9 月成功开发 CSMAR 数据库的第一部分：交易数据库，并于 2000 年底完成 CSMAR 财务数据库的开发。CSMAR 数据库的开发严格按照国际标准数据库（CRSP 和 Compustat）的调整技术计算个股收益率，并计算市场日回报率和月回报率。尤其是对历史的原始数据，我们进行了多种方法的严格查证和确认，以保证原始数据的准确性，并以 Foxpro、 Excel、 TXT 等格式提供给用户使用，同时可供 SAS 和 SPSS 等统计软件直接调用。 CSMAR 数据库的开发成功将从根本上解决高等院校的会计与金融学者、金融机构（尤其是证券公司、基金公司、投资银行等）的研究部门等中国金融市场的研究机构和个人所普遍面临的中国股票市场数据不完整、不准确问题，从而建立起深入、全面、有效的研究中国金融市场的资料与数据基础。我们希望中国股票市场研究（CSMAR）数据库的推出，将对我国股票市场的实证研究有一个快速的、高质量的提高，同时提高中国金融市场研究的深度和广度，促进中国金融市场的进一步发展和规范化。

量化和因子池-概述说明以及解释

量化和因子池-概述说明以及解释1.引言1.1 概述量化和因子池是当下投资领域的热门话题，它们代表了投资策略和方法的一种新型趋势。

量化投资是指运用数学模型和统计技术，通过收集和分析大量数据来进行投资决策的一种方法。

而因子池则是指将市场上的投资标的按照一定因子进行分类和分组，以便进行有效的投资组合配置。

本文将深入探讨量化投资和因子池的相关概念，揭示它们在投资领域中的重要性和应用价值。

同时，我们还将探讨量化和因子池之间的关系，帮助读者更好地理解这两个概念在投资实践中的作用和影响。

通过本文的阐述，读者将对量化和因子池有一个更深入的了解，为他们在投资领域中做出更明智的决策提供更多的参考和启发。

1.2 文章结构2.1 文章结构本文将首先介绍量化投资的基本概念和原理，包括量化投资的定义、特点以及在金融市场中的应用。

接着将引入因子池的概念，解释因子池是如何构建和利用的，以及在量化投资中的作用。

最后，将探讨量化投资和因子池之间的关系，包括如何利用因子池来优化量化投资策略以及实现更好的投资回报。

通过对量化和因子池的关系进行深入剖析，希望能够帮助读者更好地理解和运用这两个重要的投资工具。

1.3 目的目的部分主要旨在回答为什么要探讨量化和因子池的关系，其具体目的包括以下几个方面：1. 帮助读者深入了解量化投资与因子池的概念和内涵，从而提升投资者对这两个概念的理解和认识；2. 分析量化投资和因子池之间的关系，探讨二者之间的联系和差异，帮助投资者更好地应用这些概念于实际投资中；3. 探讨量化投资和因子池在实际投资中的应用情况，以及未来的发展趋势，为读者提供对未来投资走势的参考和展望；4. 最终目的是帮助读者更好地理解量化投资和因子池的重要性和作用，以提升他们的投资决策水平，实现更好的投资收益。

2.正文2.1 量化投资介绍量化投资是指利用计算机和数学模型来进行投资决策的一种投资方式。

通过大量的数据分析和量化模型的运用，量化投资能够帮助投资者更加客观地评估投资标的的潜在风险和收益，并制定出更为科学的投资策略。

博时量化多因子-概述说明以及解释

博时量化多因子-概述说明以及解释1.引言1.1 概述引言是一篇文章的开端，它为读者提供了一个整体的背景概述，引起读者的兴趣，并概括地介绍了文章的主题和结构。

本文的主题是博时量化多因子投资策略，下面将对概述部分展开介绍。

在现代投资领域中，投资者通过寻找有效的投资策略来获取更高的收益。

多因子投资策略是一种备受关注的投资方法，它通过综合考虑多个因素来选择和配置投资组合中的个股，以期获得相对于市场整体表现更好的投资回报。

博时量化多因子模型作为博时基金旗下的一种投资策略，采用了先进的量化分析方法，利用大数据和机器学习技术，从众多因子中选择和构建出适用于不同市场环境的投资组合。

它不仅考虑了传统的基本面因素，如估值、盈利能力和成长性等，还结合了技术指标和市场情绪等因素，以提高投资组合的优化效果。

通过博时量化多因子模型，投资者可以更加科学、系统地进行投资决策，提升投资回报的同时，降低风险。

在本文中，将首先介绍多因子投资策略的基本原理和优势，包括为什么多因子投资可以带来超额收益以及如何选择合适的因子。

接着将详细阐述博时量化多因子模型的构建方法和应用实例，分析其在不同市场环境下的表现和优势。

最后，将总结多因子投资的优势，并展望博时量化多因子模型的应用前景。

通过本文的阅读，读者将能够了解到多因子投资策略的基本原理和实施方法，以及博时量化多因子模型在投资领域的应用价值。

希望本文能够为投资者提供一些有价值的思考，帮助他们在投资决策中做出更加明智的选择。

1.2文章结构文章结构：本文分为引言、正文和结论三个部分。

引言部分主要包括概述、文章结构和目的三个方面。

首先，我们将概述本文的主题，即博时量化多因子投资策略，并介绍该策略在投资领域的重要性和研究意义。

其次，我们会具体阐述文章的结构，让读者对整个文章有一个清晰的了解。

最后，我们明确本文的目的，以鼓励读者对该主题进行深入研究，并为实践中的投资决策提供有益的参考。

接下来是正文部分，主要包括多因子投资策略和博时量化多因子模型两个方面。

CCER中国证券市场指数数据库

无论该产品是用于出售、散布、自用或供他人或者其他机构使用。
６．未经公司书面许可，任何人不得将数据库中的数据拆分、或者进行局部或全部的重新组合，以向第三方公开或传播。
3 地址：北京市海淀区海淀路 50 号北大资源东楼 1234 室
电话： 86-10-82675663
邮编：100080 网址： http: //
加权方式算术平均总市值加权考虑非流通因素的总市值总流通市值流通Ａ股市值
7 地址：北京市海淀区海淀路 50 号北大资源东楼 1234 室
电话： 86-10-82675663
邮编：100080 网址： http: //
北京色诺芬信息服务有限公司 SINOFIN INFORMATION SERVICES
北京色诺芬信息服务有限公司 SINOFIN INFORMATION SERVICES
北京大学中国经济研究中心 China Center for Economic Research
二．权利保护１．经公司许可后对外使用数据库中的数据文件必须同时对数据库的权
利归属进行明确标注，注明“数据来源：ＣＣＥＲ™ 中国证券市场数据库，色诺芬，ＳＩＮＯＦＩＮ，色诺芬信息服务有限责任公司版权所有”
２．任何人不得以篡改、歪曲或任何其他有损于公司的方式使用数据库
及数据资料，并保证不采用任何违反著作权法、商标法、计算机软件保护条例以及相关法律法规、规章或者国际协约的方式使用数据库及数据资料。
wwwsinofincomcn?京色诺芬信息服务有限公司?京大学中国经济研究中心sinofininformationserviceschinacenterforeconomicresearch目录一设计?念????????????????????????????????????????????????????????????????????????????????????2二命名规范????????????????????????????????????????????????????????????????????????????????????2三指数时间范围及加权方式??????????????????????????????????????????????????????????7四数据库中的基本表?????????????????????????????????????????????????????????????????????8五数据字典????????????????????????????????????????????????????????????????????????????????????9???????????????????????????????????????????????????????9t1

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1. 仅涉及利润表（或现金流量表）指标或仅涉及资产负债表指标（无需平均）时：所有指标取最近报告期值即可2. 仅涉及利润表（或现金流量表）指标或仅涉及资产负债表指标（需平均）时：资产负债表平均指标=（期初值+最近报告期值）/2，其他指标取最近报告期值3. 同时涉及利润表（或现金流量表）指标和资产负债表指标（无需平均）时：资产负债表非平均指标直接取最近报告期值；利润表或现金流量表的指标，需乘以年化调整系数进行处理，一季度年化系数为4，二季度为2，三季度为4/3，四季度为1.4. 同时涉及利润表（或现金流量表）指标和资产负债表指标（需平均）时：资产负债表平均指标=（年初值+本期期末值）/2;利润表或现金流量表的指标，需乘以年化调整系数进行处理，一季度年化系数为4，二季度为2，三季度为4/3，四季度为1.•LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM1. LTM因子同时涉及利润表（或现金流量表）指标和资产负债表指标时：利润表指标取最近12个月数值；资产负债表指标取平均值，平均值=（本期报告值+上年同期值）/22. LTM因子仅涉及利润表和现金流量表指标时：利润表和现金流量表指标取最近12个月数值。

财务因子数据映射说明由于财务数据一般每季度公布一次，且通常会延迟公布（一季度与上一年四季度数据一般在今年4月底全部公布，二季度在8月底公布，三季度在10月底公布），所以将季度数据转换为更高频率数据时采用以下逻辑：•1、2、3月底采用上一年Q3的数据；Ⅱ. 因子目录1. 数据概览单因子有效性评价首页为数据概览界面，基本参数设置同上，该界面呈现如下内容：•近12期所选股票池的因子值分布箱形图•近12期所选股票池的收益率分布箱形图•近12期股票覆盖率序列图（股票覆盖率：即每期被纳入到选股范围的股票占股票池所有股票的百分比）•单期因子值分布直方图•单期股票收益率和因子值散点图•单期各档收益率分布：横轴为按照所选‘因子方向’排序后划分为10组，纵轴为每组内股票收益率的分布箱形图又称为盒须图，如上图所示，自上而下分别为离群点（异常值）、上界（最大值）、上四分位数、均值、中位数、下四分位数、下界（最小值）。

2 . IC分析信息系数相关算法•图-因子自相关序列：即所有股票当期因子值与滞后i期因子值的相关系数；首先，计算每期因子暴露值和之后i期的因子值的相关系数，其中，i=1,2,...,12；其次，分别对因子每隔i期的相关系数计算均值。

3 . 收益率分析收益率相关指标算法4 .换手率分析换手率算法5 . 选股结果6 . 月历效应金融市场与日期联系密切，有季节效应、月历效应、星期效应、假日效应等。

月历效应，即因子在不同月份表现有所差异，Wachtel在1942年首次提出著名的“一月效应”，此后众多学者研究发现，大多数国家的股价指数1月份的收益率明显高于其他月份。

•因子月历效应页面，按月份展示各年各月的收益率情况，通过横向纵向对比，可进一步研究因子的月历效应；•因子年度表现，呈现该因子各年度的信息系数、收益率、换手率等相关指标（详见算法说明）。

Ⅳ因子对比Ⅴ因子收藏等；Ⅶ算法说明单因子评价算法逻辑因子数据获取与处理流程：•根据回测起始日期确定所涉及到的财报报告期；•根据起始日期与调仓频率确定回测期间的调仓期（具体的日期）；•根据调仓期与财务数据映射原则确定所用到财报报告期；•跟据用户输入的参数从数据库中提取原始数据，原始数据有三个维度：报告期,股票名,因子值;•对原始数据进行去极值和标准化处理；•将原始数据的频率转换至用户设定的调仓周期。

MAD去极值处理去极值算法的主要目的是为了使因子数据在一个合理的范围之内。

去极值的方法主要有两种：MAD去极值法和标准差去极值法，主要区别是对极值定义不一样。

f′i=⎧⎩⎨f m+nf MAD f m−nf MAD f i if f i>u+nf MAD if f i<f m−nf MAD iff m−nf MAD<f i< f m+nf MAD.fi′={fm+nfMADif fi>u+nfMADfm−nfMADif fi<fm−nfMADfiiffm−nfMAD<fi<fm+nfMAD.f m为f i序列中位数fm为fi序列中位数f MAD为|f i−f m|的中位数fMAD为|fi−fm|的中位数标准化处理标准化处理使得每个报告期的所有因子的横截面数据都在一个固定范围内,处理的逻辑是用每个元素减去均值再除以标准差，主要有普通标准化和行业标准化，区别是因子暴露值的均值和标准差计算方式不同，行业标准化需要分别计算各股票所在行业的因子值的均值和标准差。

f i=f rawi−uσfi=firaw−uσf i为标准化后的修正值fi为标准化后的修正值f rawi:原始数值firaw:原始数值u:f i序列均值u:fi序列均值σ:f i序列标准差σ:fi序列标准差IC信息系数IC（Information Coefficient，信息系数）：•normalIC，即某时点某因子在全部股票的暴露值与其下期回报的截面相关系数；normalIC=corr(factor t−1,return t)normalIC=corr(factort−1,returnt) factor t−1为t-1期的因子值factort−1为t-1期的因子值return t为t期的因子收益率returnt为t期的因子收益率•rankIC，即某时点某因子在全部股票暴露值排名与其下期回报排名的截面相关系数；rankIC=corr(order factort−1,order returnt)rankIC=corr(ordert−1factor,ordertreturn)order factort−1为各股票t-1期的因子值排名ordert−1factor为各股票t-1期的因子值排名order returnt为各股票t期的因子收益率排名ordertreturn为各股票t期的因子收益率排名因子收益率相关指标平均收益率R avg=1t∑i=1t R t Ravg=1t∑i=1tRtt为总样本期数t为总样本期数R t为因子t期的当期收益率Rt为因子t期的当期收益率累计收益率R cumt=Π（(1+R1)⋯(1+R t)）−1Rtcum=Π（(1+R1)⋯(1+Rt)）−1年化收益率R annual=(Π(1+R1)⋯(1+R t))Nt=(R cumt+1)Nt Rannual=(Π(1+R1)⋯(1+Rt))Nt=(Rtcum+1)NtN为一年调仓次数N为一年调仓次数t为总样本期数t为总样本期数最大盈利、最小盈利Bestmonth=max(R t)Bestmonth=max(Rt)Worstmonth=min(R t)Worstmonth=min(Rt)R t为因子t期的收益率Rt为因子t期的收益率最大回撤(Drawdown)最大回撤：在选定样本周期内任一历史时点往后推，资产价格走到最低点时的收益率回撤幅度的最大值。

最大回撤用来描述买入资产后可能出现的最糟糕的情况。

Drawdown t={0NET t−min j≥t NET j NET t if NET t=min j≥t NET j else Drawdownt={0if NETt=minj≥tNETjNETt−minj≥tNETjNETtelseNET为某期净值NET为某期净值MaxDrawdown=max(Drawdown t)MaxDrawdown=max(Drawdownt)标准差（年化）波动率，即组合收益率的方差，波动率越大，则风险越高。

Volatility=N×∑i=1T(R i−R¯)2T−1−−−−−−−−−−−−−−−⎷Volatility=N×∑i=1T(Ri−R¯)2T−1R i为{组合收益率}Ri为{组合收益率}R¯为组合收益率均值R¯为组合收益率均值T为样本期数,N为一年调仓次数T为样本期数,N为一年调仓次数下行标准差（年化）s=N×∑R i≺R¯(R i−R¯)2T−1−−−−−−−−−−−−−−−−⎷s=N×∑Ri≺R¯(Ri−R¯)2T−1R i为组合收益率Ri为组合收益率R¯为组合收益率均值R¯为组合收益率均值T为样本期数,N为一年调仓次数T为样本期数,N为一年调仓次数超额收益R excesst=R t−I t Rtexcess=Rt−ItR t为因子t期收益率Rt为因子t期收益率I t为基准指数t期收益率It为基准指数t期收益率年化超额收益excessR annual=R annual−I annual excessRannual=Rannual−IannualR annual为因子年化收益率Rannual为因子年化收益率I annual为基准指数年化收益率Iannual为基准指数年化收益率最大、最小超额收益BestExcess=maxR excesst BestExcess=maxRtexcessWorstExcess=minR excesst WorstExcess=minRtexcessCAPM Alpha ，BetaCAPM Alpha 和Beta由因子某组收益率序列对指数同期收益率做一元线性回归得到：Alpha即每组收益相对于回测选股基准收益的Alpha值，表示风险调整后的超额收益，其中，风险用Beta衡量；Beta，即每组收益相对于回测选股基准收益的Beta值，表示该组收益相对于基准指数的波动性大小，该值大于1表示该组收益波动性大于样本，反之，则波动性小于样本；R t=Alpha+Beta∗I t Rt=Alpha+Beta∗It跟踪误差（Tracking Error）跟踪误差即超额收益的年化标准差;TE=∑t=1T(R t−I t)2T−1−−−−−−−−−−−⎷TE=∑t=1T(Rt−It)2T−1T为样本观测期T为样本观测期R t为因子t期收益率Rt为因子t期收益率I t为基准指数t期收益率It为基准指数t期收益率胜率（Hit Ratio）胜率即在整个样本期内，组合收益率战胜市场平均收益率的次数占整个样本期的比率胜率越大，有效性越显著。

HitRatio=num(R i>M i)T HitRatio=num(Ri>Mi)Tnum(R i>M i)为组合收益率战胜市场平均收益率的次数num(Ri>Mi)为组合收益率战胜市场平均收益率的次数夏普比率（Sharp Ratio）夏普比率，表示每承受一单位风险，会产生多少超额报酬，这里风险被定义为波动率，即组合收益的标准差。