因素模型

因素模型
因素模型

因素模型

杨长汉1

证券资产价格的决定因素是多种多样的,西方学者在研究中采取了多种多样的方法去探讨证券价格的决定因素。最主要的两种模型就是单因素模型和多因素模型。

一、单因素模型(Single-Index Model)

夏普(William Sharp)于1963年建立了单因素模型2。单因素模型是指证劵价格的影响因素只有一个,而如果有两个或两个以上的因素,则称为多因素模型。单因素模型的基本思想是:当市场指数上升时,市场中大部分证券资产的价格就会上涨;相反,当市场指数下降时,市场中大部分证券资产的价格就会下降。

单因素模型中有以下两个基本假设条件:

第一,证券的风险分为系统性风险和非系统性风险,而这里所讲的因素仅指系统性风险。 第二,一个证券的非系统性风险与其他证券的非系统性风险之间的相关系数为零,两种证券之间的相关性仅取决于共同的市场因素。

在单因素模型中,主要有两个基本因素会造成证券收益率的波动:一是宏观经济环境因素,比如GDP 增长率、利率、通货膨胀率等,这些因素的变化会引起证券市场中所有证券收益率的变化,相对于市场中的系统性风险;二是微观因素的影响,如公司的财务状况、公司的经营状况以及突发事件等,这些因素的变化只会引起个别证券收益率的变化,相当于市场中的非系统性风险,可以通过多样化的投资组合进行分散。

我们以股票的收益率和股价指数的收益率为例,可以得到如下单因素模型公式: it it i mt it r A R βξ=++

这一公式揭示了股票的收益率与市场指数收益率之间的关系。其中,it r 为t 时期证券i 的收益率,mt R 为t 时期市场指数的收益率,i β为斜率,表明股票收益率波动对市场指数波动的反应程度,代表两者的相关关系,it A 是截距项,反映市场指数为零时股票收益率的大

1 文章出处:《中国企业年金投资运营研究》 杨长汉 著

杨长汉,笔名杨老金。师从著名金融证券学者贺强教授,中央财经大学MBA 教育中心教师、金融学博士。中央财经大学证券期货研究所研究员、中央财经大学银行业研究中心研究员。

2Sharp, W.,1966, Mutual Fund Performance, Journal of Business,(39),119-138.

小,it ξ为残差项。

二、多因素模型(Multi-Index Model)

单因素模型认为证券的价格或收益率随着市场指数的变动而变动,即证券的收益仅取决于市场指数这一单一的因素,这明显与实际情况不太相符。美国经济学家金(Benjiamen.King)于1966年在《商业学刊》上发表的《股价行为中的市场与行业因素》一文中研究了1929—1960年间的63只纽约证券交易所中的股票,这些股票来自于多个行业,他证实了股票的收益与市场指数的收益存在高度的相关关系,这一点和夏普的结论是相同的,不过,除了市场指数为,还有许多因素影响着股票收益的波动。

金(1966)这一研究结论激起了其他经济学家的研究兴趣。科恩和波格(1967)在《商业学刊》上发表《对两种投资组合选择模型的经验评价》一文,首先提到了多因素模型,从而拓展了单因素模型。该模型表示如下:

1122........it i i t i t ik kt it r a b I b I b I ξ=+++++

其中,it r 表示组合内第i 证券在某个时期t 内的收益,kt I 为第k 个影响因素,ik b 为第k 个因素的影响度,i a 是截距项,即没有任何影响因素下的固定收益。

不同学者对证券价格的影响因素有不同的看法,因此多因素模型也有好几类,比如统计要素模型、宏观要素模型、基本要素模型和混合模型。统计要素模型主要是通过主成分分析法找出能够解释证券收益而且并不相关的因素。宏观要素模型认为影响证券收益的因素主要是一些宏观经济变量,主要是投资者的信心、利率、市场指数、通货膨胀以及真实商业周期等。基本要素模型认为影响证券收益的要素主要是公司的财务状况,以及公司所属行业的属性。混合模型是前几种模型的组合,认为影响证券收益的因素不仅包括宏观因素,也包括公司状况等微观因素。

三、对因素模型的述评

因素模型也是在马克维兹的现代资产组合理论中发展起来的,其对证券投资理论体系的贡献有以下几点:

第一,因素模型主要表现在对资产或资产组合的风险进行细分,详细讨论了资产或资产组合的风险来源。单因素模型将资产或资产组合的风险划分为两部分,即系统性风险和非系统性风险,而多因素模型将资产或资产组合的风险来源进行了更加细致的划分,这种分析方法对投资过程中的风险管理有很强的借鉴意义,同时也为后来套利定价理论的诞生奠定了坚

实的基础。

第二,因素模型也是在马克维兹均值—方差模型的基础上发展起来的,其中的单因素模型大大简化了马克维兹模型中方差和协方差的计算过程,该模型用简化的计算模式来替代复杂的线性规划方法,提高了资产组合理论的实用价值,更有利于资产组合的实际运用,并促进了资本市场资产均衡定价理论的发展。

第三,因素模型采取了简化的数学公式来表达证券收益的影响因素,便于学者对其进行实证分析,从客观上也推动了金融计量经济理论的发展,为各研究机构和共同基金部门提供了丰富多样的实证检验方法。

因此可以看出因素模型是一种简单而完美的资产组合模型,但在实际运作中,该模型也存在一定的局限性,主要有如下几点:

第一,从理论上来讲,因素模型毕竟是以马克维兹的现代资产组合理论为基础,对于资产收益率概率分布方面的局限性,以及无交易成本、市场无摩擦、不存在税收因素和投资期限单一这些现代资产组合理论中与现实不符合的假设条件,仍然是该模型无法回避的事实。

第二,因素模型中的单因素模型强调市场指数是证券收益率的影响因素,但在各种实证分析中,市场指数对证券收益率的解释往往不尽人意。在多因素模型中,虽然影响因素的增加有助于对证券收益率的解释,但这里又产生了新的问题,比如如果多因素之间存在相关性,或多重共线性,这会降低实证分析的检验效果,即使对其进行正交化处理也很难得出理想的结论。

第三,因素模型在对证券的收益率进行解释时往往假设随机扰动项遵循经典的最小二乘假设,比如均值为零、同方差等条件,但在实际操作中,随机扰动项很难满足这些假设条件,这无疑会降低模型的检验成果。

总之,因素模型继承和拓展了马克维兹的现代资产组合理论,并与资本资产定价模型一起丰富了现代资产定价的理论体系,同时也为后来套利定价理论的诞生奠定了基础,但因素模型毕竟也是建立在一系列严格的假设条件之上的,其在实证分析和定量检验中也无可避免的面临一系列的局限性和难题,因此该模型也需更进一步的发展和完善。

3

3文章出处:《中国企业年金投资运营研究》杨长汉著

杨长汉,笔名杨老金。师从著名金融证券学者贺强教授,中央财经大学MBA教育中心教师、金融学博士。中央财经大学证券期货研究所研究员、中央财经大学银行业研究中心研究员。

北森建五因素领导力模型

北森建五因素领导力模型推国内首个高管测评 北京2013年4月18日电/美通社/ -- 日前,中国人才管理第一品牌-- 北森,再度推出人才测评行业里程碑式产品:北森高级管理人员测评,成为国内第一个专门针对高管人群的人才测评产品,填补了一直以来高管测评的空白。该产品聚焦企业核心人才竞争力的提升,一经推出便获得了奇瑞控股、泰康人寿、绿城房地产等大批企业的亲睐。 北森CEO纪伟国:高管不能随便测 “基层员工测技能、知识,中层管理人员测管理能力、管理风格等,但这些都不适合拿来测高管,北森研究院研究发现决定高管能力的是其深层次心理特质。”纪伟国如此讲到。 以往,高层管理人员经常使用的评估方法包括:标准化测验、评价中心、360度评估等,但企业往发现评估总是无法达到预期的效果,因为这个层级的人员往往在技能、知识方面并不欠缺,影响他们工作效率和进一步提升的障碍其是在冰山下深层次的心理特质,这些特征能够影响其领导力行为以及决策方式,进而影响其工作成效。 基于对高层评估领域的深入研究,北森研究院探索出一套专门评估高层管理者的心理测验,该测验基于人格理论,以领导力模型为核心,全面深入评估高层管理者的深层次心理特质,并对五大领导力进行了预测。

人才测评发展的未来是针对性评估 “不同的人群、不同的应用方向,必须有针对性强的测评产品,才能保证结果的有效性。我们回顾人才测评的发展历程,最初是单纯的性格测评,而后细分为基层员工测评、管理人员测评,而今又发展出来高管测评。不仅是对象在不断细分,应用方向也在细化,校园招聘、社会招聘、管理人员评估等多种应用方向,可见,人才测评的发展趋势是逐渐细化,针对性更强。” 纪伟国谈到。 现在北森的人才测评产品已经涵盖12大应用方向,为不同业务模块提供专门化的测评产品,并且拥有超过100个岗位模板,适应不同层级不同职位的测评需求。此次高管测评的推出,更是领先于国内其它测评企业,满足了企业更高层次的需求,为企业提升核心竞争力推波助澜。 北森公司成立于2002年,现有员工500人,历经十一年专注于人才测评领域的研究,数度引领人才测评行业的发展,占据中国测评市场70%的市场份额。并于2010年,推出国内第一个人才管理云计算平台iTalent。在这个平台上,招聘、测评等六大产品得以无缝整合。其中招聘管理系统已在行业内独占鳌头,客户包括中粮集团、蒙牛、支付宝、京东等50多个行业3500家国内外大型知名企业。

Analysis Services多维模型开发

Analysis Services多维模型开发 可以使用Analysis Services来分析大量数据。还可以使用它设计、创建和管理包含来自多个数据源的详细信息和聚合数据的多维结构。 若要管理和使用联机分析处理(OLAP)多维数据集,可以使用SQL Server Management Studio。 若要创建新的OLAP多维数据集,可以使用Business Intelligence Development Studio。 一、创建Analysis Services项目 单击“开始”,依此指向“所有程序”和Microsoft SQL Server 2008,再单击SQL Server Business Intelligence Development Studio。 将打开Microsoft Visual Studio开发环境 在Visual Studio的“文件”菜单上,指向“新建”,然后单击“项目”。 在“新建项目”对话框中,从“项目类型”窗格中选择“商业智能项目”,再在“模板”窗格中选择“Analysis Services项目”。 将项目名称更改为Analysis Services Tutorial,这也将更改解决方案名称,然后单击“确定”。 您已经基于Analysis Services项目模板,在同样命名为Analysis Services Tutorial的新解决方案中成功创建了Analysis Services Tutorial项目。 二、定义数据源 在解决方案资源管理器中,右键单击“数据源”,然后单击“新建数据源”。 在“欢迎使用数据源向导”页上,单击“下一步”可打开“选择如何定义连接”页。

面向财务分析的多维数据模型设计

面向财务分析的多维数据模型设计

摘要:数据仓库为商务运作提供结构与工具,以便系统地组织、理解和使用数据进行战略决策。数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。而且数据仓库是基于多维数据模型的,该模型可将数据看作数据立方体形式。而财务分析是以会计核算和报表资料及其他相关资料为依据,采用一系列专门的分析技术和方法,对企业等经济组织过去和现在有关筹资活动、投资活动、经营活动、分配活动的盈利能力、营运能力、偿债能力和增长能力状况等进行分析与评价的经济管理活动。可以运用数据仓库实现面向财务分析的多维数据模型设计,通过时间维度、行业维度、方法维度、报表维度等分析。 关键词:财务分析;多维数据;上卷;下卷;财务报表 前言:数据仓库为商务运作提供结构与工具,以便系统地组织、理解和使用数据进行战略决策。而财务分析是以会计核算和报表资料及其他相关资料为依据,采用一系列专门的分析技术和方法,对企业等经济组织过去和现在有关活动的各种能力状况等进行分析与评价的经济管理活动。可运用数据仓库实现面向财务分析的多维数据模型设计。 正文:面向财务分析的多维数据模型设计 财务分析是为企业的投资者、债权人、经营者及其他关心企业的组织或个人了解企业过去、评价企业现状、预测企业未来做出正确决策提供准确的信息或依据的经济应用学科。是以会计核算和报表资料及其他相关资料为依据,采用一系列专门的分析技术和方法,对企业等经济组织过去和现在有关活动的盈利能力、营运能力、偿债能力和增长能力状况等进行分析与评价的经济管理活动。 财务分析的方法与分析工具众多,具体应用应根据分析者的目的而定。最经常用到的还是围绕财务指标进行单指标、多指标综合分析、再加上借用一些参照值(如预算、目标等),运用一些分析方法(比率、趋势、结构、因素等)进行分析,然后通过直观、人性化的格式(报表、图文报告等)展现给用户。 财务分析的方法: (一)比较分析法 比较分析法,是通过对比两期或连续数期财务报告中的相同指标,确定其增减变动的方向、数额和幅度,来说明企业财务状况或经营成果变动趋势的一种方法。比较分析法的具体运用主要有重要财务指标的比较、会计报表的比较和会计报表项目构成的比较三种方式。 1、不同时期财务指标的比较主要有以下两种方法: (1)定基动态比率,是以某一时期的数额为固定的基期数额而计算出来的动态比率。 (2)环比动态比率,是以每一分析期的数据与上期数据相比较计算出来的动态比率。

因子分析的基本概念和步骤

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

多因素模型

多因素模型 在单指数模型中,我们假设每个股票对每个风险因素有相同的敏感度,实际上,每个股票相对于不同的宏观经济因素有不同的β值。 1. 双因素模型 假设两个最重要的宏观经济风险来源是围绕经济周期周围的不确定性(GDP)和利率(IR)。任何股票的收益都与这两个宏观风险因素以及它们自己公司的特有风险相关。可以把单指数模型扩展成一个双因素模型,表示如下: 例:有两个公司,一个是公用事业单位,另一个是航空公司。公用事业单位对GDP的敏感性较低,但是对利率的敏感度较高,当利率上升时,它的股票价格将下跌;航空公司的业绩对经济活动非常敏感,但对利率却不那么敏感。假设某一天,有一个新闻节目暗示经济将发生扩张,GDP的期望上升,利率也上升。那么对公用事业单位来说这是坏消息,因为它对利率极为敏感。而对于航空公司而言,由于它更关切GDP,所以这是个好消息。很明显,一个单因素或者单指数模型难以把握公司对不同的宏观经济不确定性信息的反应。 2. 多因素模型 多因素模型的一个例子是陈(Chen)、罗尔(Roll)与罗斯(Ross)将下列因素作为描述宏观经济的变量建立的。 设IP—行业生产的变动百分比; EI—预期通货膨胀的变动百分比; UI—非预期通货膨胀的变动百分比; CG—长期公司债券对长期政府债券的超额收益; GB—长期政府债券对短期国库券的超额收益。 3. Fama-French多因素模型 法马(Fama)与弗伦奇(French)建立了如下的多因素模型。 式中SMB—小减去大(small minus big):小股票资产组合的收益超过大股票资产组合的收益;HML—高减去低(high minus low):有高帐面价值-市值比的股票资产组合的收益超过有低帐面价值-市值比的股票收益。 注意,在这个模型中,市场指数确实扮演着一个角色,并被期望能用它把握源于宏观经济因素的系统风险。

人力资源管理五因素分析模型资料讲解

人力资源管理五因素分析模型 2007-9-23来源:中国人力资源开发网作者:陈谏 在当今企业管理学界研究得最多的领域就是人力资源管理,其实中国从来不缺乏对人管理的先进思想和智慧,古往今来,在历史的长河中涌现了不计其数育才、求才、用才的经典故事,只不过这些故事的经典之处,并非在商业;目前竞争激烈的商业环境中,产品和营销策略被普遍认为是是企业的主要价值,近几年我们通过对人力资源管理的深入研究发现,不容易为竞争者模仿、复制的"人才"和"企业文化",才是独一无二的价值所在。企业的成功,取决于一个具竞争力的优势上,即企业员工的表现。换言之,优秀的专业人才是带领企业创造绩效与价值的关键。企业如何找到适合企业文化、又有能力协助企业成长的人才,是我们人力资源管理工作者最核心的工作之一。人力资源部门必须通盘了解企业未来几年的目标及营运方向,协助企业配合策略规划,订定出切合时宜的人力资源管理模式。 要寻找人力资源管理模式,我们必须先研究人力资源管理的对象,其实,人力资源管理的对象不仅仅是"人",还包括"岗位"、"团队"、"职务簇"、和"关联".对于人的研究,我们大体上会注重于人的素质、人的能力、人的知识、人的业绩、人的价值、人的报酬、人的成本、人的投资等方面,这些信息都是依附在"人"这个活动的载体上,不管是"自然人理论"还是"科学人理论",或者是"职业人理论",都离不开对这些要素的分析与研究。 岗位的定义是大家最熟悉的,让我们忽视的是构成岗位的要素:岗位的目标、岗位的资源、岗位的重要性、岗位的胜任力模型、岗位的发展属性等。 职务簇是具备同样属性要素、但存在量差的岗位集合,同一个职务簇中不同的岗位,存在等级、重要性、目标等的差异。处于相同职务簇的群体,我们会用同样的管理方式去管理,如培训、考核、资源调配、薪酬设计等等。 团队是相对分散的人的集合,有非常多的组合规则,这些规则来源于"人"和"岗位"的属性,

《大数据多维分析平台实践方案》

大数据多维分析平台实践方案 一、大数据多维分析平台搭建的初心 随着公司业务量的增长,基于传统关系型数据库搭建的各种报表查询分析系统,性能下降明显。同时由于大数据平台的的日趋完善,实时的核心业务数据逐步进入大数据平台。 数据进入了大数据平台,相伴而来的是各种业务需求,这里主要聚焦在如何高效稳定的基于大数据平台的数据进行查询。 通过分析,我们面临的挑战如下: ?亿级别表下任意维度和时间跨度的高效的统计查询。 ?业务分析的维度越来越多,是否可以提供一个灵活的多维度组合查询的工具,而不是针对不同的维度组合开发不同的报表。 基于以上目标,开始搭建大数据的多维分析平台。 二、多维分析平台技术选型 搭建多维分析平台,首先面临的是技术选型,基于我们对开源框架的使用经验和实际情况,我们主要看业界主流的公司是如何使用应对的,在技术选型上会进行一定的比较,但不会投入比较大的资源进行验证,主张快速的迭代,效果的评估。多维分析平台技术选型主要面临是OLAP引擎和前端UI的选型。 我们先来看一下OLAP的基本概念和分类。 OLAP翻译成中文叫联机分析处理,OLTP叫联机事务处理。OLTP 它的核心是事务,实际上就是我们常见的数据库。我们业务数据库就是面向于事务。它的并发量会比较高,但是操作的数据量会比较小。它是实时更新的。数据库的设计会按照3NF范式,更高的话可能会

按照BC范式之类的来做。而OLAP的核心是分析,面向应用是分析决策,需要分析的数据级会非常大,可能TB,甚至PB都会有。它的数据更新会稍微慢一些,它的设计一般是反范式的,因为面向分析。常见的是雪花模型和星型模型。 OLAP的引擎目前主要分为3类 第一种叫ROLAP,叫关系型OLAP,它的特点就是它是基于关系性模型,计算的时候,根据原始数据去做聚合运算。常见的实现,小数据量可以利用MySQL、SqlServer这种传统数据库,而大数据量可以利用SparkSQL、Tidb、ES这些项目。 第二种类型叫MOLAP,叫多维OLAP,它的特点就是它会基于一个预定义的模型,我需要知道,要根据什么维度,要去算哪些指标,我提前就把这些结果弄好,存储在引擎上。细节数据和聚合后的数据保存在cube中,以空间换时间,查询效率高。 实际上我们的很多业务也是基于此思想去做的,比如我们会在ES里面按照电站、客户等维度进行聚合,满足日常的T+1查询需求,只不过这个地方每个聚合维度需要在ES里面做一个表,并增加上复杂的ETL处理。符合这个理念在业界用的比较多的为Kylin。并且基于Kylin有完整的一套开源产品KMS。涵盖了多维分析的前端UI及多维分析数据库。 第三种叫HOLAP(HybridOLAP),叫混合OLAP,特点是数据保留在关系型数据库的事实表中,但是聚合后的数据保存在cube中,聚合时需要比ROLAP高,但低于MOLAP。 综合分析,技术选型上主要考虑第ROLAP和MOLAP。关于OLAP 的分类已经经过了很多年的发展,市场上相关的产品也有很多,但是大数据下基于开源组件应该如何搞? 在大数据时代,有了分布式计算和分布式存储,对于亿级别表的任意时间跨度多维度组合的查询,是不是可以直接查询,不用再预聚合。

数学建模各种分析报告方法

现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,

因子分析模型的建立

基于因子分析模型的居民消费价格指数影响因素分 析 摘要:由于目前对居民消费价格变动原因的分析指标很多,且指标体系中各指标之间存在着多重共线性,从而影响了分析模型的稳定性,使所得模型中出现了不符合经济学原理的现象。本文采用多元统计分析方法,以2010年居民消费物价水平为例,建立了关于居民消费价格分类指数变动的因子分析模型,研究发现影响居民消费价格指数的主要因素为食品、衣着和家用设备等生活必需品的价格水平,其次为健身等娱乐设施价格和房价水平。 关键词:消费价格指数;影响因素;因子分析 一、研究背景 随着社会主义市场经济体制的确立和逐步完善,我国经济总量和综合实力迅速上升,居民的生活水平显着提高,经济和社会都有了较大的发展。相对于过去而言,居民食品方面的消费支出比重在逐渐下降,而在文化娱乐等方面的消费支出比重越来越大。国家发改委在全国物价局长会议上指出,明年要围绕促进经济平稳较快发展这一主线,积极稳妥地推进价格改革,切实改进价格监管,保持价格总水平基本稳定。同时由于影响价格变动的因素日益复杂,价格异常波动的可能性增加。分析影响居民消费价格指数的主要影响因素,改进价格监管,保持价格总水平基本稳定有着重要意义;同时也为产业政策的制定和宏观经济的调控提供了参考。 居民消费价格指数(CPI)是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标,在一定程度上也反映出我国居民消费结构的变化。本文通过对2010年全国居民消费价格指数的变化进行因子分析,从而确定出影响全国居民消费物价水平和消费结构变化的主导因素。 二、因子分析模型的建立 因子分析最初是由英国心理学家C.Spearman提出的,是多元统计分析的一个重要分支,其主要目的是浓缩数据。通过对诸多变量的相关性研究,来表示原来变量的主要信息。假设有n个样本,对于多指标问题X=(X1,X2,...Xk),形成的背景原因是多种多样的,其中共同原因称为公共因子,假设用Fj表示,它们之间是两两正交的;每一个分量Xi又有其特定的原因,称为特殊因子,假设用ei表示,其两两之间互不相关,且只对相应的Xi起作用。同时,F与e相互独立。于是因子分析的数学模型可表示为: Fi叫做公共因子(也称主因子),它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。

五因素模型

特质学派及五因素模型的局限与运动心理学人格研究 摘要:讨论了特质学派及最新产物五因素模型在理论导向、结构框架、特质定义、因素分析、预测能力、控制策略6个方面的局限性。分析了以往运动心理学人格研究在预测运动成绩时遇到的困难,可能是由于采用过于宽泛的人格特质预测过于宽泛的行为结果所致。在此基础上,提出了今后运动心理学人格研究提高移植量表的预测效度和发展运动领域的人格测验的可能途径。 关键词:运动心理学;特质;人格;因素分析;模型;预测 精神分析学派、特质学派、生物学学派、人本主义学派、行为主义学派以及认知学派构成了人格心理学的主要学派。这六大学派对于我们理解人格的本质作出了重要贡献,且至今仍以不同的形式活跃在人格心理学的理论和实践中。特质学派的主要倾向是对个人差异作出量化评定,是运动心理学领域心理选材与心理评定的重要理论基础。特质学派在人格心 理学的发展中创造了丰功伟绩,但本文仅从局限性的角度对该学派及其最新产物五因素模型进行分析,以期有助于运动心理学家在人格特质的研究中明确方向,最终更好地描述、预测、解释和控制运动活动参与者的行为。 1 特质学派及五因素模型的局限性 1.1 什么是五因索模型长期以来,人格心理学家一直在努力寻求普适性的特质分类,但对于应当用哪些人格维度来解剖和描述人格,多年来一直众说纷纭,莫衷一是。有的提议采 用多至16个维度、有的提议采用少至2或3个维度(Vemon,1964)。经过漫长的探索,最近,人格心理学家似乎逐渐达成了某种程度的共识,认为人格维度的数量可能是5个。1949年至1981年的人格维度研究表明(John,1990),以下五大特质因素是这些研究的共同归宿:神经质(Neuroticism,N),外向性(Extroversion,E),开放性(Openness to Experience,O),随和性(Agreeableness,A),意识性(Conscientiousness,C)。五因素模型的效度证据主要来自以下6个方面的研究成果:第一,跨文化的一致性;第二,自我评定与他人评定之间的一致性;第三,与动机、情绪及交往技能量度的一致性;第四,人格障碍诊断的功能;第五,遗传影响;第六,跨时间测量的稳定性。大五因素的发现与确认,被认为是“人格心理学发展的转折点”(McCrae &John,1992,p.177)。目前,许多人格心理学家倾向于采用科斯塔与麦克雷编制的[NEO人格问卷修订本] (NEO - PI - R; Costa &McCrae,1992)来测量这五大特质因素。该量具包括240个条目,每一条目有完全同意到完全不同意5级选项。除了可以计算5个特质因素分数以外,还可计算每个因素包括的6个亚因素分数(表1)。 表1 五因素模型的主因素和亚因素 主因素亚因素 神经质(N) 焦虑,气愤的敌意,抑郁,自我意识,冲动性,易感性 外向件(E) 合群性,自信性,活动性,热情性,兴奋寻求,积极情绪 开放性(O) 幻想性,审美性,感受性,行动性,思想,价值 随和性(A) 直率,利他,遵从,谦虚,温和,信任 意识性(C) 能力,秩序,责任,成就,努力,自我约束 2 特质学派及五因素模型的局限性尽管许多五因素模 型研究所得结果颇为一致,人格心理学家对该模型也给予了前所未有的认同,但也不乏批评之声(Block,1995)。更重要的是,五因素模型并末解决特质学派本身所固有的一些问题。下面我们将分6个方面讨论这些问题。 1.2.1 缺乏理论导向,不能解释原因心理学家对特质学派最重要也是最致命的批评是,该学派少有理论建树,且没有回答“为什么”的问题。比如,假如我们看到张三与人交按时表现得友

多维数据模型与OLAP实现

多维数据模型与OLAP实现 近年来,随着网络技术和数理分析在银行业中的广泛应用,西方商业银行开始广泛采用人口地理统计理论,运用数据挖掘及商业智能 对用户请求的快速响应和交互式操作。 OLAP技术在国内兴起和发展的过程中,人们对某些基本概念还有不同的理解。比如,OLAP与多维数据模型的关系,多维数据模型与多维数据库(MDD,MultiDimensionalDatabase)的关系,MOLAP(Multidime

nsionalOLAP,多维联机分析处理)、ROLAP(RelationalOLAP,关系联机分析处理)和HOLAP(HybridOLAP,混合联机分析处理)间的差异,多维数据库与多维联机分析处理是不是完全一致等问题,还有待于进一步澄清。 一、多维数据模型及相关概念 同的维属性。 2.维:是人们观察数据的特定角度,是考虑问题时的一类属性。 属性的集合构成一个维(如时间维、机构维等)。 3.维分层:同一维度还可以存在细节程度不同的各个描述方面(如时间维可包括年、季度、月份、旬和日期等)。

4.维属性:维的一个取值,是数据项在某维中位置的描述(例如“某年某月某日”是在时间维上位置的描述)。 5.度量:立方体中的单元格,用以存放数据。 OLAP的基本多维分析操作有钻取(Rollup,Drilldown)、切片(Slice)、切块(Dice)及旋转(P 钻取包含向下钻取和向上钻取 在多维数据结构中 OLAP多维数据模型的实现有多种途径,其中主要有采用数组的多维数据库、关系型数据库以及两者相结合的方式,人们通常称之为MOLAP、ROLAP和HOLAP。但MOLAP的提法容易引起误解,毕竟根据OLAP的多维概念,ROLAP也是一种多 维数据的组织方式。

数据仓库与数据挖掘实验二(多维数据组织与分析)

一、实验内容和目的 目的: 1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系; 2.理解多维数据集创建的基本原理与流程; 3.理解并掌握OLAP分析的基本过程与方法; 内容: 1.运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。 2.使用维度浏览器进行多维数据的查询、编辑操作。 3.对多维数据集进行切片、切块、旋转、钻取操作。 二、所用仪器、材料(设备名称、型号、规格等) 操作系统平台:Windows 7 数据库平台:SQL Server 2008 SP2 三、实验原理 在数据仓库系统中,联机分析处理(OLAP)是重要的数据分析工具。OLAP的基本思想是企业的决策者应能灵活地、从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。 OLAP是在OLTP的基础上发展起来的,OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。而OLAP是以数据仓库为基础的数据分析处理。它具有在线性(online)和多维分析(multi-dimension analysis)的特点。OLAP超越了一般查询和报表的功能,是建立在一般事务操作之上的另外一种逻辑步骤,因此,它的决策支持能力更强。 建立OLAP的基础是多维数据模型,多维数据模型的存储可以有多种不同的形式。MOLAP和ROLAP是OLAP的两种主要形式,其中MOLAP(multi-dimension OLAP)是基

于多维数据库的OLAP,简称为多维OLAP;ROLAP(relation OLAP)是基于关系数据库的OLAP,简称关系OLAP。 OLAP的目的是为决策管理人员通过一种灵活的多维数据分析手段,提供辅助决策信息。基本的多维数据分析操作包括切片、切块、旋转、钻取等。随着OLAP的深入发展,OLAP也逐渐具有了计算和智能的能力,这些能力称为广义OLAP操作。 四、实验方法、步骤 要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。 五、实验过程原始记录(数据、图表、计算等) 本实验以实验一建立的数据仓库为基础,使用Microsoft的SQL Server Business Intelligence Development Studio工具,建立OLAP相关模型,并实现OLAP的一些简单基本功能。 首先打开SQL Server Business Intelligence Development Studio工具,新建一个Analysis Service项目,命名为:DW

五因素模型

由Eugene F. Fama和Kenneth R. French撰写Journal of Financial Economics2015年第4期论文“A five-factor asset pricing model”对原有的Fama-French(1993)三因素模型进行了改进,在原有的市场、公司市值(即SML,small minus large)以及账面市值比(即HML,high minus low)三因子的基础上,加入了盈利能力(profitability)因子(即RMW,robust minus weak)和投资模式(investment patterns)因子(即CMA,conservative minus aggressive),从而能够更好地解释股票横截面收益率的差异。然而,有些小企业的股票收益率,和投资水平高、盈利能力低的公司相似。作者指出,五因素模型的主要不足就在于无法解释这类小企业的股票平均收益率为何如此之低。此外,引入RMW和CMA因子后,1963至2013年的美国股市数据表明,HML因子是“多余”的。 Fama和French于1993年提出的三因素模型在金融圈几乎无人不知,该模型很好地捕捉到了股票收益率与其市值和账面市值比之间的关系。三因素模型也一直是众多学者检验和挑战的对象。Novy-Marx (2013)发现,总盈利-资产比率(gross profits-to-assets)对股票横截面平均收益率,具有接近于HML 因子的解释能力。Aharoni, Grundy和Zeng (2013)指出,公司投资水平和股票平均收益率显著相关(亦可参见Haugen和Baker,1996、Titman, Wei和Xie, 2004、Fama和French,2006、2008等)。由此可见,三因素模型对预期收益率的描述并不全面,因为三个因子并不能解释由公司盈利能力与投资模式所造成的股票收益率差异。 基于上述理论及实证研究,Fama和French在原有的三因素模型中,加入了代表盈利能力的RMW因子和代表投资模式的CMA因子。与之前因子的构建方式类似,RMW是营业利润率(operating profitability)高的多元化投资组合的收益率,减去营业利润率低的多元化组合的收益率。CMA则是投资水平低(“保守”)的多元化投资组合的收益率,减去投资水平高(“积极”)的多元化组合的收益率。其中,营业利润率的衡量标准,是上一财年的总收入,扣除主营业务成本、利息支出和销售、一般及行政费用,再除以上一财年末账面权益总额。而对投资的衡量,则是用上一财年相对于之前财年的总资产增加额,除以之前财年末的总资产金额。 为了清楚地观察各个因子与收益率的关系,本文使用1963年7月至2013年12月的美国股市数据,采用类似Fama和French (1993)的方法对样本数据进行分析。作者分别根据市值-账面市值比、市值-营业利润率和市值-投资水平,对股票进行了3次5×5均分,每次得到25个投资组合。作者发现,总体而言,存在价值、盈利能力以及投资效应:即在控制其他变量的情况下,股票的账面市值比越高,营业利润率越高,投资水平越低,其平均回报率越高,这些现象在市值较小的股票中尤为明显。 在构造SML、HML、RMW和CMA这4个因子时,作者提出了三种投资组合划分的方法。第一种:分别根据市值-账面市值比、市值-营业利润率和市值-投资水平,对股票进行3次2×3划分,每次得到6个投资组合。以市值-账面市值比划分为例,作者将市值以纽交所均值为分水岭,划分为大、小2类;对账面市值比,则以纽交所的第30和第70百分位数为分水岭,划分为高、中、低3类。第二种:分别根据市值-账面市值比、市值-营业利润率和市值-投资水平,以纽交所均值为分水岭,对股票进行3次2×2划分,每次得到4个投资组合。第三种:根据市值-账面市值比-盈营业利润率-投资水平,对股票进行1次2×2×2×2的划分,得到16个投资组合。作者认为,第二种方法在构建因子时,使用了全部股票,而第一种方法却没有使用第30至第70百分位数的股票,因此第二种方法构建的因子更为多元化;而第三种方法,则能更有效地从平均收益率中,分离出市值、账面市值比、营业利润率和投资水平的风险溢价。 作者进行回归分析,并按照Gibbons,Ross和Shanken(1989)的方法进行检验。GRS统计量表明,五因素模型并不能完全描述股票的期望收益率,但是五因素模型依然可以解释71%至94%的不同组合收益率在横截面水平上的差异。五因素模型的GRS统计量值小于三因素模型,回归的截距项(代表异常收益)

数学建模之因子分析法

因子分析 因子分析就是一种降维、简化数据的技术。它通过研究众多变量之间的部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。 1.因子分析法的应用 ①汽车行业业绩评价研究(下载文档), ②上市公司盈利能力及资本结构实证分析, ③生育率影响因素分析。 2.步骤 ①对原始数据进行标准化处理 用12,, ,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i 个评价对象对应于第j 个指标的取值。将每个指标值ij a 转化为标准化指标ij a ,即 ,(1,2, ,;1,2, ,)ij j ij j a a i n j m s μ-= == 式中:11n j ij i a n μ==∑,21 1()1n j ij j i s a n μ==--∑ 相应地,标准化指标变量为 ,(1,2, ,)j j j j x x j m s μ-= = ②计算相关系数矩阵R ()ij m m R r ?= 1 ,(,1,2, ,)1 n ki kj k ij a a r i j m n =?= =-∑ 式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。

③计算初等载荷矩阵 解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再 求出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j j mj u u u u =, 得到初等载荷矩阵为 11, ,m m u λ?Λ=? ④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11 85%k m i i i i λλ ==≥∑∑的这k 个主因子,对k 个因子载 荷矩阵作旋转,用() 1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()21k T Λ=Λ,建立因子模型,即 1111111, . k k m m mk k x F F x F F αααα=++?? ??=++? ⑥计算因子得分,作出综合评价 求出单个因子的得分函数?j F ,用?ij F 表示第i 个样本对第j 个因子的得分估计值,Y 表示原始数据标准化后的矩阵,则总得分为 1??()ij n k k F F YR -?== Λ 例题 我国上市公司赢利能力与资本结构的实证分析已知上市公司的数据见表1 表1 上市公司数据

多因子定价模型检验,波动和投资组合Tests of Multi-Factor Pricing Models, Volatility, and Portfolio Pe

NBER WORKING PAPER SERIES TESTS OF MUTLIFACTOR PRICIN G MODELS, VOLATILITY BOUNDS AND PORTFOLIO PERFORMANCE Wayne E. Ferson Working Paper9441 https://www.360docs.net/doc/1d1276172.html,/papers/w9441 NATIONAL BUREAU OF ECONOMIC RESEARCH 1050 Massachusetts Avenue Cambridge, MA 02138 January 2003 The author acknowledges financial support from the Collins Chair in Finance at Boston College and the Pigott-PACCAR professorship at the University of Washington. He is also grateful to George Constantinides and Ludan Liu for helpful comments and suggestions. The views expressed herein are those of the authors and not necessarily those of the National Bureau of Economic Research. ?2003 by Wayne E. Ferson. All rights reserved. Short sections of text not to exceed two paragraphs, may be quoted without explicit permission provided that full credit including . notice, is given to the source.

OLAP多维分析

0L人?多维分析一一流通行业审计新思路[摘要]信息技术全面发展的今天,财务信息系统的应用范围越来越广,特别是在流通行业,作用越来越大。同时,审计风险模型不断演变,风险导向审计的概念日益流行。在商品数据丰富的流通行业,审计亟待利用现有强大的财务数据仓库来进行数据分析,利用信息技术进行有效的审计决策。本文探讨了在流通行业中利用0[仙分析技术对数据进行多个维度的查询分析,快速确定审计风险数据和挖掘分析风险数据的审计新思路。 [关键词]OLAP多维分析审计数据仓库 一、OLAP多维分析技术介绍 联机分析处理(OLAP)的概念最早是由关系数据库之父£^ ^于1993 0( 年提出的,他同时提出了关于%仙的12条准则。 联机分析处理的用户是专业分析人员及管理决策人员,他们在分析业务经营的数据时,从不同的角度来审视业务的衡量指标是一种很自然的思考模式。例如在流通行业分析销售数据,可能会综合时间周期、产品类别、分销渠道、地理分布、客户群类等多种因素来考量。 联机分析处理的主耍特点,是直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型,在这里,维指的是用户的分析角度。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。这也是联机分析处理在近年来被广泛关注的根本原因,它从设计理念和真正实现上都与旧有的管理信息系统有着本质的区别。 数据仓库与OLAP的关系是互补的,现代OLAP系统一般以数据仓库作为基础,即从数据仓库中抽取详细数据的一个子集并经过必要的聚集存储到0LAP#

结构方程模型+验证性因素分析过程指标

在结构方程建模中,在观察变量到潜在变量的路径系数中,必须规定一条为1做标准求的其他路径系数和潜变量的值。潜变量之间就不用规定为1了。 内衍变量和观察变量都要有一个误差量e。 指标变量包括观察变量和误差变量 如何让绘图区变宽:可以在view里面的interface properties中点击landscape 在进入模型检验之前,首先检验是否出现违反估计: 负的误差方差存在 标准化系数超过或太接近1(通常以) 验证性因素分析 信度:建构信度 等于标准化因素负荷量和的平方/(标准化因素负荷量和的平方+(1-标准化因素负荷量的平方)的和) 收敛效度:平均方差抽取量:是指可以直显示被潜在构念所解释的变异量有多少是来自测量误差的,平均方差变异量越大,来自于测量误差越少,即因子对于观察数据的变异解释越大,一般是平均方差抽取量要大于,是一种收敛效度的指标。 等于标准化因素负荷量的平方之和/题目数目 验证性因素分析基本模型适配度检验摘要表: 是否没有负的误差变异量 e1 e2 e3 因素负荷量(潜在变量与观察变量之间的标准化系数)是否介于到之间 Variances 是否没有很大的标准误(路径系数的标准误) 整体模型适配度检验摘要表: 绝对适配度指数 卡方值,p大于,说明数据本身的协方差矩阵和模型的协方差矩阵是匹配的。 RMR值小于,

RMSEA小于(小于优良,若是小于良好) GFI大于,适配优度 AGFI 大于(调整后的适配度) 增值适配度指数 NFI大于 RFI 大于 IFI大于 TLI(也称为NNFI) 大于 CFI大于 简约适配度指数: PGFI 大于 PNFI大于 PCFI大于 CN 大于200 卡方自由度比小于,或者小于 AIC理论模型值小于独立模型值且二者同时小于饱和模型值 CAIC同AIC 验证性因素分析的内在质量参数表 所估计的参数均达到显著水平 w e 所有项目的信度均达到以上 潜在变量的平均抽取变量大于 潜在变量的建构信度(组合信度、构念信度)大于 标准化残差的绝对值小于(标准化残差:协方差矩阵的残差)修正指标: 修正指标表中MI小于 是否符合正态性检验,检验是否有异常值。

相关文档
最新文档