股票的交易数据拟合与聚类研究
因子分析和聚类分析在证券投资中的应用论文之最终版
![因子分析和聚类分析在证券投资中的应用论文之最终版](https://img.taocdn.com/s3/m/e99f5573a26925c52cc5bf2a.png)
因子分析和聚类分析在证券投资中的应用摘要:中国证券市场作为一个新兴的证券市场,从2001年以来,市场环境发生了重大的变化。
而市场环境的变化又导致盈利模式、投资策略和操作理念等诸多方面发生了深刻的变化。
投资者开始对价格操纵型的市场盈利模式进行反思。
本文通过因子分析和聚类分析方法分析了在中国证券市场如何进行投资决策的问题。
通过对证券市场的背景的分析,阐述上市公司投资取向研究的重要性。
通过因子分析为具体研究做好理论铺垫,并为优化各类投资者投资取向的选择提供可资借鉴的经验。
将聚类分析方法引入证券投资分析中,建立较为全面的综合评价指标体系,衡量样本股票的"相似程度"。
然后通过聚类分析模型来确定投资范围和投资价值。
该方法能帮助投资者准确地了解和把握股票的总体特性,预测股票的发展潜力,并通过类的总体价格水平来预测股票价格的变动趋势,选择有利的投资时机。
关键词:证券投资因子分析聚类分析AbstractChinese securities market as an emerging stock market, since 2001, great changes have taken place in the market environment. And the change of market environment and lead to profit mode, investment strategy and operation idea, profound changes have taken place in many aspects, such as. Investors began to reflect the market profit model of the price control type. This article through the factor analysis and cluster analysis methods to analyze how to make investment decisions in China securities market. Through the analysis of the background of the securities market, the paper expounds the importance of investment orientation of listed companies to study. Through factor analysis theory foreshadowing for the concrete research, the choice of all investors and to optimize the investment orientation provides the experience for reference. The clustering analysis method is introduced into the securities investment analysis, set up the comprehensive evaluation index system, comprehensive measure sample stock "similarity". And then through the cluster analysis model to determine the scope of the investment and investment value. This method can help investors to accurately understand and grasp the overall characteristics of stock, predict the stock development potential, and through the class's overall price level can be used to predict the change trend of the stock price, choose good investment opportunity.引言:中国证券业自二十世纪九十年代至今正在迅速发展壮大,随着我国市场经济建设的不断发展,人们的金融投资意识也在日益加强,越来越多的投资者把目光放到了证券市场。
聚类分析在股票投资分析中的应用
![聚类分析在股票投资分析中的应用](https://img.taocdn.com/s3/m/47616c7ca98271fe910ef985.png)
总资产利润率是净利润与平均资产总额的比值。 可以在一定程度上 反映上市公司实际整体盈利能力。 净资产利润率是净利润与平均净资产
之间的比值, 可以在一定程度上反映股东投资报酬大小。 主营业务收益
率实际上就是主要业务利润与主营业务收入的比值, 主营业务就是上市
公司主要利润来源以及发展方向。 如果具有越大的主营业务收益率, 就
选取数据指标的时候尽可能在不重复的时候, 选择时间跨度最小的、 增
加样本量比较多的指标。 基本数据来源区间 114 家基本股票样本, 并且适当的把不完整数据样本剔
除, 给出每只股票的净资产、 收益、 经营现金流、 净资产收益、 主营收
入增长率以及利润增长率等相关指标数据, 并以此分析和研究股票的投
关键词: 聚类分析; 股票; 投资分析; 应用
前言 现阶段, 社会在信息爆炸时代发展, 在此过程中会出现相应的不确 定因素, 需要合理利用数据分析的方式来分析数据, 保证能够从数据中 提取有效的信息。 股票市场是市场经济发展的重要部分, 并且逐渐朝着 规范化和成熟化方向发展。 但是, 股市变化莫测、 涨跌无常, 想要在股 市中得到一定的回报, 成为股市发展中的成功者, 需要充分研究和分析 上市公司的发展前景、 历史业绩等相关财务情况, 合理判断上市公司股 票价值。 1.聚类分析概述 聚类实际上就是把抽象或者物理对象进行集合分类, 形成由类似对 象构成多个类的过程。 通过聚类形成的簇是数据对象组合, 相比较同簇 中对象具有很高相似度, 但是相比较其他簇中的对象就存在很大差异。 利用描述对象的实际属性值来计算相异度[1] 。 在应用的时候, 能够适当 的把簇中数据当作整体进行分析。 聚类分析是经过众多领域研究得到 的, 主要包括统计学、 数据挖掘、 机器学习以及生物学。 聚类分析实际 上就是在相应给定的数据集合对象中, 适当的分为不同簇的集合, 也就 是说在某空间中规定了数据库中能够得到有限的例子集合或者得到有限 的取样点集合。 聚类的主要目的就是把相关数据信息聚集成类, 使得类 间具有最小的相似性, 而类内具有最大相似性。 聚类分析属于统计学中 的分支之一, 已经被大量运用到众多领域中, 并且可以在很多应用中使 用不同分析技术, 例如, 模式识别、 数据分析、 空间数据库技术以及图 像处理技术等。 利用聚类分析的方式来准确的识别稀疏区域和密集区 域, 并且能够在分析过程中找到全局布局方式以及相关数据间存在的联 系。 在实际运用的过程中, 聚类分析技术可以在不同的众多消费者中找 到具有一定特征的消费群体。 此外, 还能够对不同群体的消费模式进行 分析和研究, 以便于为企业在决策营销策略的时候提供保障和依据。 例 如, 聚类分析应用到网络信息中, 可以在一定程度上识别和分析不同种 类文档, 找到数据隐藏的模式。 聚类分析方法基本特征: 分析方式十分直观、 简单。 聚类分析一般 都是使用在研究性分析方面, 可以从多方面理解聚类分析结果, 最后在 众多结果中找到最符合实际情况的, 以此来进行后续分析以及主观判 断。 不管实际数据中是否具有不同种类的区别, 在进行聚类分析以后都 可以适当得到各种类别。 研究人员选择的聚类变量实际上就是聚类分析 的解, 删除或者增加变量, 都有可能会对最后的结果造成一定影响。 相 关研究人员在应用聚类分析的时候, 需要密切注意相关因素, 对于聚类 结果存在比较大影响的就是特殊变量和异常值[2] 。 2.聚类指标的选取利用 依据上市公司基本发展情况, 支持股票长期发展的主要因素就是成 长能力和盈利能力, 同时也是判断上市公司是否具有一定投资价值的基 本保障, 业绩良好的公司具有相对比较高的扩张能力。 适当的选出每股 收益, 主营收入以及净资产收益率等三个因素与股票息息相关, 以此来 判断影响股票发展的收益。 2.1 公司潜力指标
基于因子分析和聚类分析的股票分析方法
![基于因子分析和聚类分析的股票分析方法](https://img.taocdn.com/s3/m/60955c8ddaef5ef7ba0d3c81.png)
基于因子分析和聚类分析的股票分析方法【摘要】在股票投资市场不断发展的今天,由于各种限制因素,可供广大投资者选择的价值投资方式都存在不同程度上的缺陷。
本文选择沪深300指数成分股作为样本,运用SPSS软件因子分析与聚类分析的方法将样本股票排名、分组,对排名高低与各个分组的股票进行了特征分析,以此探索出了一种新的股票基本面分析方法,可以在较低维度综合考虑若干股票分析指标,并把股票分类,适应不同偏好的广大投资者的投资需求。
【关键词】因子分析聚类分析股票分析方法一、引言随着中国金融市场的发展,股票投资在中国早已成为了广大投资者投资组合的重要组成部分。
但是,散户投资者由于信息成本等原因大多更多的侧重于技术分析,一定程度上忽视了基本面分析;其次,西方现代股票定价理论如CAPM、Fama-French三因子模型、APT理论、MM理论,甚至DCF 现金流贴现法都存在着各自不容忽视的不足,以及欠缺在实践中的可行性;再次,国内机构投资者的选股理论存在较高运行成本或初始投资要求,散户投资者难以采用;国内目前实际中广泛采用的价值投资方法为主观赋权法,但此方法需要考虑的财务指标与财务数据很多,人为给定的权数客观性较弱会影响模型的准确性,也不适合散户投资者运用。
基于以上的原因,提供出一个适用于新时代背景下证券投资市场的证券分析方法具有充足的必要性。
本文将分析样本定为沪深300指数成分股,运用资产总计、产权比率、每股收益等十个指标进行因子分析,将原有十个指标降维成三个公共因子,然后基于降维后的数据,采用聚类分析的方法对样本股票进行分类处理,得到具有不同特征的股票分类,最后构造出一个在更低维度下综合考虑多项价值分析指标的适用于具有不同偏好的投资者的股票分析方法。
二、数据来源与处理本文的研究样本为沪深300指数的三百只成分股,数据来源为Wind 数据库中相应股票2013财年年度业绩报告数据,原始数据矩阵从略。
为了数据的可参考性,对样本中的唯一一只ST股票“*ST大荒”进行了剔除。
聚类分析在股票投资分析中的应用
![聚类分析在股票投资分析中的应用](https://img.taocdn.com/s3/m/195d17c2195f312b3169a553.png)
之 间 的 比值 ,可 以 在 一 定 程 度 上 反 映 股 东 投 资 报 酬 大 小 。主 营 业 务 收 益
现 阶段 ,社会 在信息爆炸时代发展 ,在此过程 中会 出现相应 的不确 定 因素 ,需 要 合理 利 用数 据 分 析 的 方 式 来 分 析 数 据 ,保 证 能 够 从 数 据 中 提取有效 的信 息。股 票市场是市场经济发展的重要部分 ,并 且逐渐 朝着 规范化 和成熟 化方 向发展 。但是 ,股市变化莫测 、涨跌 无常 ,想要 在股 市 中得 到一定 的回报 ,成为股市发展中的成功者 ,需要充 分研究 和分析 上市公 司的发展前 景 、历史业绩等相关财务情况 ,合理 判断上市公 司股 票价值 。
2 . 3股 市 走 势 指 标
聚类实际上就是把抽象或者物理对象进行集合分类 ,形成 由类 似对 象构 成多个类的过程 。通过聚类形成 的簇是数据对象 组合 ,相 比较 同簇 中对 象具有很高相似度 ,但 是相 比较 其他簇 中的对 象就存 在很 大差异 。 利用 描述对 象的实际属性值来计算相异度 …。在应用的时候 ,能 够适 当
聚 类 分 析 在 股 票 投 资 分 析 中 的 应 用
李 慧
摘 要 :在股票投资分析的时候应用聚类分析 ,可以更好 以及更加 准确的掌握投 资股票的特征,以便于可以确定投资范围,最后能够利用类来 分析出价格水平的总体高低情况来预测股票变动情况,正确选择投 资股票的时机 。聚类分析方式相比较于其他投资组合 来说,更加实用,在分析投 资股票的时候运用聚类分析方式,具有相对比较小的限制 因素,拥有相对比较强的操作性,有利于金融投资人 员进行应 用。聚类分析通过收益性以 及 成 长性 来综 合评 价股 票 ,可 以在 一定 程度 上指 导金 融投 资。本 文 主要 研 究 了聚 类分析 在股 票投 资 分析 中的应 用 。 关 键 词 : 聚 类 分 析 ;股 票 ;投 资 分 析 ;应 用
基于拓扑数据分析技术的股票价格时间序列聚类
![基于拓扑数据分析技术的股票价格时间序列聚类](https://img.taocdn.com/s3/m/d3e6129dcf2f0066f5335a8102d276a201296078.png)
拓扑数据分析方法介绍
01
02
03
拓扑数据分析
利用拓扑结构对数据进行 描述和分类,通过提取数 据间的拓扑关系,为后续 聚类提供依据。
拓扑结构提取
通过计算时间序列数据间 的距离、相似度等指标, 得到数据间的拓扑关系。
拓扑结构分类
根据提取的拓扑结构,将 股票价格时间序列数据进 行分类。
股票价格时间序列数据预处理
提出了一种基于拓扑数据分析技术的股 票价格时间序列聚类方法,该方法能够 有效地对股票价格时间序列进行聚类, 并揭示不同股票之间的相似性和差异性
。
通过实验验证了所提出方法的有效性和 可行性,结果表明该方法能够准确地识 别出股票价格时间序列中的相似模式, 并成功地对股票价格时间序列进行了聚
类。
通过对聚类结果的分析,发现不同股票 之间的相似性和差异性与其市场表现和 行业特征密切相关,这为投资者提供了
数据集划分
将数据集划分为训练集和测试集, 用于训练和验证聚类模型。
实验过程与结果展示
拓扑数据分析方法
采用拓扑数据分析方法对股票价 格时间序列进行聚类。
聚类算法选择
选择K-means聚类算法进行聚类 分析。
聚类结果展示
通过聚类结果展示,可以清晰地 看到不同股票价格时间序列之间
的相似性和差异性。
结果分析与讨论
02
聚类分析能够将具有相似特征的数据进行分类,为股票市场中
的价格波动分析提供有效手段。
拓扑数据分析技术的引入
03
拓扑数据分析技术能够揭示数据间的拓扑结构和关系,适用于
股票价格时间序列的聚类分析。
拓扑数据分析技术概述
01
拓扑数据分析定义
拓扑数据分析是一种研究数据间拓扑结构和关系的分析方法,通过对数
聚类分析在股票分析中的应用
![聚类分析在股票分析中的应用](https://img.taocdn.com/s3/m/f68a0f0603d8ce2f00662302.png)
6 08 095
, 一 内 」 月 叶  ̄勺 ‘ 曰 , 产 0 门 n 勺
当
q
dq 〔 二 X一q i) 艺、 一。〕 ; 一 。 i l ( 1
k=1
6 08 085
6 09 072
= 明氏距离变为绝对距离: 1 时,
d1 艺. 一k i) 二 二. ,一 、 (
察 值为x, 个样品看成p z把n i 维空间中 个点, 的二
则两个样品间亲疏程度可用 p维空间中两点的距
离来度量 。 令心表 样 x与 i 距 [ 定 示 品 , x的 离2 义 l 。
距离公式 , 采用明氏 本文 距离[, 3 即: ]
告( 证券之星数据中心)] [0 5
表 1 0 年度4 家上市公司4 0 2 4 0 项财务指标
R cv 2 A r 20 ; eid Jn 20 ; et 1 Jn 20 5 e 5 e i d pi 05 r s 1 ue 5 ac e e e 5 l v e 3 0 c p d u 0 A sat N w ra a o to u n s cs h e s c m r t Whe ei s c, nc s y nl e b r : o t e l s w t s d k iC i s t k k . i i sn t k is e a taa z ad t c h r m t h a t n n e e e o o o ae l n tg v o t e s r o y n '
当
q
606 074
602 0 77 604 0 70
k=1
= 时, 2 明氏距离变为欧氏距离:
60 2 0 72
6 03 066 601 068 600 0 49 60 6 037 605 032 603 039 603 03 1 602 038 60 1 039
聚类分析和因子分析在股票投资中的应用
![聚类分析和因子分析在股票投资中的应用](https://img.taocdn.com/s3/m/86804876ddccda38376bafbf.png)
理论探讨内蒙吉统计聚类穷析和因子分析在股票投资中的应用李德荣何莉敏李玉随着我国股票市场的不断发展,股票投资已经成为我国投资者的主要投资途径,而且也将成为我困投资者的重要投资渠道。
因此.他们必须重视上市公司的经营业绩.重视股票自身的晶质,即重视投资对象的选择。
面对众多股票及每个公司的众多财务数据,怎样才能客观、全面、准确的分析并选出绩优股和潜力股呢?多元统计方法中的聚类分析和因子分析在股票的综合评价中有着广泛的应用。
在对上市公司进行综合评价时.先用聚类分析进行分类.然后再利用因子分析法对多维变量进行降维。
降维后的变量是原变量的线性组合.并能反映原变量绝大部分信息,使信息的损失最小,对原变量的综合解释能力强。
该方法通过因子的方差贡献率来表示变量的作用。
可避免在系统分析中对权重的主观判断.使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服变量之间的多重相关性.使系统分析简化。
一、数据的选取本文研究的数据选自沪深两市A 股19家钢铁行业上市公司2006年数据.选择每股收益。
投资收益。
净利润等9项财务指标.对这些钢铁公司进行了聚类分析和因子分析,将它们进行分类。
为股票的分析和选择提供依据。
二、聚类分析通过SPSS 软件对样本数据进行层次聚类分析,层次聚类分析中,样本间的距离计算欧式距离、小类间距离以离差平方和法计算。
对样本数据作z 处理.即标准化.得表l 。
裘1样本屡次聚类中凝聚状态Clus te r C om bi n edStage C l u s t er Fi rstSt a g eC oe ffi c i ent sA ppear sN ext StageClus te r l C l u s t er 2Clus te r IC l u s t er 2I 2170.015O O I l26190.0360O 43l150.0600010446O .086O 2125350.1140O 106l l 160.14600877130.20I O 0128JJJ 80.2626l IC l u s t er C o m bi ne dSt age C l u s t er Fi rstStageCoef f i ei e nt sA ppear sN ext StageC l u s t er lC l u s t er 2C l u s t er lC l u s t er 29l O 140.3260O1410l 30.39935161l 2l l 0.48781512470.5774715139120.6720O 17148i 00.825O91615240.99l l I 12171681.295l O 141817291.5991513181822.2581617输出结果第一行数据的含义是在聚类分析的第一步中,2号样本与17号样本聚成一类,他们的样本离差平方和是0.015.这个小类将在聚类分析的第l l 步用到。
聚类分析在证券市场分析中的应用
![聚类分析在证券市场分析中的应用](https://img.taocdn.com/s3/m/f26e023bc1c708a1284a44f1.png)
山东交通学院毕业生毕业论文(设计)题目:聚类分析在证券市场分析中的应用摘要本文随机选取了40家在沪深上市的山东省的公司企业,选择每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率5项指标评价体系。
通过系统聚类分析方法对这40家公司企业的股票进行聚类分析,以此对股票的收益性、成长性等方面进行分析,帮助投资者准确地把握股票的总体特性以及预测股票的成长能力,使投资者及时做出最佳的投资决策,进而获得可观的投资回报。
最后在聚类分析的基础上,对聚类分析结果采用means方法进行检验,以此来进一步验证分析结果的可靠性和可信性。
此研究表明聚类分析方法在证券市场投资分析中具有有效性和实用性。
关键词:聚类分析,证券市场投资,means方法,投资回报AbstractIn this paper, we randomly selected 40 companies in Shandong province which were listed in Shanghai and Shenzhen stock market, and we choice the five indicators evaluation system that are the earnings of per share, the net assets of per share, the growth rate of the main business revenue, the growth rate of the main business profit and the yield of the net assets. In order to help investors to accurately grasp the overall features of the stock and the growth ability of the stock, we effectively use the method of the system clustering analysis to analyze the stock`s profitability, growth, etc, which were mentioned above the stocks of the 40 companies. Above all, this can help investors to make the best investment decisions, and get considerable returns in a timely manner. Finally, in order to further verify the reliability and credibility of analysis results, we use means methods to test the results of cluster analysis. The study shows that the method of clustering analysis has validity and practicability in the securities market investment analysis.Key words: Clustering analysis, Stock market investment, Means method,Return on investment目录1.绪论 (1)1.1论文研究的背景及意义 (1)1.2 聚类分析在证券市场分析中的应用价值 (2)1.3 聚类分析在证券市场分析中应用的优点 (2)1.4 聚类分析在证券市场分析中应用的当前状况 (2)1.5本文的研究内容及内容结构 (3)1.5.1 研究内容 (3)1.5.2 内容结构 (3)2.聚类分析 (4)2.1聚类分析的基本思想 (4)2.2聚类分析的方法 (4)2.3系统聚类法的基本思想和基本步骤 (5)2.3.1样本间距离的度量 (6)2.3.2类间距离的度量 (8)2.4 系统聚类分析方法的比较 (9)2.5系统聚类法中类个数的确定问题 (10)3.聚类分析在证券市场分析中的应用 (12)3.1 聚类分析在证券市场分析中应用时的指标评价体系的选择 (12)3.1.1盈利能力指标 (12)3.1.2成长能力指标 (12)3.1.3扩张能力指标 (13)3.2实证研究 (14)3.2.1原始样本数据标准化 (15)SPSS软件对样本公司股票进行聚类分析 (17)3.2.2用 19.03.2.3分类个数的确定 (22)3.2.4聚类结果 (24)3.2.5对聚类结果进行检验 (25)3.2.6结果分析 (26)4.总结和展望 (29)总结 (30)1.绪论1.1论文研究的背景及意义改革开放以来,随着我国市场经济的迅速、健康发展,国民的金融意识和投资意愿日益增强,而作为市场经济的重要组成部分——证券市场,正渐渐地走向成熟,越来越多的投资者把目光投向了股票,历史已经证明,股票不仅在过去是一种已经给投资者提供了可观的长期收益,并且在将来也会是提供良好机遇的投J西格尔,资媒介。
聚类分析和因子分析在股票研究中的应用.
![聚类分析和因子分析在股票研究中的应用.](https://img.taocdn.com/s3/m/6894aeecf90f76c661371a65.png)
Tab.4 Factor score
主成分
指标
1 2 3
每股收益-0.023 0.435 -0.076
每股净资产-0.131 0.311 0.035
净资产收益率0.019 0.382 -0.099
流通股本0.248 -0.203 0.083
主营业务收入-0.242 -0.052 0.661
18 600877中国嘉陵0.02 2.92 0.6721960 131895 12985-230.0 1069 926
19 600890长春长铃0.11 2.03 5.6220510 16032 5588-36.6 4275 4251注:资料来源.
2聚类分析[1]
聚类分析中采用离差平方和法聚类,相似性统计量选用欧氏距离系数.离差平方和法是由Ward提出来的,又称Ward法.其具体思想是:先将n个样本各自成一类,然后每次缩小一类,每缩小一类离差平方和就要增大,选择使类内离差平方和增加最小的两类合并,直至全部样本归类完毕.具体的计算过程如下.
上海理工大学学报
第24卷第4期J. University of Shanghai for Science and Technologyபைடு நூலகம்Vol.24 No.4 2002
文章编号: 1007-6735(200204-0371-04
聚类分析和因子分析在股票研究中的应用
柯冰,钱省三
(上海理工大学管理学院,上海200093
上述计算过程用SPSS统计分析软件[2]进行,并通过对聚类图的分析,划分为4类较合适,分类结果见表5中的第2栏.
3因子分析[3]
因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法.因子分析的基本思想是根据相关性大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低.通过因子分析,有可能用较少的不相关的综合指标来描述原来观察的每一分量,在尽可能少的信息损失情况下,降低分析问题的复杂性.
聚类技术在金融数据分析中的应用探讨
![聚类技术在金融数据分析中的应用探讨](https://img.taocdn.com/s3/m/112abf054028915f804dc2dd.png)
聚类技术在金融数据分析中的应用探讨摘要:聚类技术作为当前应用最广泛的静态数据分析技术之一,在多个领域发挥着重要作用,特别是在金融投资方面。
俗话说:物以类聚、人以群分,类就是相似的元素,聚类就是把相似的元素聚在一起,相当于一个集合。
聚类分析技术就是研究分类问题的一种统计分析方法。
在进行金融数据分析时,我们经常会使用到聚类技术,并且分析结果意义重大,例如对股票的涨势、收益进行分析,能够为投资者提供投资范围和价值,帮助投资者把握股票的整体特点,为投资者的投资决策提供依据。
本文主要讨论在是聚类技术在金融数据分析中的应用。
关键词:聚类技术;金融;数据分析;一、聚类分析(一)聚类分析概念聚类分析指的是把需要分析的数据根据数据类型进行分类,将相似的数据分在同一组,这样不同组之间的数据差异较大,通过分类,可以发现数据的分布模式和属性之间的相互关系。
(二)聚类分析方法聚类分析的最初想法是为了研究数据之间存在的不同程度的相似性,通过数的属性,进行归类,相似度大的归为一类。
从基本的思路上看,聚类分析方法有三大类:系统聚类法、分解法及动态法。
1、系统聚类法。
在给出样品间的距离和类与类间的距离定义的基础上,现将每个样品单独归为一类,计算出他们之间的距离,把相似的两类合并,以此类推,到最后样品都合成一类。
2、分解法。
分解法与系统聚类法刚好相反,它是将所有样品当成一类,再进行分解,直至最后每个样品各自成一类为止。
3、动态法。
动态法是先确定几个类型,然后再根据样品的属性进行归类,如果最初的类型有不妥,在归类的时候可以进行调整。
前两种方法计算量较大,需要的内存较多,主要适用于样本量不大的情况,后一种方法计算速度快,但是结果与前两者相比较不准确。
二、聚类技术对金融数据分析的意义在金融投资中,运用聚类分析对金融数据进行分析,可为投资者提供投资依据,提高投资的准确率。
(一)对原有的分析方法起到补充和完善的作用过去分析金融数据通常是采用基本面分析法,主要是采用定性分析来确定股票的总体特征和走势。
聚类分析和因子分析在股票投资中的作用
![聚类分析和因子分析在股票投资中的作用](https://img.taocdn.com/s3/m/2d0f831aa21614791711283c.png)
聚类分析和因子分析在股票投资中的应用摘要:随着我国股票市场的迅速发展和逐步完善,股票的投资特点和前景越来越受到投资者的追捧。
理性的投资者,将会更加重视上市公司的经营业绩和股票的内在价值。
但如何对股票的价值进行评价在实践中是个难点,对此进行探讨十分必要。
本文运用聚类分析对影响上市公司股票业绩的变量进行分类,运用因子分析模型得出决定股票业绩的公因子,并进行了比较。
关键词:聚类分析因子分析SPSS 股票投资分析1研究目的与方法1.1研究目的及意义随着我国股票市场的不断发展,股票投资已经成为我国投资者的主要投资途径,而且也将成为我国投资者的重要投资渠道。
因此,他们必须重视上市公司的经营业绩,重视股票自身的品质,即重视投资对象的选择。
面对众多股票及各个公司的财务数据,怎样才能客观、全面、准确的分析并选出绩优股和潜力股呢?本文选择30家上市公司作为研究对象,进行业绩评价。
目的是对上市公司财务分析的基础上,探索各上市公司的投资价值,为投资者提供一定的决策指导和理论参考。
1.2研究方法多元统计分析方法中的聚类分析和因子分析在股票的综合评价中有着广泛的应用。
本文采用的分析方法是因子分析和聚类分析。
在对上市公司进行综合评价时,先用聚类分析进行分类,然后再利用因子分析法对多维变量进行降维,降维后的变量是原变量的线性组合,并能反映原变量绝大部分信息,使信息的损失最小,对原变量的综合解释能力强。
该方法通过因子的方差贡献率来表示变量的作用,可避免在系统分析中对权重的主观判断,使权重的分配更合理,尽可能地减少重叠信息的不良影响,克服变量之间的多重相关性,使系统分析简化。
2文献综述2.1国外研究Serpil(2006)将主成分分析法和判别分析法结合起来,用来对早期综合预警模型的估计。
April Kerby, James Lawrence运用多元统计方法中的主成分分析和判别分析来作为选择好或不好股票的依据,另外,他认为这也是处理多变量高维复杂财经数据的一种方法。
聚类分析在股票市场板块分析中的应用
![聚类分析在股票市场板块分析中的应用](https://img.taocdn.com/s3/m/0e88ea7d842458fb770bf78a6529647d272834de.png)
XXXX 大学数学系, XX XXXXX本文将聚类分析应用于股票市场的研究,研究实例表明,聚类分析方法是股市板块分析中的一种有效、实用的方法。
聚类分析,板块,投资,系统聚类that cluster analysis is an effective and practical way in stock market analysis.Cluster Analysis;Board;Investment;System聚类分析又称群分析、点群分析,是定量研究样品或者指标分类问题的一种多元统计方法。
例如,我们可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素情况,将网点分为几个等级,再比较各银行之间不同等级网点数量对照状况。
我们所研究的样品(网点)或者指标(变量)之间存在程度不同的相似性(亲疏关系——以样品间距离衡量)。
于是根据一批样品的多个观测指标,具体找出一些能够度量样品或者指标之间相似程度的统计量,以这些统计量为划分类型的依据。
把一些相似程度较大的样品(或者指标)聚合为一类,把此外一些彼此之间相似程度较大的样品(或者指标)又聚合为另一类,直到把所有的样品(或者指标)聚合完毕,这就是分类的基本思想。
其中类指相似元素的集合。
聚类分析的概念认为所研究的样品或者指标之间存在着程度不同的相似性,根据一批样品的多个观测指标,找出能够度量样品或者变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或者变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。
聚类分析根据所用方法不同可分为系统聚类法、 有序样品聚类法、 动态聚类 法、含糊聚类法等等; 根据分类对象不同又分为对样品聚类(又称 Q 型聚类分析) 以及对变量进行聚类(又称R 型聚类分析)。
对前者聚类多用距离,而后者聚类 时多用相似系数。
在聚类分析中, 通常我们将根据分类对象的不同分为 Q 型聚类分析和R 型聚 类分析两大类。
股票市场中主成分分析及聚类分析的综合应用
![股票市场中主成分分析及聚类分析的综合应用](https://img.taocdn.com/s3/m/5ca37384dbef5ef7ba0d4a7302768e9951e76e36.png)
股票市场中主成分分析及聚类分析的综合应用郭茜【摘要】本文利用主成分分析对上证部分上市公司2008年三季度营销业绩进行评估,并且利用聚类分析的方法对股票市场进行研究,大量研究实例表明,这两类方法在股票市场的应用中具有重要作用。
【期刊名称】《科技风》【年(卷),期】2013(000)011【总页数】2页(P113-113,115)【关键词】主成分分析;评估;股票;聚类分析;R 软件【作者】郭茜【作者单位】西安汽车科技职业学院,陕西西安 710038【正文语种】中文改革开放30多年来,我国经济发展取得了显著成效,经济增长速度和发展水平也取得了令世人瞩目的成绩。
从2003年到现在,国民经济保持快速增长,市场经济建设高速发展,使人们的投资理财意识和金融意识逐渐增强,在市场经济中担当主力军角色的股票市场,对中国经济发展和社会稳定起着重要作用,并在政府的推动下,逐渐走向成熟与规范,促使更多投资者将眼光投向了股票。
然而“股市有风险,入市须谨慎”的口号时常回荡在股民耳旁。
股价涨跌无常,股市变幻莫测,所以投资者想从股市中赢得丰厚的回报,仅靠运气是行不通的,我们需要对各上市公司的管理,规模,最重要的是财务状况进行全面的分析与评价,找出真正的具有较高收益率的股票作为投资对象。
而通常情况下对上市公司的运营情况和财务状况的评价都是多指标分析,因此我们在做研究时需要选取各公司具有决定性的几个重要指标来做分析。
在股票中把具有共同特征的股票群称为板块。
股市中的板块可以多种角度来划分,而在每一板块中有几十种甚至上百种股票。
面对众多的股票及每个公司大量的财务数据,如何在各个板块众多的股票当中选出具有投资价值的绩优股和潜力股在多元统计分析中的聚类分析和主成分分析的方法,对此问题作出一些探讨。
下面我们以2008年30个上市公司第三季度的数据作为研究样本,进行具体分析说明。
(研究数据来自中国统计年鉴)系统聚类分析是一种将数据所对应的研究对象进行分类的方法。
【精品编辑参考】A股与B股投资的聚类分析样本数据选取与结果
![【精品编辑参考】A股与B股投资的聚类分析样本数据选取与结果](https://img.taocdn.com/s3/m/8cfe516e2e60ddccda38376baf1ffc4ffe47e2ad.png)
A股与B股投资的聚类分析样本数据选取与结果注:本文经过精心编辑,下载后可直接使用也可以编辑修改。
1 聚类分析思想聚类分析的基本思想是认为我们所研究的样本或指标(变量)之间存在着程度不同的相似性(亲疏关系)。
于是根据一批样本的多个观测指标,具体找出一些彼此之间相似程度较大的样本(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样本(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样本(或指标)都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。
最后把整个分类系统画成一张谱系图,用它把所有样本(或指标)间的亲疏关系表示出来。
2 聚类分析步骤聚类分析不仅可以用来对样品进行分类,而且可以用来对变量进行分类。
聚类分析的目的在于使类与类之间对象的同质性最大化和类与类之间对象的异质性最大化。
其分类步骤如下:(1)聚类前先对数据进行变换处理。
(2)聚类分析处理的开始是各样品自成一类(n 个样品一共有 n类),计算各样品之间的距离,并将距离最近的两个样品并成一类。
(3)选择并计算类与类之间的距离,并将距离最近的两类合并,如果类的个数大于 1,则继续并类,直至所有样品归为一类为止。
(4)最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。
3 聚类分析样本数据选取与分析结果一般来说,对于同一家上市公司,A 股和 B 股同股同权,则股票价格也应该相同。
但事实上并非如此,由于 A、B 股市场的分割,使两者之间的流动性、市场规模有着很大的差别,从而使得投资者对 A、B股的需求的差异和同股同权的 A、B 股价格上的不同。
本文在沪深两个交易所随机选取 20 家双重上市公司 2018 年第四季度 A、B 的市盈率、流通率(流通股本/总股本)、成交量 3 项指标,对这些公司股票进行了聚类分析,试图将它们进行分类,为股票的分析和选择提供决策依据。
股票的交易数据拟合与聚类研究
![股票的交易数据拟合与聚类研究](https://img.taocdn.com/s3/m/711df409fad6195f302ba604.png)
Tech-Economics and Management
Affiliation:
School of Management
Date of Defence:
July, 2012
Degree-Conferring-Institution: Harbin Institute of Technology
1.2 国内外研究现状及评述 ...........................................................................4 1.2.1 股票数据分析研究现状 ..........................................................................4 1.2.2 时间序列与函数性数据聚类研究现状 ..................................................6 1.2.3 研究现状评述 ....................................................................................... 10
The performance of the stock transaction data is affected by a number of factors, including a large amount of information. The stock transaction data reflect the functional characteristics on the whole. There are many limitations to use traditional time-series data analysis methods. According to this kind of the stock transaction data, we analyses them by the functional data analysis method. The main content is preprocessing and curve fitting for stock transaction data based on the functional characteristics of these data. This method could make the original data "abstraction". So we can obtain a unified coefficient matrix, and then using the coefficient matrix of reflecting stock characteristics function to cluster. In the end, we draw the corresponding conclusion about stock clustering, and these conclusions were explained reasonably.
沪深两市金融保险行业股票业绩的聚类分析
![沪深两市金融保险行业股票业绩的聚类分析](https://img.taocdn.com/s3/m/80eeb64cbe23482fb4da4c49.png)
薹釜融与证券——一、证券投资与聚类分析概述证券投资是指投资者(法人或者自然人)购买股票、债券、基金券等有价证券,及这些有价证券的衍生品,以获取红利,利息及资本利得的投资行为和投资过程。
证券投资分析是指人们通过各种专业性分析方法对影响证券价值或价格的各种信息进行综合分析以判断证券价值或价格及其变动的行为.是证券投资过程中不可或缺的一个重要环节。
证券投资分析有利于提高投资决策的科学性,有利于正确评估证券的投资价值,有利于降低投资者的投资风险,是投资者成功投资的关键。
行业是指从事闰民经济中同性质的生产或其他经济社会活动的经营单位和个体构成的组织结构体系。
文中主要研究的金融保险业是根据中国证监会公布的《上市公司行业分类指引》中的分类,主要包含银行业、保险业、证券期货业、金融信托业以及其他金融业,文中涉及的27家上市公司均属于此类行业。
聚类分析是一种多元统计分类方法,聚类分析的基本思想从一批样本的多个观测指标中,找出度量样本之间或指标之间相似程度(亲疏关系)的统计量,构成一个对称的相似型矩阵;在此基础上根据样本之间的相似程度并类.并计算新类与其它类之间的距离,再选择相近者并类,每合并一次减少一类,继续这一过程.直到所有样本都并成一类为止,最终形成一个亲疏关系谱系图,用以更自然和直观的显示分类对象(个体或指标)的差异和联系。
我们选用欧氏距离来度量类与类之间的相似程度,用M A T LA B软件进行聚类分析。
二、原始数据导入我们根据2008年第三季度业绩报告,用每股收益、主营业务利润率、净利润、净资产收益率考察股票的盈利能力;用总资产考察股票的规模大小;用每股净资产、20O9.1依计弓崔询票业绩的聚类分析文/张晓东股东权益比、每股公积金考察股票的股本扩张能力;用每股经营现金流考察股票的支付能力。
数据来源于民族证券阳删.e5618.t om)。
具体数据可以参见表表1。
表1样本原始数据A B C D E F G H17.69210682.309416127344I)6318054414544f)331699.41 23.3760.2921.0583”8—3.20254.158“1552122.1342613.52 31.250.126O.06534.550I】594.9310.0712%16.1345【)8.7 44.03805930.4225.05—692494.6914.68936837.6334459.24 532570.3(160.61536.5l—1.593.339.4113059732544867.81 62.93404060.36227.35—3.叭93.3813851796561.6368049()9 73440451I.5688493.55550.7513.110133298112672.%86.72917391.75834210.9450.4125.841115455529843%.63 93.7510.6220.752.41—1.05629.3219.7165262336310634.昕103.02804591.I】85536-0.33769.7915.1511154555298431)6.63 11795208894.05335.15—1.9458.5611.1915000462589770.3l 12568312921.啪5.4450557.6922.731547248961899900 134舯313810.71l35.53-4.31995.9228.756760993869045.59 142.41803190.94&67122653.3313.191册8675041245100 1503910【ll;20.09434.72-0.01834.6715.朔51153.92船3747 1645880.3222.7585f I.28-2.725I)5.【)47.037506742.5265193.船175.8530.663.3521132309962.7311.289496072121312.16 189.3381.明53.464505-11.7胡523320.199253126494265().13 195.()210.7052.5f)87.76一103263.()914.0440********昭I)2.31 2010166-0.f1966.17911.215.29—3.64-0.94666385()4-705()【)2l28f)504650.9175.521.86652.1716.58249129504功8900 227420.2780.3136.20.2451.S715949384346明927301)0 23637605n34.41715822.9663.697明310369003976f10 244.6790.4642.05813.974.2394.499.91946418001311100 2520460360.4116.530帖954.5817.627北363叽28423400 2678902330.296.髓033445刀13.0465%615045920(100玎099I-f)35604512—11()90-35.97350131.59-53568.01注:1一深发展A2一宏源证券3---陕国投A4一东北证券量一国元证券6一长江证券7一宁渡银行8一浦发银行9一华夏银行10---民生银行1l一中信证券12一招商银行13一国金证券14一中信银行15一安信信托16一海通证券1卜南京银行18一兴业银行19一北京银行20一中国平安21一交通银行22一工商银行23一中国太保24一中国人一经营与管理一企业经营者激励机制研究文/魏四明一、企业经营者激励机制的现状及存在问题经过20多年的改革,我国企业在经营者激励机制的构建方面虽然取得了一定的成效,但由于经营者激励机制的复杂性以及企业的经营实践的不断发展,经营者激励机制方面存在的问题仍然很多。
股票波动性的拟合与预测研究
![股票波动性的拟合与预测研究](https://img.taocdn.com/s3/m/2b3b5d36eefdc8d376ee3224.png)
股票波动性的拟合与预测研究摘要分别使用非线性自我激励门限模型(SETAR模型)和线性ARMA模型对股票市场进行比较研究并运用MAE和RMSE 方法比较两者的预测效果结果表明通过门限值的控制作用SETAR模型利用时序数据隐含的时序分段相依性这一重要信息,限制了模型误差,从而比ARMA模型更适合于描述股票波动的非线性规律关键词SETAR模型;股票波动性;ARMA模型0前言所谓SETAR模型是指一种特殊的TAR模型其阀值的选取是研究变量自身而不象一般的TAR模型阀值变量为其他变量该模型在研究非线性问题上日益受到国内外学者的重视SETAR模型被成功地用来预测一些生物和物理方面的进程,如预测lysn数据和太阳黑子的数目(Tong,1990),此外该模型在经济和金融方面也得到了广泛的应用TiaoandTsay(1994),Potter(1995)运用该模型对美国的GDP 进行了预测;Potter(1995)、PeelandSpeight(1995)年分别运用SETAR模型对美国和英国的GDP进行了预测,但是运用该模型对股票进行研究的文章一直较少,作者采用自我激励门限模型——Self-ExcitingThresholdAutogressiveModel(SETAR)对股票市场进行研究除了运用SETAR模型对股票进行拟合,还通过与ARMA模型的比较,对SETAR的预测能力进行检验本文第一部分对该模型进行一般的理论介绍;第二部分运用该模型对股票市场进行拟合与预测并与一般的ARMA(p,q)模型拟合与预测效果进行比较;最后为结论部分1SETAR模型通常我们假定一个时间序列{Y}在一个状态空间里服从线性自回归的特性然而实际情况往往并非我们假设的那样它可能属于两个或更多的空间这取决于该序列滞后值一般d可以取01…一直到允许的最大滞后长度在不同的空间它服从不同的AR(P)过程例如在两个空间状态的情况下可以定义一个SETAR(2;P1;P2)模型如下上述模型表明该过程在两个状态分别服从AR(P1)过程和AR(P2)过程一般可以把上述模型写成以下形式我们采用赤池信息准则(Akaike’slnformationCriterion,简称AIC)即通过使AIC 取最小值来确定d和p的值Tong(1990)指出此时SETAR模型的AIC准则可以通过两个表达式下AR模型的AIC准则求和来获得,即:AIC(p 1,p 2)=n 1ln 1+n 2ln 2+2(p1+1)+2(p2+1)其中 j 2是第j个分段表达式下残差的方差r 的值的确定可以采取黄金分割法,所谓黄金分割法,就是即在搜索过程中通过比较搜索点的函数值每次均以同等的比率0.618不断缩小极值点所在的区间,通过这样不断的缩小区间使之逼近某一值,该值即为所求的r值r的初始值区间我们可以采用如下做法:将时间序列y t按照升序进行排序,r的取值必须满足以下集合r{r|y [π(n-1)] ≤r≤y [(1-π)(n-1)] }(其中,π为一个分段表达式 的观测值占总的观察值的百分比),并且π可以比较安全的取得0.15(Franses,VanDijk,2000)计算选择在不同的d,p1,p2和阀值r下回归以上四个参数的决定遵循以下规则(1)回归残差不存在自相关;(2)最小AIC准则2实证研究2.1数据本文选取1997年1月1日到2007年12月28日的香港恒生指数作为样本(数据来源聚源数据库)所选用的数 据均为收盘价其中香港恒生指数共2725个交易数据令p t为t时的收盘价定义对数收益率y t=ln(p t/p t-1 ×100)2.2模型估计首先对时间序列进行平稳性检验运用EVIEWS软件进行ADF检验统计量计算得12.244035%显著水平下的临界值等于-2.863176不能拒绝原假设该过程为非平稳过程对该数据进行一次差分后再进行ADF检验统计量计算得-13.482985%显著水平下的临界值等于-2.863182拒绝原假设即为平稳过程通过运用黄金分割法进行搜索算得香港恒生指数r=0.29875对于门限变量和滞后期数的确定我们采取AIC准则通过选AIC取最小值可知当门限变量为滞后期数为1这时的模型为SETAR(254)运用最小二乘法(OLS)对参数进行估计得到对残差做相关性检验结果如下表表中给出了从滞后1到15阶自相关检验的Q统计值和假设自相关系数都为0的p值从结构来看在5%的显著性水平下不能拒绝原假设即所有的自相关系数为0因而残差不具有自相关性说明上述SETAR模型p1和p2的选取是合适的为了与非线性模型SETAR进行比较我们采用ARMA (p,q)模型运用EVIEWS软件进行ADF检验统计量计算得-7.30495%显著水平下的临界值等于-2.8624拒绝原假设即为平稳过程估计方程得y t=0.0545-0.3899y- t-1 +0.2792y- t-2 +0.1858y- t-3 +0.2292y- t-4 +0.1290y- t-5 +ε t-0.6170ε t-12.3预测能力比较现考虑SETAR模型的拟合程度以及预测能力的优劣DaccoandSatchwell(1999)指出预测结果好坏的关键因素是模型的选择并且进一步指出即使时间序列本身是由多个门限生成的对其进行拟合线性模型的绝对误差百分比(MAPE)可能比采用非线性拟合和线性模型的绝对误差百分比(MAPE)要小因此我们还需要进一步考虑均方根误差率(RMSE)和绝对误差平均MAE 其中RMSE=1n∑T+nt=T+1( t-y t) 2T 表示样本容量n表示样本外预测期数表示预测值是真值RMSE 通过若干个预测值对预测的相对误差进行综合评价;MAE=1n∑T+nt=T+1| t-y t|其中T表示样本容量n表示样本外预测期数 t表示预测值y t是真值RMSE通过若干个预测值对预测的相对误差进行综合评价要考察几个模型预测值的准确度主要看单步预测值的大小该预测值越小即MAE和RMSE值越小模型预测精度就越高对比分析如下表所示从表中我们可以看出SETAR模型的RMSE和MAE值均比ARMA模型小因此我们得出SETAR模型的预测能力比ARMA 要强3结论从以上分析可知用SETAR模型来拟合我国的股票波动效果明显的优于线性的ARMA(p,q)模型说明了在不同状态下股票市场表现出来的性质是不一样的一般的线性ARMA (p,q)模型则忽略了这种差异而SETAR模型准确反映了股票波动的这一特点这就是用SETAR模型来模拟和预测股票波动性其效果明显优于线性ARMA模型的原因门限自回归模型(SETAR)是一种能有效描述具有跳跃性、相依性、谐波等复杂现象的非线性动态系统门限的控制作用保证了门限自回归模型良好的稳健性和应用性在各种自然科学和工程领域内非线性时序预测具有广泛的实用价值另外因股市的建模与预测所处理的信息量往往十分庞大各因素间相关性错综复杂主次关系变化不定数量关系难以定量分析对算法有很高的要求正是其复杂的非线性特征使得关于股市的预测往往难如人意从根本上来说预测工作往往不是一次就可以完成的股票市场呈现非线性也不是一个独立的过程而是表现相互依存的关系其原因在于信息是以非线性的方式呈现的人们也以非线性的方式对信息作反应股价的波动也呈现非线性相应地通过股票市场也表现在股价指数上使得股价的指数所构成的时间序列分析呈现出非线性特征通过运用SETAR模型对股票的波动性进行拟合具有一定的实用价值利用该模型对股票市场进行预测具有可行性参考文献[1] 袁军.SETAR模型在GDP预测中的应用[J].统计与决策2007(5).[2]Tong.H.OnathresholdModel [J].RecognitionandSignalProcessing,1978,16(5).[3]DeGooijer,J.G.andP.DeBruin.OnSETARForecasting[J].StatisticsandProbabilityLetters,1997,160(12).[4]Peel,D.A.,andSpeight,A.E.H.Thresh0ldNonlinearitiesin Output:someInternationalEvidence[J].AppliedEconomics,1998,30:323-333.[5]Potter,S.M..ANonlinearApproachtoU.S.GNP[J].JournalofAppliedEconometries,1995,10:109-125.[6]张晓峒.EVIEWS使用指南和案例[M].北京机械工业出版社2007,(2).。
基于聚类分析的上市公司股票价值研究——以20支中国“工业4.0”概念股为例
![基于聚类分析的上市公司股票价值研究——以20支中国“工业4.0”概念股为例](https://img.taocdn.com/s3/m/57f4b0c7a6c30c2258019eaa.png)
基于聚类分析的上市公司股票价值研究——以20支中国“工业4.0”概念股为例摘要:本文以我国20家“工业4.0”上市公司2017年的年度数据为研究对象,主要从盈利能力、偿债能力、营运能力、发展能力中选取各公司8项细分财务指标,并借助SPSS软件进行数据整理和聚类分析。
实证分析结果反映出各类上市公司的经营绩效和股票价值,借此发现目前具有相对优势的“工业4.0”企业,为股票投资者提供有效的投资建议。
关键词:“工业4.0”;经营绩效;聚类分析;股票投资一、研究意义和目的当前“工业4.0”的发展受到越来越多人的瞩目,在“中国制造2025”战略提出背景下,资本市场也为众多投资者提供了大量的投资机会。
据此,本文意在对我国若干“工业4.0”上市公司的相关财务分析指标进行聚类分析,以此反映上市公司的经营绩效和股票价值。
根据聚类分析的结果,寻找出聚为一类的不同企业所共有的特点,并对其未来发展趋势进行预测,得出合理的分析结果,既能帮助公司所有者和经营者了解自身运营过程中的优势和不足,为其提供策略引导,也能为股票投资者提供行之有效的投资建议,以确定最优的投资方案。
二、文献综述国内学者对公司的经营绩效和上市公司的股票表现进行了大量研究,并取得了一些成果。
归璐(2017)经过杜邦分析法构建上市公司的综合业绩评价体系,认为其财务绩效可通过相关股票指标得以反映[1]。
陶冶和马健(2005)运用聚类分析和判别分析方法,对38家中小企业板上市公司的其盈利、成长和扩张能力进行定量分析,据此归结出整个板块股票的分类及其特点[2]。
李庆东(2005)应用聚类分析方法对股票市场石油化工板块进行了分析和分类,认为行业跨度较大的企业,很多时候也可能存在聚为一类的结果[3]。
郭俊峰(2015)选取十支上市公司的股票,将聚类分析法与相对价值理论相结合,指出了股票投资中易被忽略的因素,强调了股票价值的挖掘方法[4]。
杨林等(2014)以金融业股票投资价值为研究对象,利用因子分析法和聚类分析方法,体现股票投资价值的四项指标,认为在金融业上市公司中银行类股票值得关注、较为安全、适宜投资[5]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要
摘要
随着中国股票市场的迅速发展,市场的规范化程度不断提高,股票品种也 有了向多元多层次化发展的趋势,吸引了越来越多投资者的目光。为减少投资 风险,获得丰厚的利润回报,理智的股票投资者将会更加重视投资对象的选择。 表达股票数据的真实意义对投资者来说是关键,而股票交易数据包含了大量的 信息,对股票交易数据的分析就显得特别重要。
硕士学位论文
股票的交易数据拟合与聚类研究 STUDY OF THE FITTING AND CLUSTERING ABOUT STOCK
TRANSACTION DATA
乔鑫
哈尔滨工业大学 2012 年 7 月
国内图书分类号:F224.9 国际图书分类号:336.7
学校代码:10213 密级:公开
管理学硕士学位论文
将函数性数据分析方法应用于分析研究函数性数据中,改善了传统分析方 法对数据要求的约束,这样不仅增加了可分析数据的范围,而且扩大了函数性 数据分析方法的应用领域。将该方法实际应用于现实股票交易数据的拟合和聚 类分析中,得到了非常理想的结果,表明了方法的有效性,该方法也能够为投 资者提供很好的决策依据。 关键词:股票;函数性数据;数据拟合;聚类
1.3 论文研究内容和结构 ............................................................................. 11 1.3.1 研究内容 ............................................................................................... 11 1.3.2 研究结构 ............................................................................................... 11
股票交易数据的表现受很多因素的影响,包含信息量较大,总体上体现出 函数性特征,采用传统的时间序列数据分析方法受到很多局限。为此,根据股 票交易数据的函数性特征,借助函数性数据分析方法,对股票交易数据进行了 有针对性的分析。主要内容是基于股票交易数据的函数性特征,对股票交易数 据进行预处理和曲线拟合,使得原始数据“抽象化”,进而得到统一的函数系 数矩阵,再借助系数矩阵对反映股票特性的函数进行聚类,得出相应的股票聚 类结果,并对结果进行了合理解释。
1.1 研究背景及目的意义 ...............................................................................1 1.1.1 研究背景 .................................................................................................1 1.1.2 研究目的 .................................................................................................2 1.1.3 研究意义 .................................................................................................3
-I-
Abstract
Abstract
With the rapid development of China's stock market and the high degree of standardization of the market, stock varieties have a tendency to become multi-typical and multi-level. So stock market could attract more and more investors. In order to reduce investment risk and obtain high profit return, rational investors will pay more attention to the choice of stock investments. Expressing real meaning of the stock data is critical for investors. Because of stock transaction data containing a lot of information, analysis of stock transaction data is particularly important.
Limitation of traditional analytical methods for functional data has been improved by using functional data analysis. This method not only increases the scope of the analysis of data, but also expands the applications of functional data analysis methods. In practically, fitting and cluster analysis about stock transaction data by this new method could obtain the ideal result, which reflect the validity of the method. It can provide a better basis to investors for decision.
1.2 国内外研究现状及评述 ...........................................................................4 1.2.1 股票数据分析研究现状 ..........................................................................4 1.2.2 时间序列与函数性数据聚类研究现状 ..................................................6 1.2.3 研究现状评述 ....................................................................................... 10
STUDY OF THE FITTING AND CLUSTERING ABOUT STOCK
TRANSACTION DATA
Candidate:
Qiao Xin
Supervisor:
Associate Prof. Li Baojia
Academic Degree Applied for: Master of Management
The performance of the stock transaction data is affected by a number of factors, including a large amount of information. The stock transaction data reflect the functional characteristics on the whole. There are many limitations to use traditional time-series data analysis methods. According to this kind of the stock transaction data, we analyses them by the functional data analysis method. The main content is preprocessing and curve fitting for stock transaction data based on the functional characteristics of these data. This method could make the original data "abstraction". So we can obtain a unified coefficient matrix, and then using the coefficient matrix of reflecting stock characteristics function to cluster. In the end, we draw the corresponding conclusion about stock clustering, and these conclusions were explained reasonably.
Speciality:
Tech-Economics and Management
Affiliation:
School of Management
Date of Defence:
July, 2012
Degree-Conferring-Institution: Harbin Institute of Technology
Keywords:stock, functional data, data fitting, clustering
- II -
目录
目录
摘 要 ....................................................................................................................... I ABSTRACT ............................................................................................................. II 第 1 章 绪 论 .........................................................................................................1