股票相关性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

构造股票相关性网络



将每一只股票看作一个节点,股票与股票之间的关联 关系看成边; 当股票 a 的价格变化影响股票 b 的价格变化时,则它 们的关联关系是从 a 指向 b 的。当股票 b 的价格变化 影响股票 a 的价格变化时,则它们的关联关系是从 b 指向 a 的; 当 a 对 b 的影响大于 b对 a 的影响,则认为两只股票 的关联关系是从 a 指向 b,反之则是从b 指向 a。


假设微粒群的节点搜索位置空间的维度为 D 维 ,粒子的编码使用某种属性下的关联股票的 属性值。初始化选取m个粒子构成的粒子群, 粒子的空间优化问题就是选取属性关联下的符 合目标函数的粒子。 空问中第 i个粒子的编码就是选取的分析股票 下某种属性的属性值,表示为以下的形式Xi = (Xi1 ,Xi2 ,…Xin ) ,n代表分析股票的总数。

依据支持度找出所有频繁项集 依据置信度产生关联规则
项集(Itemset):同时出现的项的集合。定义为:k-itemset(k项集)。
Apriori算法


首先,找出频繁“1项集”的集合,该集合记作L1。L1 用于找频繁“2项集”的集合L2,而L2用于找L3。如此 下去,直到不能找到“K项集”。找每个Lk都需要一次 数据库扫描。 置信度大于给定最小置信度minConf的关联规则称为频 繁关联规则(Frequent Association Rule)。
数据预处理



插值:由于连续交易的时间间隔不同,因此在一个时 间段内,甚至可能没有任何的记录。按照给定的时间 单元间隔对高频交易数据采样,选择最近的一个价格 点填充。 小波分析:股票的价格变动可以看作一个一维离散信 号,对于一维离散信号来说,其高频部分影响的是小 波分解的第一层细节,其低频部分影响的是小波分解 的最深层和低频层。小波降噪的过程,就是把信号分 解为多个子信号,通过对小波分解系数的处理去掉其 中的噪音部分,然后把余下部分进行合并重构的过程。 使用SYM8小波,对价格信号进行两层分解,对分解得 到的分解系数进行Heursure阈值处理。
协同微粒群
第i个粒子空间更新的速度为 第i个粒子历史最优位置为 整个粒子群历史最优位置 粒子可以根据如下的公式进行速度与位置的更新
K 为微粒群中优化的迭代次数,r 1和 r2是在区间 [0 ,1]上的随机数,这两个随机数能够有效保持 微粒群优化的多样性。 C1和 C2是两个学习因子,这两个系数可以保证粒子对全局位置的学习能力。
协同微粒群
支持度挖掘粒子群
S(i),S(R)分别表示微粒的支持度与用户预先设置的支持度。 cov(A+B)是指两种事件在数据库中的比例。
置信度挖掘粒子群
协同微粒群
初始化m个粒子
支持度微粒群
符合适应度
规则度微粒群
规则提取
更新
粒子更新 能力保持 不符合适应度
进入规则微粒群更新
粒子补充
Apriori算法
股票的关联规则挖掘
目录

Copula函数 股票相关性网络 协同微粒群 Apriori算法
Copula函数


一致性相关系数τ:度量了两个随机变量的变 化一致性或协调性(同时增大或减小)程度。 τ=P[(x1-x2)(y1-y2)>0]-P[(x1-x2)(y1-y2)<0] τ 的取值在[ -1 ,1 ]之间 对n个二维样本(xi,yi),c表示一致变化的数量,d 表示不一致变化的数量:
Copula函数

尾部相关性:度量两支股票之间暴涨暴跌的指 标。 引入条件概率:P{X1>x1|X2>x2}:当X2>x2 时X1>x1的概率是否会发生变化,x1,x2相当 大时,就是X1和X2的尾部相关性。

Copula函数


Copula函数描述的是变量间的相关性,实际上 是一类将联合分布函数与它们各自的边缘分布 函数连接在一起的函数。 利用Copula函数可以计算一致性相关系数。
构造股票相关性网络

任意选取两只股票 a 和 b,则 a 股票和 b 股票的相关 性系数为:
其中
构造股票相关性网络
根据关键点可以对股票网络进行板块划分
协同微粒群

将粒子编码为影响股票走势的各个相关因素, 粒子通过适应度函数来进行更新,并且在更新 的过程中保留原来的较优成分进行遗传。
协同微粒群
数据预处理


涨幅z定义如下:若第I时刻成交价为Pi ,第I-1 时刻成交价为Pi-1 ,则涨幅z=( Pi - Pi-1 )/Pi-1 。 同时约定:z > 1%时为涨,记为1;z < -1% 时为跌,记为0。 考虑时滞性:以时间窗口的个数作为事务项。
ห้องสมุดไป่ตู้据预处理
数据预处理
数据预处理
构造股票相关性网络

利用股票的相关性网络找出关键点并进行板块 划分。投资者的盈亏大约80%是来自于买卖时 机的选择,还有20%的比例是来自于板块和个 股的选择。如果个股所属的板块整体有行情, 那么买卖这样的个股盈利可能性更大。
Apriori算法

挖掘关联规则

频繁项集 关联规则
相关文档
最新文档