牛津博士王宁:大数据和量化金融从机器交易高频交易到大数据交易 数据派 数据观 中国大数据产业观察

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

牛津博士王宁:大数据和量化金融,从机器交易、高频交易到大数据交易数据派数据观中国大数据产业观察

牛津博士王宁:大数据和量化金融,从机器交易、高频交易到大数据交易

时间:2015-09-02 10:53:21

作者:数据派

本讲座选自2015年8月27日在2015中国国际大数据大会主题论坛五──牛津大学NIE金融大数据实验室、数据科学高级研究员、博士王宁所做的题为《大数据和量化金融,从机器交易、高频交易到大数据交易》的演讲。

王宁:很高兴来到这里,我是第二次参加这种会议了。我这次是以第二个身份来的,就是牛津大学NIE金融大数据实验室,代表实验室过来,今天主要分享一下我们实验室做的关于量化金融的思考跟案例。

首先简单介绍一下我们的大数据NIE实验室,是一个全新的实验室,是2013年11月正式成立的,我们实验室

的定位是世界主要大学的第一个以金融大数据为研究方向的实验室,我们是交叉学科的实验室,目的是把数据科学运用到金融领域,包括很多学科交叉在一起。因为我们的接口是牛津大学金融数学系,这个系框架上有金融、计算机、统计,我们致力于做一个产学研交流合作的平台。

我们主要研究的方向:包括行为金融学、第二个是机械学习在金融领域的应用。第三是一些金融的模型,特别基于数据的金融模型,数据来源主要是结构和非结构化数据。第四就是金融决策,就是我们说的情感分析,怎么用互联网包括社交媒体大数据帮助我们做一些金融决策。最后就是风险控制,也是我们常说的互联网金融怎么样能够把风险控制下来。

我们主要的提出的问题是几个挑战:

金融大数据对行业带来的挑战是什么?

大数据具体在金融领域的主要应用是什么?要真正对行业起到推进作用。

金融更多是关注未来的东西,怎么样能够更好预测未来的东西,降低风险?

最后是决策,怎么设计科学合适的机制,基于大数据机制,最终通过人或者机器进行自动化的决策?

回到我们的主题,金融行业首先核心它是一个决策的机制。一个交易员,自己买股票每天要面对很多决策,是买这个股票还是卖,是买这个基金还是卖这个基金,买是什么时候买,卖是什么时候卖,买还是卖是一个问题,而且这个问题很难找到答案,而且这个问题还是跟时间相关,就是你的时间点要拿捏非常好,如果买得早或卖得早有可能对你金融的盈利模式产生影响。所以最终归根到底不管是交易员的交易还是机器交易,最终金融数学,包括机器交易,核心是一个决策的问题。

一提到决策的问题千百年来有很多决策都是通过人来进行的,这位是诺贝尔经济学奖的得主,他是心理学家拿到经济学奖,他有一个理论就是每个人都有趋利避害的心理,对我有利的东西永远愿意接受,对我有害的东西我永远不太容易接受。这个在学术包括心理学有很多现成的案例,最简单的比方,中国的很多股民都是普通的散户,包括我自己的母亲也是,她买了股票以后股票一跌就不愿意卖了,就放在那里了,股票继续跌,你现在卖了也是在赚钱,你卖得早可能亏得更少,但是她的趋利避害的心理导致她股票一掉就放在那不管了,相反股票一涨她也不愿意卖,觉得会涨更好。所以无论是很资深的交易,还是散

户,每个人与生俱来都有趋利避害的心理,他永远希望看到好的事情发生,不好的事情永远不愿意看到。

所以这就导致我们所说的机器交易的发展,因为机器是没有感情的,你跟机器交易,一百块钱和一个亿对机器来说只是一个数字,而且机器不会受情感的影响,也不会受外界环境的影响。所以在西方,特别是华尔街产生一个新的工业就叫机器交易,或者说叫高频交易,这是一个简单的流程。高频交易的历史简单介绍一下,人类第一个股票交易所是在阿姆斯特丹,那时候信息不发达,通过信鸽传递信息,进行套利交易。1983年用了三千万元投资发明了历史上第一个实时的市场数据电脑系统,可以通过这个系统进行金融的计算,所以到今天彭博社在这个领域还是很领先的,在欧美很多的交易员还是非常熟悉彭博社提供的终端。在1996年美国的证监会通过立法允许了这种电子交易,最新的一个数字是美国华尔街时报有一个统计,说现在全世界在西方的金融市场70%的交易都是通过机器进行完成的。

这位是我们的一个前辈,大家知道叫西蒙斯,他建立的一个公司叫文艺复兴,他前身是一个数学家,MIT毕业,然后去美国国防部的机构研究密码,后来跟上司不愉快,

就回到美国的大学任数学系主任,做了一段时间觉得没有意思就进入了金融市场,他的公司叫文艺复兴公司。就是全世界做量化投资做得最好的,而且它的平均业绩每年可以达到30%以上的市盈率,它的基金的市盈率是远远超过像巴菲特他们的基金的。他的基金成功的唯一秘诀他是不会跟别人讲的,但是他有一个案例跟大家分享过,他的基金就是通过机器交易,没有任何人的参与,他在华尔街雇了很多高端的理工科毕业生,进行大量计算,通过模型交易,他说人不可信,只有通过机器交易才可以。

这是高频交易的显示度,不到一分钟做了1.8万次交易,频率非常高。高频交易的行业有过一个萎缩的情况,因为高频交易行业进入了一个瓶颈,这个瓶颈就是随着进入这个行业的人越来越多,门槛会提得很高,最后实际很多算法和模型都是基本上公开或者半公开状态,最后拼的是你的硬件和速度,高频交易是和时间赛跑,你的系统的速度怎么样,运算速度怎么样,包括宽带接口速度怎么样可能决定你最后的盈利。最后大家很多公司都是花了很大的钱投资于硬件和网络,实际是以速度的差值赚钱,最终导致很多小的对冲基金进行大量的投资还是竞争不过大基金,最后就倒闭了。所以对冲,整个高频交易行业进入了一个怪圈,有点像当时美国跟俄罗斯的军备竞赛的形式,

最后大家花了很多钱投资硬件,通过速度领先于同行业对手,通过速度差值赚钱,所以这个也就是一个高频交易从2013年开始有点慢慢在萎缩的部分的原因。

我们这里讲主要说高频交易现在既然有瓶颈,我们能不能跳出金融的量化的模式,从另外一个角度看,从大数据角度看能不能找到一个新的途径。所以我们就说从高频交易到大数据,大数据现在实际对整个行业,包括金融交易带来一个新的机遇,就是现在我们可以获取的数据远远不是以前的金融的交易,包括买卖的信息。我们可以跳出这个行业,在互联网的社交的领域能够看到有没有其他的可能性。

这是一个简单的例子,在一个银行发布的报告,提出在谷歌的搜索引擎里,它可以通过搜索房地产中介关健词流量的变化,可以准确预测英国房价的变化,两者有很高的关联性。基于这个理念也是我的一个朋友,他原来是波士顿大学,现在在英国华威大学,他提出通过谷歌搜索引擎做交易的一个模型,大家可以看到下面是标普500的走势,可以通过不同的关健词,上面是谷歌的关健词的流量变化,可以看到雷曼兄弟关键词大幅变化的时候,标普500

相关文档
最新文档