全球大数据领域20位最顶尖人才

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全球⼤数据领域20位最顶尖⼈才
⼤数据不只是要处理很多的数字,还得要通过这些数字建⽴模型、深⼊挖掘,并且寻找那些有可能改变企业运营⽅式的信息。

以下谨为⼤家介绍20位⼤数据领域的顶尖⼈才。

Pinterest数据科学家安德莉亚·伯班克
Pinterest是⼀家以图⽚为主的社交⽹络,数据科学家安德莉亚?伯班克主要负责该公司的A/B测试,评估公司⽹站、APP的外观或功能变化会对它的6000万全球⽤户产⽣哪些影响。

如果Pinterest⽹站上的某个⼩模块让你想邀请朋友也来玩⼀玩,或是某⼀封它发来的推荐邮件让你关注了更多话题,那么这很可能就是伯班克团队的那只“看不见的⼿”起了作⽤。

她在今年三⽉的⼀次⾏业会议上表⽰:“为了今后能为⼏⼗亿⽤户提供服务,我们已经针对⼏百万⽤户做了数百次试验。

”试验还拓展到了Pinterest⾃⾝的运营上。

伯班克最⼤的成就之⼀,就是给Pinterest的其他员⼯赋权,让他们也能开展试验。

她表⽰:“以前只有⼀个故障点,但也只有⼀个知识点,现在不同了。

”——Andrew Nusca
 0xdata公司物理学家、⿊客阿诺·康代尔
阿诺·康代尔从⼩就⽣长在⼀个科研氛围浓厚的环境中。

他出⽣于瑞⼠⼀个叫做下锡根塔尔的⼩村⼦,这个村⼦恰好位于拥有欧洲顶级粒⼦加速实验室的保罗谢尔学院(Paul Scherrer Institute)和欧洲⼤陆最着名的科技院校苏黎⼠联邦理⼯学院(ETH Zürich)之间。

在学习粒⼦物理学和超级计算机学期间,康代尔曾经在电脑上建⽴过宇宙的模型。

后来他搬到美国加利福尼亚州,在斯坦福⼤学直线加速器中⼼的全国加速实验室中⼯作(SLAC National Accelerator Laboratory),后来⼜开始创业,成为Skytree公司的创始⼯程师,并且设计了⼏套⾼性能的机器学习算法。

现在他是Oxdata公司h2o数据分析平台的核⼼开发者,他开发的这个h2o平台,被编程社区GitHub的成员誉为最优秀的开源Java机器学习项⽬,⽽且它还可以兼容流⾏的统计编程语⾔——R语⾔。

他在Oxdata公司的头衔是“物理学家兼⿊客”。

——Robert Hackett
Hortonworks联合创始⼈阿兰·默西
阿兰·默西最早在雅虎公司(Yahoo)⼯作,现在已然⽤途极⼴的开源存储和处理软件Hadoop在那时尚处于早期原型阶段。

默西的团队的任务就是扩展Hadoop的功能,让它⽤于雅虎的⽹页搜索。

于是默西研发了⼀个名叫YARN的资源负载管理系统,它的作⽤⼤致相当于Hadoop的⼀个操作系统。

默西表⽰:“第⼀版的Hadoop看起来就像还在⽤Notepad的Windows,但是我们真正想要的是能⽤Powerpoint、Word和Excel的
Windows。

”这正是YARN的魅⼒所在:它允许⽤户向Hadoop中插⼊多种应⽤以存储各类信息。

默西表
⽰:“我家⾥有两个孩⼦,但YARN就像是我的第三个孩⼦。

”——Robert Hackett
NuoDB⾸席执⾏官巴⾥·莫⾥斯
很多科技公司都想发起⼀场技术⾰命,但是很少能获得上⼀波技术⾰命领导者的⽀持。

马萨诸塞州剑桥市的NuoDB公司却⼀举⽹罗了上⼀波数据库⾰命“四⼤天王”的其中之三——Ingres公司前CEO加理?摩根泰勒、Sybase公司前CEO⽶切尔?克兹曼、Informix公司前CEO罗杰·斯普尔。

只有最后⼀名“天王”,也就是甲⾻⽂(Oracle)的CEO弃权了,但他也⾝在投资⼈之列。

这么⼀家名不见经传的公司何以有这么⼤的号召⼒?因为NuoDB的技术解决了⼀个多年来被⾏业视为“圣杯”的问题:如何让⼀个数据库在多个服务器上运⾏。

“关键在于⽤更多的机器,⽽不是更⼤的机器。

”该公司CEO巴⾥?莫⾥斯表⽰:“那个问题听起来虽然简单,但⼀直没得到解决。

”DuoDB公司成⽴于2010年,现在这家公司已经签下了⼀个⼤客户——欧洲第⼆⼤软件⼚商达索系统公司(Dassault Systèmes)。

另外莫⾥斯认为,公司正在飞速朝着⼀个“新的聚焦点”迈进。

他认为DuoDB将⾛上舞台的中央。

“它的意义不在于数据的规模或运⾏速度,⽽在于形成⼀种数据导向型模式。

持续改进的能⼒才是它的⾰命性所在。

”——Andrew Nusca
Beats Music 公司⼤数据⼯程总监布莱恩·罗格斯基
要想让布莱恩·罗格斯基谈谈他在Beats Music公司的⼯作细节真是不容易,不过Beats Music刚被苹果(Apple)收购,考虑到苹果⼀向神神秘秘的作风,倒也没什么可奇怪的。

(这笔交易于今年五⽉宣布,上周五完成。

)不过罗格斯基依然是三句话不离本⾏。

他表⽰,现在企业都有兴趣更深⼊地进⾏实时数据分析,⽽且也有兴趣在企业内部加⼤数据的分享⼒度。

另外很多公司也想利⽤⼤数据提⾼APP的个性化体验。

那么罗格斯基打算如何在Beats公司跟上这股潮流呢?他表⽰:“你必须⾃⼰理解其中的奥妙。

由于我⽬前的⾓⾊,我对这个问题不能说太多,现在还是说说⼤趋势吧。

”——Robert Hackett
 雅虎实验室研究员达尼埃尔·凯西亚
雅虎实验室研究员达尼埃尔
⼩时候,达尼埃尔·凯西亚最想当⼀名警察,为此他还买了⼀辆玩具摩托车。

不过现在在雅虎实验室(Yahoo Labs),他对城市的了解绝对细致⼊微——尽管只是在数码层⾯上。

凯西亚拥有计算机科学博⼠学位和⿇省理⼯学院(MIT)城市研究专业的博⼠后学位。

⽬前他主要进⾏⼴域的城市研究。

⽐如他构建了⼀款游戏,问⼈们喜欢哪种城市景观,然后把评分放在Facebook上进⾏病毒式传播。

凯西亚会对结果进⾏研究,以确定⼈们喜欢或不喜欢哪种城市景观,以便最终设计出更好、更漂亮的城市。

他认为:“计算机科学就是⼀门构建⼯具的学问。

我想做⼀些新的事情,⼀些能对现实造成影响的事。

⽽全球有超过⼀半的⼈⼝都住在城
市⾥。

”——Shalene Gupta
微软研究院计算⽣态与环境科学⼩组负责⼈德鲁·帕维斯
微软研究院计算⽣态与环境科学⼩组负责⼈德鲁
微软(Microsoft)内部有⼀个叫做“⽐尔评论”(Bill Reviews)的保留节⽬,也就是员⼯们可以在创始⼈兼董事长⽐尔·盖茨⾯前提出⾃⼰的创意。

当微软研究院剑桥实验室(Microsoft Research’s Cambridge Labs)的计算机学负责⼈史蒂夫?艾默特在⼀次“⽐尔评论”中提出,要由剑桥实验室出资,在公司内部建⽴⼀个⽣态学研究⼩组时,“那真是⼀次糟糕得出名的会议。

”——时任普林斯顿⼤学(Princeton University)⽣态学家的德鲁?帕维斯如是说。

但是最后⽐尔·盖茨改变了主意,很快微软聘请了帕维斯作为这个⼩组的领头⼈,负责建⽴地球⽣态系统的预测模型。

⾃从微软的“蓝天”研究部门成⽴后,帕维斯已经带领科研团队开发了⼀个模拟地球所有⽣命的“马丁利模型”。

这个项⽬可谓雄⼼勃勃,虽然有些“唐吉诃德”⾊彩,但它的部分成果说不定最终也能应⽤于实际。

帕维斯表⽰:“国民经济中发⽣的每⼀件事,都可以放在⼀定的环境因素中考量。

”他随⼝道出全世界⾯临的⼏⼤最严重的挑战,包括⼈⼝⽼龄化、癌症、⾷品安全、⽓候变化和替代能源等问题。

对于⽣态学和⽣物学,帕维斯补充道:“这些东西将成为21世纪经济的核⼼驱动⼒。


IBM沃森与认知烹饪⼩组⾼级软件⼯程师弗罗⾥安·⽪内尔
⾃从IBM的“智能”电脑系统沃森(Watson)在电视智⼒节⽬Jeopardy中战胜了⼈类对⼿之后,IBM还想试试它到底能把智能计算的边界推到多远。

最近IBM决定让沃森进军烹饪界。

作为⼀名受过专业训练的厨师,弗罗⾥安·⽪内尔也是IBM的“认知烹饪”团队的⼀员。

⽪内尔表⽰:“我们之所以把重点放在美⾷上,是因为美⾷是⼤家都关⼼的东西,⽽且我们可以很容易地创造出原型产品。

现在我能把对⾷物和计算机科学的热情融合在⼀起,这令我⼤喜过望。

”这个团队⾸先从各种⾷材和调料着⼿,但是他们研发的各种⾷物的组合呈指数级增长,催⽣出了⼤量潜在的美⾷⾷谱。

⽐如在今年德州奥斯汀的SxSW⼤会上,沃森系统就在IBM的美⾷卡车上发明了⼀种澳洲巧克⼒卷饼,⾷材包括巧克⼒、⽜⾁糜、青⾖和⼤⾖。

听起来虽然是⼀道很难吃的菜,不过⽪内尔却表⽰:“它⼤获成功,⾮常好吃。

所以我们的⽬的就是要启发⽤户,帮助他们开发他们⾃⼰永远想不到的美⾷配⽅。

”——Robert Hackett
Cloudera公司⾸席科学家,西奈⼭医院基因与基因组学助理教授汉默巴切
⾝为西奈⼭医院(Mount Sinai Hospital)基因与基因组学的助理教授,杰夫?汉默巴切虽然没有这个专业的博⼠学位,但丰富的经验让他绝对称职。

他曾是Facebook最优秀的数据学家之⼀,后来他放弃了被⼴告渗透到各个⾓落的社交媒体业,成了Cloudera公司的⾸席科学家。

Cloudera是⼀家基于Apache Hadoop平台的企业软件供应商。

现在汉默巴切⼜与西奈⼭医院的基因与基因组学负责⼈埃⾥克?沙特合作,试图把⼤数据分
析带⼊到医疗保健领域。

沙特指出:“他正在定义⼀个新的领域,以后这个领域将成为⼀门会发放博⼠学位的学问。

现在没有任何⼀门学科在教授他所做的事。

”汉默巴切正在构建管理和运算⼈体健康数据所需要的基础架构,以建⽴更好的医学预测模型。

沙特表⽰:“对于医疗业和医疗机构来说,现在正是他们开始启⽤⼤数据分析引擎的时机。

我们和杰夫这样的⼈才合作,充分说明了医学将来的⾛向。

”——Robert Hackett
CloudFlare联合创始⼈⽶歇尔·扎特琳
如果说互联⽹也有它⾃⼰的中央情报局,那么这块招牌可能要落到CloudFlare公司⾝上。

这家旧⾦⼭的公司监控着全球5%的⽹络流量。

公司创始⼈之⼀⽶歇尔·扎特琳2009年在哈佛⼤学(Harvard University)遇到了另外两个合作伙伴——马休·普林斯和李?霍洛维,并于同年创办了这家公司。

CloudFlare扮演了⼀个⽹站与恶意⽤户之间的缓冲区的⾓⾊。

如果CloudFlare判定⼀名⽤户为友好⽤户,它就会加快他所享受的服务的速度。

如果它判定⼀名⽤户为垃圾邮件发送者或者机器⼈程序,它就会降低他的服务速度,或者是要求对⽅输⼊验证码。

扎特琳表⽰:“⼗年以前,我知道我想成为⼀个⼤⽽重要的团队的⼀份⼦,但当时我并不确切地知道这意味着什么。

但是现在我感到很幸运,因为我找到了CloudFlare。

我想象不出还有⽐帮助客户更好地经营他们的业务更好的事了。

”——Shalene Gupta
Jawbone数据副总裁莫妮卡·罗加蒂
在Jawbone公司,莫妮卡·罗加蒂有两个职责。

⾸先是弄清楚该公司的Up智能腕表收集的数据都代表了什么。

其次,构建以智能⽅式使⽤这些数据的新产品。

罗加蒂表⽰:“我们发现了关于我们如何睡觉、活动和进⾷的许多新的信息,它们都是之前⽆法发现的。

以前我们只能对100个⼈进⾏睡眠研究,但是现在我们可以研究10万个⼈的睡眠信息。

”也就是说,罗加蒂和她的团队能够了解⼈们为什么会失眠。

⽐如华盛顿的居民可能会因为⼀次总统就职典礼⽽兴奋难眠;伊斯坦布尔的居民可能会因为中东爆发的抗议⽽睡不着觉;笃信天主教的罗德岛居民可能因为教皇的辞职⽽失眠——然后,该公司可以把这些信息反馈到Up智能腕表上,并调整他们的⾏为。

罗加蒂指出:“我们充分地利⽤了这些数据反映出的见解,并且利⽤它们来⿎励⼈们保持最佳⽔平。

”——Andrew Nusca
施乐欧洲研究中⼼⾼级研究员欧诺
施乐欧洲研究中⼼⾼级研究员欧诺·佐伊特
孩提时代,欧诺·佐伊特梦想着成为⼀名乐⾼积⽊的设计师。

8岁时,他拥有了⼈⽣中的第⼀台电脑,它点燃了⼀个男孩对⼈⼯智能的兴趣。

如今佐伊特已经进⼊施乐欧洲实验室(Xerox Labs Europe)⼯作,他研究的重点是如何缓解洛杉矶的交通拥堵。

佐伊特表⽰:“我们对停车问题了解的不多,因为它需要⼤量时间来观察。

”为此,佐伊特的团队在全市各处的停车场安装了⼤量传感器。

传感器收集的信息会反馈到⼀款智能⼿机
应⽤上,这样司机就可以随时了解哪些停车场已经停满了,哪些停车场的车位还空着。

更妙的是,城市可以根据这些数据调节这些停车场的停车费,以降低⾼度拥堵地区的车流量。

⾃从这个项⽬在2012年问世以来,洛杉矶的交通拥堵已经缓解了10%。

——Shalene Gupta
Eventbrite公司⼯程副总裁帕特⾥克·普尔斯
帕特⾥克·普尔斯曾经告别科技业整整五年,这期间他转⾏做了⼀名职业扑克玩家。

不过职业扑克市场在2010年萎缩得⾮常厉害,于是他决定重返科技⾏业。

他并不为他的选择后悔,他说:“分析数据跟玩扑克很像。

你玩了⼏千⼿牌,你也了解了⼈,你也处理了数据,⽽且你会留⼼寻找⼀些显眼的东西。

这些都是共通的。

”在Eventbrite⽹络售票公司⾥,普尔斯和他的团队开了⼀个推荐系统,能够根据⽤户已经浏览的内容,向他们推荐他们可能感兴趣的⼤型活动。

这个系统的反响很不错,现在每周⼤约有100万⼈在Eventbrite上购票,其中近半数都是回头客。

普尔斯的下个项⽬,是要想出怎样才能最好地卖掉需要预订座位的活动的门票。

Dropbox⾸席科学家西尔⽡诺斯·李
有“神童”之称的西尔⽡诺斯·李只花了短短两年时间,就从斯坦福⼤学获得了计算机科学与数学的双学位。

他在毕业后直接进⼊了⾦融⾏业,但是科技业的诱惑还是太强了,于是他在2012年加盟Dropbox。

凭借其商业背景和科技知识,他成⽴了⼀⽀团队,专门从事数据学研究。

他曾经负责过⼀个叫做Project Harmony 的通讯软件,它使Dropbox的⽤户可以实时查看其他⽤户对共享⽂档的修改,并可与其进⾏讨论。

另⼀个跟销售有关的项⽬是查看是否有来⾃同⼀家公司的员⼯在同时使⽤Dropbox,如果有就为他们提供超值套餐。

西尔⽡诺斯?李的⽼板王晨⽴(⾳译)表⽰:“他的背景横跨科技、数学和商业实务,⾮常难得。

这使他的数据科学研究鹤⽴鸡群。

”——Shalene Gupta
 Airbnb软件⼯程师苏拉⽐·古普塔
苏拉⽐·古普塔⾮常喜欢旅⾏,经常替亲朋好友规划旅⾏线路。

作为斯坦福⼤学(Stanford University)计算机科学专业毕业的研究⽣,她对摘要的艺术⾮常着迷——仅仅短短数语就能尽得其要,⽽⽆需阅读整篇⽂字。

早先古普塔在⾕歌(Google)⼯作期间就曾研究过租房服务公司Airbnb。

她对Airbnb的数据所能提供的可能性很感兴趣,于是她主动联系了Airbnb跳槽到这家公司。

短短四个⽉后,她就显着改进了Airbnb的搜索引擎。

现在古普塔正在试图压缩Airbnb的所有列表,创建摘要,以便⽤户可以迅速了解不同城市的风情。

她表
⽰:“总的⽬标就是,当⼈们旅⾏时,我们怎样把他们吸引到Airbnb来?当他们想去旅⾏的时候,我们怎样让
他们获得我们的信息?”——Shalene Gupta
美国运通GMS IM平台与⼤数据项⽬副总裁斯⽡蒂·⾟格
美国运通
斯⽡蒂·⾟格的技术背景⼏乎⽆懈可击,其中包括从杜克⼤学(Duke University)获得的机器学习博⼠学位。

但她的性格却热衷经商。

她是美国运通(American Express)MyOffers服务背后的主要智囊,这项服务旨在让美国运通的会员在需要的时候获得他们想要的东西。

⽐如现在是中午,你⼜恰好想吃墨西哥菜,美国运通就会送你⼀张附近墨西哥餐厅的优惠券。

她负责的另⼀个⼯具可以让商家⽐较⾃⼰的年度表现。

她的⽼板塞斯特⾥?杜尔⽡苏拉表⽰:“她有很强的技术背景,但是她也可以像⼀个领导者⼀样,和其他领导谈事情。

每次我们讨论数据的时候,她都在场。

”——Shalene Gupta
Adobe Digital Index⾸席分析师塔玛拉·加夫尼
塔玛拉·加夫尼利⽤数据来预测未来。

在Adobe数字系统公司,她的团队负责从使⽤Adobe云服务的⽤户那⾥反馈的数据来预测各种问题,⽐如哪部⽚⼦会获得奥斯卡奖,哪部⼤⽚会卖座,在冬季购物季有多少⼈会在⽹上购物等等。

她的预测也的确⾮常了不起,在去年的圣诞购物季,加夫尼团队的预测只⽐实际情况低了1个百分点。

她的经理朱莉?麦肯蒂表⽰:“她对科技的理解再加上她对⼈的⾏为的兴趣,使她⾮常与众不同。

她好奇⼼很强,喜欢对数据划分模式、追踪线索,对事情的演变提出假设。

”加夫尼的下⼀个项⽬,是对各种移动购物应⽤进⾏预测。

——Shalene Gupta
 Rent the Runway⾸席分析官维贾伊·苏伯拉马尼安
第⼀眼看去,在这样⼀家经营时尚业务的公司⾥,维贾?苏伯拉马尼安的⼯作貌似并不光鲜。

不过作为时装租赁服务Rent the Runway的⾸席分析官,恐怕很少有⼈对⼥性时尚潮流的理解⽐他更深了。

2010年,他加⼊公司不久后,便构建了⼀个评估模型,能够估算漏掉的需求、产品寿命以及库存服饰的使⽤场合。

由于公司每个季度都要从时装设计师那⾥购⼊成卡车的时装⾸饰租给顾客,因此维贾的模型可以说给公司省了⼀⼤笔钱。

他表⽰:“如果你把三个数据来源放在⼀起,你就可以建⽴⼀个体现购物习惯的模型框架。

它告诉我们应该去找哪种风格的⾐服,才最有可能让我们穿出明星范。

”——当然还有尽量要避免哪种搭配。

维贾的下⼀个项⽬是整合Unlimited反馈的新型数据——Unlimited是该公司为了进军⽇常便服领域⽽推出的⼀个项⽬。

维贾表⽰:“我们的经典模型都围绕着你要去的重⼤场合。

你可能穿⾐⽐较前卫,但如果你出席正式场合,你⾃⼰的穿⾐风格就不重要了,重要的是适应场合。

⽽Unlimited则是理解⽤户穿⾐风格的开始。

”——Andrew Nusca
 ShareThis数据科学副总裁曲艳
很多⼈可能很难相信,曲艳(⾳译)的⼯作影响了95%的美国读者。

曲艳在社交⽹站公司ShareThis开发了⼀个叫做“社交质量指数”(Social Quality Index)的指标,可以衡量围绕⼀定⽹络内容的社交活动,并帮助⼴告主和出版商锁定⽬标群体。

曲艳表⽰:“技术⽅⾯并不难,难的是怎样发现⼀个商业问题,然后把技术应⽤上去。

”曲艳在卡耐基梅隆⼤学(Carnegie Mellon University)获得了⾃然语⾔处理专业博⼠学位。

在进⼊ShareThis⼯作前,她还曾领导过美国在线(AOL)的的Advance Research研究团队。

现在,她很喜欢迎接移动电话带来的挑战,⽽且⼿机也不允许⽹站植⼊cookies来确认重复访客。

这些都需要曲艳收集更多的数据。

——Shalene Gupta
Data Collective公司管理合伙⼈扎卡⾥·博格
早在2011年的时候,扎卡⾥·博格与马特·奥克多就在旧⾦⼭湾区成⽴了⼀家风投公司,专门关注⼤数据领域的创业,这种眼光在当时⽆疑是⾮同⼀般的。

从那时起,这家公司的业务也随着⼤数据的浪潮⽽⽔涨船⾼。

博格表⽰:“成本曲线很快就被越过了。

急速下降的成本使这些新⽅法得以冲击那些旧的⾏业。

”今年,该公司⼜推出了⾃⼰的第三⽀基⾦,使它的总融资额达到将近2.5亿美元。

该公司把赌注押在了短期借贷创业公司LendUp,以及内存数据库服务MemSQL等新锐公司上。

据说MemSQL要⽐市⾯上现有的内存数据库便宜得多也快得多。

博格表⽰:“科技为⼴⼤的市场和⾏业开放了前所未有的投资机会。

我们的⼀个观点是,每个部门和⾏业都会被科技彻底扰乱,真是令⼈兴奋。

”——Andrew Nusca(财富中⽂⽹)
本⽂来源:财富中⽂⽹作者: Andrew Nusca,Robert Hackett,Shalene Gupta
译者:朴成奎。

相关文档
最新文档