大数据成功案例电子教案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1成功案例1-汤姆森路透(Thomson Reuters)利用Oracle大
数据解决方案实现互联网资讯和社交媒体分析
•Oracle Customer: Thomson Reuters
•Location: USA
•Industry: Media and Entertainment/Newspapers and Periodicals
汤姆森路透(Thomson Reuters)成立于2008年4月17日,是由加拿大汤姆森公司(The Thomson Corporation)与英国路透集团(Reuters Group PLC)合并组成的商务和专业智能
信息提供商,总部位于纽约,全球拥有6万多名员工,分布在超过100个国家和地区。
汤姆森路透是世界一流的企业及专业情报信息提供商,其将行业专门知识与创新技术相结合,在全世界最可靠的新闻机构支持下,为专业企业、金融机构和消费者提供专业财经信息服务,以及为金融、法律、税务、会计、科技和媒体市场的领先决策者提供智能信息及解决方案。
在金融市场中,投资者的心理活动和认知偏差会影响其对未来市场的观念和情绪,并由情绪最终影响市场表现。随着互联网和社交媒体的迅速发展,人们可以方便快捷的获知政治、经济和社会资讯,通过社交媒体表达自己的观点和感受,并通过网络传播形成对市场情绪的强大影响。汤姆森路透原有市场心理指数和新闻分析产品仅对路透社新闻和全球专业资讯进行处理分析,已不能涵盖市场情绪的构成因素,时效性也不能满足专业金融机构日趋实时和高频交易的需求。
因此汤姆森路透采用Oracle的大数据解决方案,使用Big Data Appliance大数据机、Exadata数据库云服务器和Exalytics商业智能云服务器搭建了互联网资讯和社交媒体大数据分析平台,实时采集5万个新闻网站和400万社交媒体渠道的资讯,汇总路透社新闻和其他专业新闻,进行自然语义处理,通过基于行为金融学模型多维度的度量标准,全面评估分析市场情绪,形成可操作的分析结论,支持其专业金融机构客户的交易、投资和风险管理。
Oracle大数据解决方案为汤姆森路透构筑了全面涵盖互联网资讯分析和专业资讯分析的市场心理指数和新闻分析产品,帮助汤姆森路透的专业金融机构客户扩展投资视野,针对市场情绪及时修正投资战略,准确把握交易时机,以及更好的管理风险和监控交易流程,从而进一步提升汤姆森路透在金融资讯和分析服务领域的竞争力。同时Oracle大数据解决方案中所应用的一体机产品的预优化配置和一体化集成能力,使得汤姆森路透的大数据分析平台不再需要复杂的配置、排错、调优,大大缩短了系统部署和业务扩展的时间,并能在线扩容和滚动升级,有效满足了其未来的业务发展需求。
1.1.1挑战
•实现海量非结构化互联网资讯和社交媒体信息的实时捕获、组织和分析,捕捉市场情绪的变化趋势。
•关联非结构化的互联网资讯/社交媒体信息和结构化的金融行情/交易数据,形成可度量的分析体系,指导金融机构的交易、投资和风险管理。
•提供高性能、高可用性和安全性的IT基础架构,并实现更高的能源利用率和更低的空间要求,降低大数据分析平台的部署成本和维护成本
•提供可快速部署并能在线扩容和滚动升级的大数据分析平台,以适应高速增长和不断变化的业务需求
1.1.2解决方案
•汤姆森路透大数据分析平台所应用的Oracle大数据解决方案使用Big Data Appliance大数据机对海量低价值密度的非结构化互联网信息进行采集和实时分析处理,通过Big Data Connectors将分析结果加载到基于Exadata数据库云服务
器的企业级数据仓库,与路透社新闻和其他专业新闻分析结果进行关联聚合,利用Exalytics商业智能云服务器进行数据挖掘和可视化分析。
•Oracle Big Data Appliance大数据机为汤姆森路透大数据分析平台提供了一个低成本、可伸缩并享有全面支持的大数据基础架构,Big Data Appliance提供了应对大数据挑战的所有需要,它通过集成优化的硬件和最全面的软件体系,提供一个全面的、易于部署的解决方案,用于获取、组织、分析大数据以及将其加载到Oracle 数据库中,
•通过Oracle Big Data Appliance大数据机为汤姆森路透大数据分析平台的所有数据类型提供极致性能的全面分析,并通过Big Data Connectors,与Oracle Exadata 数据库云服务器紧密集成,无缝实现对汤姆森路透大数据分析平台中所有数据(结构化和非结构化)的分析。
•利用Oracle Exadata的智能扫描(Smart Scan)和闪存技术(Smart Flash Cache),极大地提升了汤姆森路透大数据分析平台中数据仓库的处理效率,并且能够将数据分析和联机事务处理混合部署,实现了资源整合和动态共享。
•利用Oracle Exadata的高级混合列压缩技术(EHCC),汤姆森路透大数据分析平台中数据仓库的在线数据使用查询压缩比率以及历史数据使用归档压缩比率提高数倍,大大减少使系统所需的设备和数据备份工作量,也节约了机房空间和能耗费用
•汤姆森路透大数据分析平台利用Exalytics提供的一系列内存优化分析技术,在主内存中保存数据,避免了网络延迟或磁盘I/O,大幅提升数据分析的响应速度。•汤姆森路透大数据分析平台通过Exalytics提供的针对硬件专门优化的Oracle商务智能基础以及同类最佳的报表、仪表盘、即席查询、OLAP 和记分卡等商业智能分析功能,实现高度互动和高密度可视化的数据挖掘分析,让用户以思考的速度进行分析成为现实。
•Oracle一体机产品的内外部节点都通过40Gb/秒的InfiniBand端口进行互联,提供了从互联网资讯及社交媒体信息采集到在线商业智能分析,端到端的数据交互高速通道
•借助Oracle一体机产品预优化配置的功能以及开箱即用的平衡系统,汤姆森路透大数据分析平台不再需要复杂的配置、排错、调优,系统部署时间比原有数据仓库平台缩短了数倍