证券行业舆情解决方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
证券行业舆情解决方案
互联网上舆情信息瞬息万变,深圳博瑞得采用国内市场占有率第一的自研DPI探针产品对移动互联网业务及流量进行深度识别,同时通过主动探针爬虫技术对关键网站,如xx股吧进行监控,能在第一时间智能收集到有价值的信息。
DPI探针的互联网应用识别,采用DPI(深度报文识别)技术来深度拆解L2~L4报文及应用层载荷,实现互联网流量可视化分析;采用DFI(动态流检测)技术基于不同的应用类型体现在会话连接或数据流上的状态各有不同,而进行流量识别。网络爬虫技术则自动采集所有其能够访问到的页面内容,实现Url网站多级分类,页面内容分类,构建特征库等。博瑞得使用的移动互联网业务解析层次以及识别原理如下:
DPI探针实时获取用户的Title+Keyword关键字段,结合网页爬虫来对tittle、keywords进行语义识别分类,从而对HTTP文本进行更加准确地、智能地关键字识别。通过智能关键字标签定位,以及URL地址、分词技术、网络标签,能实现用户访问内容的一级、二级、多级分类。
在通过DPI技术和爬虫技术收集到特征信息后,通过大数据智能处理技术进行数据挖掘,首先进行相似信息智能合并,再从相关内容和行为中提取有用的信息。采用聚类算法、决策树算法、关联规则算法及时间序列算法等,进行智能
数据处理,能够准确识别中用户在股吧(或相关论坛中)的舆情热点。
而我们正是通过建立数据算法模型训练,构建基于HADOOP的自主知识产权XDATA数据仓库,实现数据的展现能力,支持智能化报告的生成。例如通过上述过程,我们可以定期自动化生成一份股票舆情热点的简报。