blog核心信息技术解析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
blog核心信息技术解析
blog核心信息技术是一种用于搜集、分析、组织和使用时下流行的社交媒体网站、博客和微博等博客类媒体信息的技术。
它需要基于搜索引擎技术,核心信息技术从网络中搜索到有价值的信息,以及网络上种类繁多的信息源,追踪下载到本地缓存,进行深度分析以捕获重要信息,进而建立信息库,以便日后全文检索或者多维分析,最后保存、反馈新产生的信息给用户,智能推荐给用户可能感兴趣的信息。
核心信息技术的实现包括几个步骤:
一是用八十多种语言抽取网络信息,把网络上有用的信息抓取下来,建立信息库,进行索引存储;
第二是全文检索,用检索词查询检索相关信息,方便用户查询使用;
第三是多维分析,用数据挖掘和机器学习等技术对信息进行多维分析,智能推荐给用户可能感兴趣的信息;
第四是有效的信息反馈,建立报警机制,及时将相应信息反馈给用户。
核心信息技术在新闻数据挖掘、社会热点事件分析、政策趋势判断、现场价格行情价格预测、互联网网络舆情监控等方面发挥着重要作用。