知识管理及智能信息挖掘
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内容管理与智能信息挖掘平台
1、作用
省电子政务平台的建设以各单位的业务信息为基础,重点解决跨厅、局、委、办的协同办公、信息发布和共享服务等问题,从而进一步实现对政务职能转变的推动,以及为领导决策提供辅助支持。
内容管理与智能信息挖掘平台解决跨部门协同、异构信息共享、海量信息处理、领导决策支持等问题,提供各个层面的“内容管理和个性化知识服务”,将信息共享这个信息化建设中最基本的概念和应用全面提升到一个新的层面,丰富并完善了政务信息化的结构空间。
智能信息挖掘平台,具有部分人工智能的功能,能处理各类数据。具备以下特性:
✓海量的数据处理
智能信息挖掘平台可以对绝大多数形式的信息、文本或基于语音的、非结构化或结构化实际内容的基本理解,不论它保存在哪里、用何种格式创建或者与数据相关的应用又是什么。这就是“基于理解的集成“
✓异构数据集成
系统内所有的内部操作及处理几乎都可以彼此互联;而且,该技术本身允许应用间的通讯,不管后端的数据源如何。智能信息挖掘平台在组织内创建一个新的操作层,即智能数据操作层,从而使自动处理数字信息及其应用间彼此通讯在组织中成为可能。
✓自动的信息处理
智能信息挖掘平台的智能数据操作层“以数据为中心”,可以进行自动化的信息采集、识别、整理、发布、服务。使整体网络降低成本,更有效地进行运营。
✓个性化的分层服务
智能信息挖掘平台的服务模式,提供“以人为本“的宗旨设计方法。通过分析人的兴趣爱好,提供相应的信息资源,并且可以根据行业的特点更新、定制各类服务模型。
2、平台原理图
一个完整的智能信息挖掘平台见下图:
1)智能推理服务
智能推理服务是建立在模式识别技术之上,它可以保证手工或全面自动地对类似信息的识别和匹配。
●自动交叉索引/超链接
智能信息挖掘平台的架构可以识别信息间的主要关系,从而实现内容间的交叉索引对照。不论是什么文档或什么系列的文档,智能信息挖掘平台都可以在操作层识别出与其相关联的资料。
智能信息挖掘平台可以实时生成超链接,保证立即更新,完全不需要手工将链接插入到内容里面。当文档被查阅时,这些链接可以自动一次性插入到文档中,因此可以将以前写的文档和文章作为当前文档的参考,档案资料也可以链接到最新的新闻或相关资料。
特点是:自动超链接可以极大地降低任何环境下非结构化信息的维护成本。降低查找相关信息需要的时间,降低重复劳动,让人们了解信息的更迭以及最新的信息。
自动上下文环境总结
智能信息挖掘平台还可以对内容中的最主要的概念进行总结。可以根据原始查询的上下文环境进行总结,并且将最适用的动态摘要提交给指定的需求。
境相匹配。
通常,不同的用户基于不同的原因可能会认为同一条内容是自己需要的,例如,关于对于三个代表的讨论,一个工商和公安领域的用户可能会很感兴趣,而另一位卫生领域的用户也会感兴趣。对这些用户的兴趣进行总结,保证他们能立即看到他们需要的信息。特点是:当显示能力有限时,动态内容总结就特别有用,可以发送高度精确的相关信息。提高用户处理信息的能力,加速政务运作。让人们能更快地做出适当的决策如图8-41
首长智能秘书服务系统
智能推理引
擎
自动分类引
擎
半规整信息
(XML)
个性化用户引
擎
ACI API/SOAP
不规整信
息
规整信息
(ODBC)
ACI API/SOAP ACI API/SOAP
模式识别
别
XML引擎
•分类
•视觉呈现
•题目生成
•信息频道
•信息群
聚类
•用户
•爱好习惯
•个人档案
•特长
•安全保险
语音图像
HTTP
OA 新闻电子
邮件
用户
系统
互联网数据库报告
文档管理
系统
XML 声音影像
HTTP
图8-41 首长智能秘书服务系统
获取和检索
智能信息挖掘平台解决方案是可拓展的,可以理解概念,它可以保证极高的准确性和全面性。智能信息挖掘平台独特的识别能力保证强大的获取特性,包括自然语言、概念搜索、示例的精练、管理器、交叉语言搜索和示例的查询。智能信息挖掘平台还支持旧的搜索获取机制,例如关键字,布尔、类似、探测法等。其重要特性之一是示例的精练,它允许用户快速精练他们的搜索,精确地将焦点定位在他们需要的上下文环境上。特点是:提供跨多个数据源的统一搜索,首长智能秘书技术可以让用户找到他们不知道的信息
2)自动分类技术
智能信息挖掘平台的分类技术,不再需要人工干预或人工处理信息,例如手工帖标签。智能信息挖掘平台的分类服务器具有独特的技
术架构,能持续准确地自动对数据进行分类,解决成倍增长的非结构化信息所带来的困扰。
其高级模式识别技术,智能推理引擎可以通过上下文环境理解任何信息,能够完全自动地对信息进行分类。通过实现内容访问、受理、分析和发送的自动化,自动分类可以提高组织的生产力,降低整体成本。
通过自动分类、聚类、和分类学,智能信息挖掘平台可以使组织控制成倍增长的非结构化数据。智能信息挖掘平台的分类技术可以使数据更具可访问性,为用户提供清晰定义、以及已按业务需要进行结构化处理的信息。
自动分类
智能信息挖掘平台的智能数据操作层可以自动对信息进行分类,而且不需要任何手工输入。首长智能秘书技术分类器的灵活性可以让你精确地根据非结构化文本中的概念进行分类。它保证根据内容对所有的数据进行最准确的分类。
与依赖严格的分类定义规则的传统关键字和布尔操作不同,智能信息挖掘平台的架构是建立在基于概念的模式匹配处理之上的,它可以对文档进行分类,自动插入数据标记,发送内容或将其提示给用户,让用户了解与其档案(profile)密切相关的信息。
智能信息挖掘平台可以在24小时内,每个CPU 实例可将四百万份文档进行分类,也就是说在每25毫秒内差不多可处理一份文档。智能信息挖掘平台可以支持任何数据库并且可以识别任何格式的数据,可以应用所有的安全和访问控制,从而保证完全的可靠性。