信息孤岛解决方案

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信息孤岛的解决方案

樊梦真

269779216@

内容提要：产生信息孤岛的根本原因在于当前的软件设计模式存在问题，人们是先设计出数据结构各不相同的信息系统，然后再通过转化数据结构而实现互联互通，犹如火车通过换车轮而实现互通。火车之所以可以互通是因为火车是以标准化的钢轨为基础而设计。本文的独立数据库技术借鉴“以标准的钢轨为基础而设计火车”的“标准化模式”，通过“数据结构的标准化”及“数据的标准化”方式而从根本上避免信息孤岛问题的产生。

1.1火车的互联互通及机械零部件的互换性对信息系统设计的启示：标准化

火车之所以能够在全国各地互联互通，是因为全国的钢轨都是标准的，我国的各种火车都是以标准的钢轨为基础而设计的。机械零部件的互换性是机械中的一个非常重要特性。机械工程师在设计机械设备时都要尽量采用标准的零部件。火车的互联互通及机械零部件的互换性都是以“标准化”为基础。

然而，对IT行业的软件工程师而言，他们几乎没有标准的概念。软件设计人员在设计软件系统时几乎不考虑任何标准，各种信息系统中的数据完全由软件设计人员自己任意定义，其结果就是各种信息系统中的数据全是不标准、不规范的异构数据。

如果全国各地的火车钢轨都是不标准的，那么火车要在全国各地行驶，就必须不断地“换车轮”，火车换一次车轮需要80分钟。

当前的信息系统通过转换数据结构的方法实现互联互通就犹如火车“换车轮”。铁路交通以“钢轨的标准化”而从根本上避免了“铁路交通孤岛”问题的产生。如果各种信息系统的数据及数据结构也采用标准化的数据和数据结构，那么，也可以从根本上实现各种信息系统之间的互联互通！然而利用关系数据库技术，不可能使数据结构标准化、统一化。独立数据库（源于发明专利技术“医学信息的结构化存贮方法”）中的“事物信息表”可存贮各种各样的结构化数据，可以成为标准的数据结构表。

1.2以“数据结构的标准化”+“数据的标准化”而避免信息孤岛产生

从关系数据库的角度而言，产生信息孤岛的根本原因有两个，一是各个信息系统中的数据结构多种多样、各不相同，二是各个信息系统中的数据不标准、不规范，因此，当一个信息系统中的数据发送到另一个信息系统时，数据的接收方不能存贮、识别处理接收到的数据。当前解决信息孤岛、实现数据的共享交换的方法是：“转换数据结构，把数据转换为数据的接收方可以存贮、识别处理的形式”，例如BI、EAI、EDI、ETL、ESB等都是通用转换数据结构模式，犹如火车通过换车轮而实现互通。

独立数据库是一种与关系数据库理论完全不同的新型数据库理论。对于关系数据库而言，数据库中的数据的结构完全由设计人员自己决定，设计人员可以随意地定义数据的结构。然而利用独立数据库设计各种信息系统时，不允许设计人员随意定义数据的结构，存贮所有数据时都必须全部采用统一的、标准的、固定的数据结构，即必须全部采用“事物信息表”来存贮数据，这样做的目的是为了让数据可以象火车那样在全国各地的标准的钢轨上互联互通。

下面的表1是独立数据库的“事物信息表”，“事物信息表”是通用表，可以只用一张表而存贮各种关系数据库中的任意结构的数据。表1只用一张表就存贮了“1、动物档案；

2、销售订单表；

3、销售订单明细表；

4、患者基本情况；

5、症状；

6、员工身高体重；

7、通信录；

8、医疗费用”的数据。若用关系数据库理论中的方法来存贮这些数据就需要8张结构各不相同的表。

表1：事物信息表只用一张即可存贮各种各样的结构化数据

当前的信息孤岛问题之所以非常严重，就是因为利用关系数据库理论在设计各种信息系统时，各信息系统的数据结构（犹如钢轨）各不相同。要使数据在各个信息系统之间互联互通，就必须转换数据的结构（犹如火车在不同的钢轨之间行驶时需要换车轮一样）。当前的各种信息系统之间的数据的互联互通全部都是采用这种“换车轮（转换数据结构）”的方式来实现。随着信息系统的数量的增多，数据量的增加，信息孤岛问题已成为大数据时代的一个非常严重的问题。因为信息系统越多、数据量越大，在实现互联互通时“换车轮”的次数也随着增加。

独立数据库所考虑的最重要的一个问题就是如何让数据在各个信息系统之间互联互通，这就需要做到不但要自己可以存贮、识别处理自己的数据，还要使其它信息系统也可以存贮、识别处理接收到的数据。

关系数据库中的二维表非常符合人们的日常使用报表的习惯。然而这种结构形式的数据在互联互通时就会遇到严重的问题：由于数据的接收方的数据库中没有相应的表结构而无法直接把数据存贮到数据的接收方的数据库中。

独立数据库之所以采用“事物信息表”存贮数据，其根本目的就是让“事物信息表”成为标准的数据结构（犹如标准的钢轨），有了标准的数据结构，各种各样的结构化数据就可以很容易地存贮到数据接收方的数据库中，只要数据的接收方建立一张事物信息表即可。

由于利用本发明所设计的各种各样的信息系统的数据的结构都是统一的、标准的、固定的，全部都采用“事物信息表”（犹如标准的钢轨）存贮数据，因此使数据在这样的信息系统之间的互联互通非常容易。对于利用本发明所设计的信息系统而言，（在技术上）不存在信息孤岛问题，因为数据可以象火车那样在标准的钢轨（事物信息表）上高速运行而不必“换车轮”。

有人会认为采用独立数据库设计信息系统会出现性能问题，以及多占用存贮空间的问题。所有的事物都是有一利必有一弊，利用事物需要权衡利弊。当前的信息孤岛为社会带来了巨大的损失，仅我国就拥有数百万个以上的各种各样的信息系统，数万亿条结构各不相同的数据，若用当前的转换数据结构这种“换车轮”的方式实现数据的互联互通、共享交换，代价非常高，不可承受。计算机的速度及存贮容量以摩尔定律的速度飞速发展，计算速度及存贮容量已不是问题，独立数据库的确多占用了一倍左右的存贮空间，但其代价非常低。利用本发明也会使表的记录数增加10倍左右，专业人士认为会产生大表问题，针对此问题的解决方案很简单，只要把大表分成若干个小表即可。独立数据库的突出优势是面对数百万以上的信息系统、数万亿条以上的数据的大数据环境，若这些信息系统中的数据的结构都是相同的，数据都满足数据的完整性，那么，实现数据的互联互通、共享交换以及数据挖掘非常容易，两相权衡，利远大于弊！

1.3当前的软件设计模式存在的问题

产生信息孤岛的根源在于当前的软件设计模式有问题，当前的各种信息系统全部采用“换车轮模式”而实现互联互通。如果全国各地的火车的钢轨都是不标准的，那么火车要在全国行驶就必须不断地更换车轮，更换一次车轮需要80分钟的时间。我国的火车全部是以标准的钢轨为基础而设计各种各样的火车，从而很容易地实现了铁路交通的互联互通。当前的BI、EAI、ETL、EDI、ESB等等都是采用“换车轮模式”而实现互联互通，事实表明这些方法的效果不能令人满意。

独立数据库采用全新的软件设计模式“标准化模式”，“数据结构的标准化”及“数据的标准化”，在软件的设计阶段就从根本上避免了信息孤岛问题的产生。