ERP中XML压缩算法及安全技术的研究与实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ERP中XML压缩算法及安全技术的研究与实现市场全球化的趋势使得市场竞争日益激烈,跨行业、跨区域的企业制造模式已经逐渐形成。
作为一种跨平台、网络化、服务于企业的建模和管理工具,ERP(企业资源计划)的概念应运而生。
ERP系统集信息技术与先进的管理思想于一身,成为现代化企业的运行模式,为全球企业所广泛应用。
在ERP系统中,数据的异构会导致不同应用模块之间数据加载的困难,因此ERP中的A2A和B2B数据交换往往采用XML作为数据载体。
本文从ERP系统中XML 数据量大、安全性要求高的角度出发,针对XML文档的结构冗余所带来的网络通信带宽问题,对ERP环境下的XML压缩算法和安全技术作了分析和研究,主要完成了以下工作:现有的支持查询的XML压缩算法存在不足,如XGrind算法,往往需要DTD文件来辅助编码,而ERP系统中未必包含与XML文档对应的DTD文件;另外XGrind需要扫描XML文档两次来完成压缩,从一定程度上影响了算法的压缩效率。
针对以上问题,本文提出一种基于Lempel-Ziv编码的支持查询的XML压缩算法(简称ELZ):该算法无需借助DTD文件,适用于ERP系统中没有DTD定义的XML文档的压缩:ELZ只需一次扫描XML文件即可完成压缩,较XGrind缩短了处理时间;算法采用了同构转换的策略,将文档结构和数据分离,分别进行编码,使得压缩后的文件仍然支持查询;ELZ对文档的数据部分,采用数据类型相关的压缩算法。
为了提高ELZ算法的压缩率,本文随后提出了改进的压缩算法EHF。
该算法
借鉴了Huffman编码的熵编码思想,在压缩数据之前,先分析XML文档中元素/属性出现的频率,再构造Huffman树,较ELZ产生更合理的编码,压缩率提高5%~10%。
在XML的数据保密性方面,本文分析了CRT-RSA公钥密码算法,首次从理论上证明了:Wiener提出的连分数攻击算法对CRT-RSA是无效的;在数据可靠性和
一致性方面,基于Merkle算法设计了ERP中的XML安全验证方法。
最后本文结合上述提出的XML压缩算法和安全技术,实现了一个适用于ERP 环境的XML数据交换系统,并在SAP的内部管理系统中得到应用和测试,去除了XML压缩算法需要借助DTD的瓶颈,压缩时间较XGrind算法减短了30%。