XML学习总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XML
学
习
总
结
姓名:王焕焕
学号:20082673
专业:信息管理与信息系统
班级:08信管班
一、XML的概念
XML是Extensible Markup Language的缩写,是一种扩展性标记语言。
XML文件是由标记及其所标记的内容构成的文本文件,标记可自由定义,其目的是使得XML文件能够很好地体现数据的结构和含义。推出XML的主要目的是使得Internet网络上的数据相互交流更方便,让文件的内容更加显而易懂。
XML是一种可以用来创建自己的标记的标记语言,它由W3C(全球信息网联盟)创建。它是SGML的子集,在web上以HTML的方式被传送、接收和处理Xml是一种元语言,用户可以定义自己需要的标记,只要这些标记满足XML 语法,基于XML很多行业都定义了自己的标记语言,如数学家们定义了MathXL,化学家定义CML。它是用来存储数据和交换数据的。
二、XML的特点
1.良好的格式
XML文件格式属于良好格式的文件。XML标记一定是成双成对的。
2.具有验证机制
XML的标记是程序员自己定义的,标记的定义和使用是否符合语法,需要验证。
XML有两种验证方法。一种是DTD(Document Type Definition),即文档类型定义,DTD是一个专门的文件,用来定义和检验XML文件中的标记。另一种是XML Schema,用XML语法描述。它比DTD更优越,多个Schema可以复合使用XML名字空间,可以详细定义元素的内容及属性值的数据类型。
3.灵活的WEB应用
在XML中数据和显示格式是分离设计的,XML元数据文件就是纯数据的文件,可以作为数据源,向HTML提供显示的内容,显示样式可以随HTML的变化而丰富多彩。也就是说,HTML描述数据的外观,而XML描述数据本身,是文本化的小型数据库表达语言。HTML数据和显示格式混在一起,显示出一种式样。XML采用的TAG是自己定义的,这样我们的数据文件的可读性就能大大提高,也不再局限于HTML文件那些标准的TAG了。由于XML是一个开放的基于文本的格式,它可以和HTML一样使用HTTP进行传送,不需要对现存的网络进行变化。
4.丰富的显示样式
XML数据定义打印、显示排版信息主要有3种方法:用CSS定义打印和显示排版信息;用XSLT转换到HTML进行显示和打印;用XSLT转换成XSL的FO(Formatter Object) 进行显示和打印。
5.XML允许开发各种不同专业的特定领域的标记语言,有了这些语言,这个领域的专业人士就可以自由地交换数据。
6.XML是非专有的,易于阅读和理解。
7. XML与平台无关。
三、XML的应用前景
1.网络服务领域
XML有利于信息的表达和结构化组织,从而使数据搜索更有效。XML可以使用URL别名使WEB的维护更方便,也使WEB的应用更稳定,XML可以使用数字签名使WEB的应用更广阔。而XML的广泛使用必然能推动WEB不断发展,从而开创WEB应用的新时代。
2.EDI(电子数据交换)
使用XML,程序能够理解在交换数据中所表示的商务数据及概念,根据明确的商务规则来进行数据处理并给出适当的回音。基于XML的数据交换是构造电子商务应用的有效而可行的途径。而且XML能够和现有的EDI系统相结合,并扩展现有的EDI应用。
随着XML技术的发展和普及,可以预见到XML数据必定成为将来网络上商业数据交换的首选,XML数据接口会成为所有商业软件的标准配置。
3. 电子商务领域
XML的丰富置标完全可以描述不同类型的单据,结构化的XML文档发送至Web 的数据可以被加密,并且很容易附加上数字签名。因此,XML有希望推动EDI (Electronic Data Interchange)技术在电子商务领域的大规模应用。
4.数据库领域
XML—数据库—网页或文档中的表格这三者可以互相转换。
5.Agent(智能体)
XML能够更准确地表达信息的真实内容,其严格的语法降低了应用程序的负担,也使智能工具的开发更为便捷。
XML语言只是一种简单的不能再简单的信息描述语言,可准确的表示几乎所有类型的数字化信息,可以清晰地解释信息的内涵和信息之间的关联。
6. 软件设计元素的交换
XML也可以用来描述软件设计中有关的设计元素,如对象模型,甚至描述最终设计出来的软件。可将这些成果在不同的设计组之间进行传输。
7. 配置文件
可将配置的数据方便地集成到应用程序中。
四、XML的发展历史
可扩展标记语言XML(eXtensible Markup Language)是一种简单灵活的文本格式的可扩展标记语言,起源于SGML(Standard Generalized Markup Language),是SGML的一个子集合,也就是SGML的一个简化版本,非常适合于在Web上或者其它多种数据源间进行数据的交换。
1969年,IBM公司开发了一种文档描述语言GML(Generalized Markup Language),用来解决不同系统中文档格式不同的问题,并在1986年成为了一个国际标准〔ISO8879〕,这就是SGML。SGML是很多大型组织的文档标准,它是一种与语言无关的、结构化的、可扩展的语言,这些特点使它在很多公司受到欢迎,被用来创建、处理和发布大量的文本信息。
1989年,在CERN欧洲粒子物理研究中心的研究人员开发了基于SGML的超文本版本,称为HTML( HyperText Markup Language)。HTML继承了SGML的许多重要的特点,比如结构化、实现独立和可描述性,但是它也存在很多缺陷,比如它只能使用固定的有限的标记,而且它只侧重于对内容的显示方面。
随着Web上数据的增多,HTML存在的这些缺点越来越突出。W3C的成员认识到,必须有一种方法能够把数据本身和数据的显示分离开来,这样W3C在1996年提出了XML的概念。XML不仅保留了SGML的很多优点,而且更加容易操作以及在World Wide Web环境下实现。1998年,XML成了W3C的推荐标准。
五、XML语法基本点
1.XML要遵循规则W3C推荐规则规定的XML语法;
2.XML文档只能包含一个根元素;
3.所有XML元素必须包含结束标记;
4.元素的开始标记和结束标记的名称必须相同;
5.XML元素不能重叠;
6.所有属性值都必须使用引号。
六、XML的技术规范
XML并不仅仅包括XML标记语言,它同时还包括了很多相关的规范,比如文档模式技术、文档样式技术、文档查询技术、文档解析技术、文档链接技术以及文档定位技术等。基于XML的这些规范,还有很多高层的应用协议,比如SOAP(Simple Object Access Protocol)和BizTalk等。
1. 文档模式技术:
DTD(Document Type Definition)和XML Schema是XML文档的模式,用来