xml基础
XML基础教程(Tutorials Point)说明书
About the T utorialXML stands for Ex tensible M arkup L anguage and is a text-based markup language derived from Standard Generalized Markup Language (SGML).This tutorial will teach you the basics of XML. The tutorial is divided into sections such as XML Basics, Advanced XML, and XML tools. Each of these sections contain related topics with simple and useful examples.AudienceThis reference has been prepared for beginners to help them understand the basic to advanced concepts related to XML. This tutorial will give you enough understanding on XML from where you can take yourself to a higher level of expertise. PrerequisitesBefore proceeding with this tutorial, you should have basic knowledge of HTML and JavaScript.Copyright & DisclaimerCopyright 2018 by Tutorials Point (I) Pvt. Ltd.All the content and graphics published in this e-book are the property of Tutorials Point (I) Pvt. Ltd. The user of this e-book is prohibited to reuse, retain, copy, distribute or republish any contents or a part of contents of this e-book in any manner without written consent of the publisher.We strive to update the contents of our website and tutorials as timely and as precisely as possible, however, the contents may contain inaccuracies or errors. Tutorials Point (I) Pvt. Ltd. provides no guarantee regarding the accuracy, timeliness or completeness of our website or its contents including this tutorial. If you discover any errors on our website or inthistutorial,******************************************T able of ContentsAbout the Tutorial (i)Audience (i)Prerequisites (i)Copyright & Disclaimer (i)Table of Contents (ii)XML BASICS (1)1.XML – Overview (2)XML Usage (2)What is Markup? (3)Is XML a Programming Language? (3)2.XML – Syntax (4)3.XML – Documents (9)Document Prolog Section (9)Document Elements Section (10)4.XML – Declaration (11)5.XML – Tags (14)Start Tag (14)End Tag (14)Empty Tag (14)XML Tags Rules (15)6.XML – Elements (16)Empty Element (16)XML Elements Rules (17)7.XML – Attributes (18)Attribute Types (19)Element Attribute Rules (20)8.XML – Comments (21)XML Comments Rules (21)9.XML – Character Entities (22)Types of Character Entities (22)10.XML – CDATA Sections (24)CDATA Rules (25)11.XML – Whitespaces (26)Significant Whitespace (26)Insignificant Whitespace (26)12.XML – Processing (27)Processing Instructions Rules (28)13.XML – Encoding (29)Encoding Types (29)14.XML – Validation (31)Well-formed XML Document (31)Valid XML Document (32)ADVANCE XML (33)15.XML – DTDs (34)Internal DTD (34)External DTD (36)Types (37)16.XML – Schemas (39)Definition Types (40)17.XML – Tree Structure (42)18.XML – DOM (45)19.XML – Namespaces (47)Namespace Declaration (47)20.XML – Databases (48)XML Database Types (48)XML- Enabled Database (48)XML TOOLS (50)21.XML – Viewers (51)Text Editors (51)Firefox Browser (52)Chrome Browser (52)Errors in XML Document (52)22.XML – Editors (54)Open Source XML Editors (54)23.XML – Parsers (55)24.XML – Processors (56)Types (56)XML Basics11.XML stands for E xtensible M arkup L anguage. It is a text-based markup language derived from Standard Generalized Markup Language (SGML).XML tags identify the data and are used to store and organize the data, rather than specifying how to display it like HTML tags, which are used to display the data. XML is not going to replace HTML in the near future, but it introduces new possibilities by adopting many successful features of HTML.There are three important characteristics of XML that make it useful in a variety of systems and solutions:∙XML is extensible: XML allows you to create your own self-descriptive tags or language, that suits your application.∙XML carries the data, does not present it: XML allows you to store the data irrespective of how it will be presented.∙XML is a public standard: XML was developed by an organization called the World Wide Web Consortium (W3C) and is available as an open standard.XML UsageA short list of XML usage says it all:∙XML can work behind the scene to simplify the creation of HTML documents for large web sites.∙XML can be used to exchange the information between organizations and systems.∙XML can be used for offloading and reloading of databases.∙XML can be used to store and arrange the data, which can customize your data handling needs.∙XML can easily be merged with style sheets to create almost any desired output.∙Virtually, any type of data can be expressed as an XML document.2What is Markup?XML is a markup language that defines set of rules for encoding documents in a format that is both human-readable and machine-readable. So, what exactly is a markup language? Markup is information added to a document that enhances its meaning in certain ways, in that it identifies the parts and how they relate to each other. More specifically, a markup language is a set of symbols that can be placed in the text of a document to demarcate and label the parts of that document.Following example shows how XML markup looks, when embedded in a piece of text:This snippet includes the markup symbols, or the tags such as <message>...</message> and <text>... </text>. The tags <message> and </message> mark the start and the end of the XML code fragment. The tags <text> and </text> surround the text Hello, world!. Is XML a Programming Language?A programming language consists of grammar rules and its own vocabulary which is used to create computer programs. These programs instruct the computer to perform specific tasks. XML does not qualify to be a programming language as it does not perform any computation or algorithms. It is usually stored in a simple text file and is processed by special software that is capable of interpreting XML.32.In this chapter, we will discuss the simple syntax rules to write an XML document. Following is a complete XML document:You can notice, there are two kinds of information in the above example: ∙Markup, like <contact-info>∙The text, or the character data, Tutorials Point and (040) 123-4567The following diagram depicts the syntax rules to write different types of markup and text in an XML document.Let us see each component of the above diagram in detail.4XML DeclarationThe XML document can optionally have an XML declaration. It is written as follows:Where version is the XML version and encoding specifies the character encoding used in the document.Syntax Rules for XML Declaration∙The XML declaration is case sensitive and must begin with "<?xml>" where "xml"is written in lower-case.∙If the document contains XML declaration, then it strictly needs to be the first statement of the XML document.∙The XML declaration strictly needs be the first statement in the XML document.∙An HTTP protocol can override the value of encoding that you put in the XML declaration.T ags and ElementsAn XML file is structured by several XML-elements, also called XML-nodes or XML-tags. The names of XML-elements are enclosed in triangular brackets < > as shown below:Syntax Rules for Tags and ElementsElement Syntax: Each XML-element needs to be closed either with start or with end elements as shown below:or in simple-cases, just this way:Nesting of Elements: An XML-element can contain multiple XML-elements as its children, but the children elements must not overlap. i.e., an end tag of an element must have the same name as that of the most recent unmatched start tag.56The following example shows incorrect nested tags:The following example shows correct nested tags:Root Element: An XML document can have only one root element. For example, following is not a correct XML document, because both the x andy elements occur at the top level without a root element:The following example shows a correctly formed XML document:Case Sensitivity: The names of XML-elements are case-sensitive. That means the name of the start and the end elements need to be exactly in the same case.For example, <contact-info> is different from <Contact-Info>.XML AttributesAn attribute specifies a single property for the element, using a name/value pair. An XML-element can have one or more attributes. For example:Here href is the attribute name and / is attribute value.Syntax Rules for XML Attributes∙Attribute names in XML (unlike HTML) are case sensitive. That is,HREF and href are considered two different XML attributes.∙Same attribute cannot have two values in a syntax. The following example shows incorrect syntax because the attribute b is specified twice:∙Attribute names are defined without quotation marks, whereas attribute values must always appear in quotation marks. Following example demonstrates incorrect xml syntax:In the above syntax, the attribute value is not defined in quotation marks.XML ReferencesReferences usually allow you to add or include additional text or markup in an XML document. References always begin with the symbol "&" which is a reserved character and end with the symbol ";". XML has two types of references:∙Entity References: An entity reference contains a name between the start and the end delimiters. For example, & where amp is name. The name refers toa predefined string of text and/or markup.∙Character References: These contain references, such as A, contains a hash mark (“#”) followed by a number. The number always refers to the Unicode code of a character. In this case, 65 refers to alphabet "A".XML T extThe names of XML-elements and XML-attributes are case-sensitive, which means the name of start and end elements need to be written in the same case. To avoid character encoding problems, all XML files should be saved as Unicode UTF-8 or UTF-16 files.Whitespace characters like blanks, tabs and line-breaks between XML-elements and between the XML-attributes will be ignored.Some characters are reserved by the XML syntax itself. Hence, they cannot be used directly. To use them, some replacement-entities are used, which are listed below:783.An XML document is a basic unit of XML information composed of elements and other markup in an orderly package. An XML document can contain a wide variety of data. For example, database of numbers, numbers representing molecular structure or a mathematical equation.XML Document ExampleA simple document is shown in the following example:The following image depicts the parts of XML document.Document Prolog SectionDocument Prolog comes at the top of the document, before the root element. This section contains:∙XML declaration∙Document type declarationYou can learn more about XML declaration in this chapter : XML Declaration.Document Elements SectionDocument Elements are the building blocks of XML. These divide the document into a hierarchy of sections, each serving a specific purpose. You can separate a document into multiple sections so that they can be rendered differently, or used by a search engine. The elements can be containers, with a combination of text and other elements.9You can learn more about XML elements in this chapter : XML Elements104.This chapter covers XML declaration in detail. XML declaration contains details that prepare an XML processor to parse the XML document. It is optional, but when used, it must appear in the first line of the XML document.SyntaxFollowing syntax shows XML declaration:Each parameter consists of a parameter name, an equals sign (=), and parameter value inside a quote. Following table shows the above syntax in detail:11RulesAn XML declaration should abide with the following rules:∙If the XML declaration is present in the XML, it must be placed as the first line in the XML document.∙If the XML declaration is included, it must contain version number attribute.∙The parameter names and values are case-sensitive.∙The names are always in lower case.∙The order of placing the parameters is important. The correct order is:version, encoding and standalone.∙Either single or double quotes may be used.∙The XML declaration has no closing tag, i.e. </?xml>XML Declaration ExamplesFollowing are few examples of XML declarations:XML declaration with no parameters:XML declaration with version definition:XML declaration with all parameters defined:XML declaration with all parameters defined in single quotes:125.Let us learn about one of the most important part of XML, the XML tags. XML tags form the foundation of XML. They define the scope of an element in XML. They can also be used to insert comments, declare settings required for parsing the environment, and to insert special instructions.We can broadly categorize XML tags as follows:Start T agThe beginning of every non-empty XML element is marked by a start-tag. Following is an example of start-tag:End T agEvery element that has a start tag should end with an end-tag. Following is an example of end-tag:Note, that the end tags include a solidus ("/") before the name of an element.Empty T agThe text that appears between start-tag and end-tag is called content. An element which has no content is termed as empty. An empty element can be represented in two ways as follows:A start-tag immediately followed by an end-tag as shown below:A complete empty-element tag is as shown below:Empty-element tags may be used for any element which has no content.13End of ebook previewIf you liked what you saw…Buy it from our store @ https://14。
XML从入门到深入(超详细)
XML从⼊门到深⼊(超详细)⼀:什么是XML XML (eXtensible Markup Language)指可扩展标记语⾔,标准通⽤标记语⾔的⼦集,简称XML。
是⼀种⽤于标记电⼦⽂件使其具有结构性的标记语⾔。
XML可以标记数据、定义数据类型,可以允许⽤户对⾃⼰标记语⾔进⾏⾃定义,是对⼈和机器都⽐较友好的数据承载⽅式;XML其前⾝是SGML(标准通⽤标记语⾔)。
传统的系统已经远远不⾜以来表达复杂的信息,简单的语⾔根本⽆法表达出⼀些细微的差别,需要更完整的语⾔来表达⽹络世界⾥⽇益丰富复杂的信息内涵 XML - 可扩展标记语⾔便由此诞⽣,它不像HTML追求美观的效果,⽽不重视实际交流应⽤现象,所以XML语⾔的出现核⼼是⽤来展⽰及数据的交互,它的出现把⽹络表达的语⾔集合推进了⼀⼤步,XML传递信息,具有跨平台的特性(如:WebService)它作为数据交互和⽹络计算基础,尤其是在电⼦商务应⽤上的出⾊表现,现在已经没⼈怀疑它给信息社会带来的⾰命性影响(随着2021的到来JSON也是⼀个不错的选择)<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><Students><Student><name>蚂蚁⼩哥</name><address>安徽六安</address></Student><Student><name>欧阳康康</name><address>安徽六安</address></Student></Students>1:编写XML注意事项①:XML 中的每个元素都是成对出现的,有开始和结束,⾃闭和标签除外,但是都得有 '/'结束标志如:<student>xxxxx</student> ⾃闭和:<student name='xxx' />②:每个XML⽂档都有且只有⼀个根元素(Root Element)③:XML标签对⼤⼩写敏感④:XML必须正确嵌套⑤:同级标签以所缩进对齐⑥:元素名称可以包含字母,数字,但不能以数字开头⑦:元素名称中不能含有空格或者 ' : '号⑧:如出现特殊字符需要转义如:<,>,",',&....2:使⽤XML的优缺点优点:①:XML是使⽤信息⾃描述的新语⾔(没有约束的情况下)②:信息共享(⾃定义数据格式,⽽且很容易使⽤⼯具读写)③:数据传递(⽀持各种通道传递数据,如WebService就使⽤XML传输数据)④:数据重⽤、分离数据和显⽰、⽂档包含语义、⽅便阅读有⾯向对象的树形结构缺点:①:数据量⼤是传输效果不好,因为XML定义了和数据⽆关的标签3:XML基本语法第⼀⾏必须是XML的声明<?xml ?>version:xml的版本,必须设定,当前只有'1.0'版本encoding:当前xml⾥⾯的数据格式,默认UTF-8standalone:标记是否是⼀个独⽴的xml,默认yes如果设置 no 表⽰这个XML不是独⽴的⽽是依赖于外部的DTD约束⽂件(后⾯说)<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><Students><Student><name>蚂蚁⼩哥</name><address>安徽六安</address></Student></Students>⼆:XML专⽤标记 XML其实是有专⽤的标记,也可以理解是XML的基本语法,但是这些语法你在看HTML语法时也看到过,因它们都属于⼀个⼤家族,只是应⽤的⽅向不⼀样⽽导致的差异有部分不⼀样1:XML注释 语法:<!-- 这是⼀个注释 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student id="st01" name="张三" age="23"/></School>①:注释⾥的内容不要出现 --②:不要把注释写在元素中间如<Student <!--这⾥注释报错--> ></Student>③:注释不可嵌套2:XML处理PI指令 其实XML⾥的PI指令⼤家可以理解为XML设置样式的,但是考虑到XML是⽤于存储数据的载体,所以这个指令⽤的也不多 语法:<?⽬标指令?> 如引⼊CSS样式:<?xml-stylesheet type='css类型' href='引⼊css样式地址'> CSS类型可以设置 type='text/css' type='text/xsl'<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!--引⼊PI指令注意只能放在头部并引⼊style.css样式--><?xml-stylesheet type='text/css' href='./style.css' ?><School><!--定义学⽣对象这是⼀个注释--><Student><name>蚂蚁⼩哥</name></Student></School><!--CSS样式-->name {font: normal 500 22px "微软雅⿊";color:#f69;}3:XML之CDATA节 ⽤于把整段⽂本解析为纯字符串数据⽽不是标记的情况,其实包含在CDATA节中的特殊字符<、>、&都会当作字符展⽰<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student><!--使⽤<![CDATA[xxx]]>可以把特殊字符当作⽂本--><name><![CDATA[我是⼀个"⽂本":想不到把]]></name></Student></School> 那么问题来的,如果我不使⽤CDATA节包裹的话在⽂本区域输⼊<,>等就会和关键字符冲突,我们需要使⽤转义<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><School><!--定义学⽣对象这是⼀个注释--><Student><!--这⾥的蚂蚁⼩< > 哥报错 <>⼲扰,我们要使⽤转义--><!--<name>蚂蚁⼩<>哥</name>--><name>蚂蚁⼩<>哥</name></Student></School><!--常⽤⽹页转义字符 xml也可以使⽤--><!--显⽰结果描述实体名称实体编号空格  < ⼩于号 < <> ⼤于号 > >& 和号 & &" 引号 " "' 撇号 '(IE不⽀持) '¢分 ¢ ¢£ 镑 £ £¥ ⽇圆 ¥ ¥§ 节 § §© 版权 © ©® 注册商标 ® ®× 乘号 × ×÷ 除号 ÷ ÷-->XML中转义字符的使⽤三:核⼼DTD语法约束1:什么是DTD,为什么使⽤DTD DTD是⽂档类型定义(Document Type Definiyion),它是⽤来描述XML⽂档结构,⼀个DTD⽂档会包含如下内容:元素(ELEMENT):的定义规则,描述元素之间的关系规则属性(ATTLIST):的定义规则,可以定义具体的标签内部属性为什么使⽤DTD:①:DTD⽂档与XML⽂档实例关系如类与对象关系②:有了DTD,每个XML⽂件可以携带⼀个⾃⾝格式描述③:有了DTD,不同组织的⼈可以使⽤⼀个通⽤DTD来交换数据④:应⽤程序可以使⽤⼀个标准的DTD校验从外部世界接受来的XML是否是⼀个有效标准XML⑤:可以使⽤DTD校验⾃⼰的XML数据2:DTD定义⽂档规则(DOCTYPE)DTD⽂档的声明及引⽤有三种:内部DTD⽂档:<!DOCTYPE 根元素[定义元素属性等等内容]>外部DTD⽂档:<!DOCTYPE 根元素 SYSTEM 'DTD⽂件路径'>内外部DTD⽂档结合:<!DOCTYPE 根元素 SYSTEM 'DTD⽂件路径'[定义元素属性等等内容]><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!--注:此时我这⾥⾯的 ELEMENT 定义元素的我后⾯介绍--><!DOCTYPE Student[<!ELEMENT Student (name)><!ELEMENT name (#PCDATA)>]><Student><name>蚂蚁⼩哥</name></Student>内部定义DTD⽂档<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student SYSTEM './st.dtd'><Student><name>蚂蚁⼩哥</name></Student><!--下⾯是⽂件 st.dtd--><!DOCTYPE Student[<!ELEMENT Student (name)><!ELEMENT name (#PCDATA)>]>外部定义DTD⽂档<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student SYSTEM './st.dtd'[<!ELEMENT Student (name,age,sex)><!ELEMENT sex (#PCDATA)>]><Student><name>蚂蚁⼩哥</name><age>23</age><sex>男</sex></Student><!--外部引⽤的st.dtd⽂件--><?xml version="1.0" encoding="UTF-8" ?><!--这⾥不能写DOCTYPE,因为这个可以当作元素引⽤,具体规则在上⾯定义--><!ELEMENT name (#PCDATA)><!ELEMENT age (#PCDATA)>内外部定义DTD⽂档3:DTD元素的定义(ELEMENT)语法:<!ELEMENT 元素名称(NAME) 元素类型(COUTENT)>注:ELEMENT关键字元素名称:就是⾃定义的⼦标签名称元素类型:EMPTY:该元素不能包含⼦元素和⽂本,但是可以有属性,这类元素称为⾃闭和标签ANY:该元素可以包含任意在DTD中定义的元素内容#PCDATA:可以包含任何字符数据,设置这个就不能包含⼦元素了,⼀般设置具体value混合元素类型:只包含⼦元素,并且这些⼦元素没有⽂本混合类型:包含⼦元素和⽂本数据混合体<!-- 定义空元素EMPTY --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student[<!ELEMENT Student EMPTY>]><!--约束为空元素所以写成⾃闭和标签,--><Student/><!-- 定义组合元素(student,teacher)并为每个元素设置类型(#PCDATA) --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student,teacher)><!ELEMENT student (#PCDATA)><!ELEMENT teacher (#PCDATA)>]><School><student>我是学⽣</student><teacher>我是⽼师</teacher></School><!-- 设置任意元素ANY 虽然student元素内部没有再设置元素⽽设置ANY,那我就可以在编写任意⼦元素,前提在⾥⾯有定义 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student)><!ELEMENT student ANY><!ELEMENT name (#PCDATA)><!ELEMENT address (#PCDATA)>]><School><student><name>蚂蚁⼩哥</name><address>安徽六安</address></student></School><!-- 元素组合及混合,可以使⽤通配符 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*,teacher?)><!ELEMENT student (#PCDATA)><!ELEMENT teacher (#PCDATA)>]><School><student>我是学⽣A</student><student>我是学⽣B</student></School>DTD元素定义具体代码通配符:() ⽤来元素分组如:(a|b|c),(d,e),f 分三组| 在列表中选⼀个如(a|b)只能选⼀个表⽰a|b必须出现并⼆选⼀+ 该对象⾄少出现⼀次或多次如(a+) 该元素可以出现多次* 该对象允许出现0次到多次如(a*) 该元素可以不出现或出现多次表⽰可出现⼀次或者不出现(a?) a可以出现,或者不出现, 常⽤按照顺序出现(a,b,c) 表⽰依次a,b,c4:DTD属性的定义(ATTLIST)语法:<!ATTLIST 元素名称属性名称类型属性特点>元素名称:我们⾃定义的元素名称属性类型:我们为元素上添加⾃定义属性类型:CDATA:任意字符(理解为任意字符的字符串)ID:以字母开头唯⼀值字符串,IDREF/IDREFS:可以指向⽂档中其它地⽅声明的ID类型值(设置此值是可以在⽂档上存在的)使⽤IDREFS时可以使⽤空格隔开NMTOKEN/NMTOKENS:NMTOKEN是CDATA的⼀个⼦集,设置该属性时只能写英⽂字母、数字、句号、破折号下划线、冒号,但是属性值⾥⾯不能有空格 NMTOKENS:它是复数,如果设置多个值由空格隔开 Enumerated: 事先定义好⼀些值,属性的值必须在所列出的值范围内属性特点:#REQUIRED表⽰必须设置此属性#IMPLIED表⽰此属性可写可不写#FIXED value表⽰元素实例中该属性的值必须是指定的固定值#Default value为属性提供⼀个默认值<!-- 第⼀种写法 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*)><!ELEMENT student EMPTY><!--定义了⼀个id属性类型为ID 必须值--><!ATTLIST student id ID #REQUIRED><!--设置了name属性为任意字符的字符串必须值--><!ATTLIST student name CDATA #REQUIRED ><!--设置address 类型为多个常规字符串且不需要⼀定存在此属性--><!ATTLIST student address NMTOKENS #IMPLIED><!--设置srcID 该属性的值只能从id上⾯上取--><!ATTLIST student srcID IDREFS #IMPLIED>]><School><student id="st001" name="蚂蚁⼩哥"/><student id="st002" name="欧阳;*)*^%$:⼩⼩" address="安徽_六安安徽_合肥"/><student id="st003" name="许龄⽉" srcID="st001 st002"/></School><!-- 第⼆种写法 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE School[<!ELEMENT School (student*)><!ELEMENT student EMPTY><!--简便写法,全部放在⼀起写--><!--设置了name属性为任意字符的字符串不⼀定要设置此属性,但是设置必须按照指定的值--> <!ATTLIST studentid ID #REQUIREDname CDATA #FIXED '我们名字都⼀样'address CDATA '默认都是安徽'sex (男|⼥) #REQUIRED>]><School><student id="st001" sex="男" name="我们名字都⼀样"/><student id="st002" sex="⼥"/><student id="st003" sex="男" name="我们名字都⼀样"/></School>DTD的属性定义具体代码5:DTD实体定义(ENTITY)实体分类:普通内部实体,普通外部实体,内部参数实体,外部参数实体语法:普通内部实体定义:<!ENTITY 实体名 "实体值">普通外部实体引⼊:<!ENTITY 实体名 SYSTEM "URI/URL">内部参数实体定义:<!ENTITY % 实体名 "实体值">外部参数实体引⼊:<!ENTITY % 实体名 SYSTEM "URI/URL">⽰例定义:<!ENTITY name "蚂蚁⼩哥"><!ENTITY address "安徽六安">⽰例XML⾥使⽤:<name>&name;</name>使⽤范围:定义实体分为内部实体(定义在当前xml⽂件)和外部实体(定义在外部dtd⽂件⾥)<!-- 内部普通实体 --><?xml version="1.0" encoding="UTF-8" standalone="yes" ?><!DOCTYPE Student[<!ELEMENT Student (name,address)><!ELEMENT name (#PCDATA)><!ELEMENT address (#PCDATA)><!ENTITY name "蚂蚁⼩哥"><!ENTITY address "安徽六安">]><Student><name>&name;</name><address>&address;</address></Student>DTD实体定义代码6:使⽤命名空间(Namespace) 避免元素名冲突,使⽤URL作为XML的Namespaces(这样也有约束和提⽰好处) 语法:xmlns:[prefix]="URL" 元素和属性都可以应⽤命名空间 XML的元素名是不固定的,当两个不同类型的⽂档使⽤同样的名称描述两个不同类型的元素的时候就会出现命名冲突<?xml version="1.0" encoding="UTF-8" standalone="yes" ?><h:table xmlns:h="/1999/xhtml"><h:tr><h:td>名称A</h:td><h:td>名称B</h:td></h:tr></h:table>四:核⼼Schema语法约束1:什么是XML Schema XML Schema描述了XML⽂档的结构。
xlm基础
XML|-DTD|-Schema一。
XML术语元素(Elements):代表XML文档中的每一个组件,包含字符,元素或者两者皆有,允许有空元素属性(Attributes):放在元素后面的数据,代表这个元素的另一种特性和特征。
统一编码(Unicode):一种字符集,包括了全世界各种语言中有用的字符。
实体:“文本片”,实体也象一个缩写,一个实体可以是一个字符也可以是一个文档数据,是XML文本的基本单位。
标记(Markup):像标记(TAG),实体引用(Entity reference)和生命这样的构造。
样式表(XSL):描述XML的元数据文件格式的语言文档实例(Document instance)以元素的层次结构组织的实际文档数据。
二。
XML语法简介1.简单的例子:<作者><姓名>张三</姓名><年龄>50</年龄><职务>作协主席</职务><作品>张三那点事</作品></作者>2.声明(Declaration)<?xml version="1.0"encoding="GB2321"?>3.元素(Elements)和属性(Attrbutes)<元素名属性名=“属性值”><子元素>元素的数据</子元素></元素名>4.注释(Comments)<!--阿!这就是帮助-->5.于定义实体:&-------&<---------<>--------->'--------'"--------"6.CDATA 按照普通数据来处理<![CDA TA[内容]]>三。
XML基础教程(第2版)_第2章_规范的XML文件
2.3.2 非空标记_3.作用
非空标记包含的内容中既可以有文本数据也可以有子标记. 当需要用“整体-部分”关系来描述数据时,就可以使用非 空标记,XML文件中的可以有如下结构的标记: <学生> <姓名>张三</姓名> <学号>A1001</学号> </学生> 当需要使用文本来描述一个数据时,也需要使用非空标记
2.3.2 非空标记_1. 语法格式
非空标记必须由“开始标签”与“结束标签”构成,它们之 间是该标记的内容。 开始标签以“<”标识开始,用“>”标识结束,标识之间 是标记的名称和属性列表开始标签的语法格式分别为: <标记的名称 属性列表 > 或 <标记名称> 注意:在标识“<”和标记名称 之间不要含有空格,允许“>” 的前面可以有空格或回行。
以下是2个空标记(正确的空标记): <water /> <张三 age="28" sex="男" /> 错误的空标记:× <water />
< 张三 age="28" sex="男"/> < water />
2.3.1 空标记_2.作用
由于空标记不包含任何内容,因此在实际编写XML文件时, 空标记的名称主要用于抽象带有属性的数据,该数据本身并不需 要用具体文本进行描述,比如,如果XML需要描述宽12、长20 的长方形,但不准备有任何关于长方形的文字描述,那么就可以 使用如下的标记: <长方形 width="12" length=20 /> XML解析器主要关心空标记中的属性,并可以解析出这些 属性的值。
第3章_XML基础
3
XML逻辑结构 XML逻辑结构
一个XML文件通常以一个XML声明开始,后面通过 一个XML文件通常以一个XML声明开始 后面通过XML XML文件通常以一个XML声明开始 后面通过XML 元素来组织XML数据 来组织XML数据。 元素来组织XML数据。 XML元素包括标记 字符数据。为了组织数据更 XML元素包括标记和字符数据 为了组织数据更 元素包括标记和 加方便、清晰,我们还可以在字符数据中引入CDATA CDATA数 加方便、清晰,我们还可以在字符数据中引入CDATA数 据块,并可以在文件中引入注释 此外, 注释。此外 据块,并可以在文件中引入注释 此外,由于有时需要 XML处理程序提供一些指示信息 XML文件中可以包含 处理程序提供一些指示信息, 给XML处理程序提供一些指示信息,XML文件中可以包含 处理指示。 处理指示 元素的内容可以包含子元素 字符数据、字符引用、实 子元素、字符数据 字符引用、 元素的内容 子元素 字符数据、 体引用和CDATA CDATA段 体引用和CDATA段。
4
XML的结构
XML文档在逻辑上有六部分组成 文档在逻辑上有六部分组成
1. XML的声明文档 的声明文档 2.文档类型声明 文档类型声明 3.元素 元素 4.注释 注释 5处理指令 处理指令. 处理指令 6属性 属性
5
XML声明 XML声明
XML种规定,每个XML文件都必须以XML声明开头, XML种规定,每个XML文件都必须以XML声明开头,其中 种规定 XML文件都必须以XML声明开头 包括XML版本属性,字符集属性,独立属性等信息。注意: 包括XML版本属性,字符集属性,独立属性等信息。注意:在 XML版本属性 等信息 XML声明的前面不允许再有任何其他的字符, XML声明的前面不允许再有任何其他的字符,也就是说不能有 声明的前面不允许再有任何其他的字符 空白其他的处理指令或注释。 空白其他的处理指令或注释。
ML的基础知识学习
概述学习 XML 的基础知识,即什么是 XML 以及 XML 的工作原理,然后了解一下 Microsoft Office System 中的某些程序是如何关心您使用 XML 的。
课程目标在完成本课程之后,您将能够:•关心规划 XML 系统。
•使用和遵循差不多的 XML 术语和概念,例如:标记、架构和转换。
•了解 XML 在某些 Microsoft Office System 程序中是如何工作的。
课程内容本课程包括:•五节自己操纵进度的课和两个亲自动手的练习单元。
•在每节课末尾的小测验;不对测验进行评分。
一个留做以后参考的课程摘要卡。
第1课:什么缘故要使用 XML?XML 可让您通过更多的方式使用更多来源的数据。
通过更多方法使用更多数据多种多样的数据源,五花八门的数据源数据用法假定您在一家中等规模的公司治理人力资源部门。
您的职员要查看专门多简历(通常为文档或电子邮件格式)。
要是能把那些简历中的姓名、地址和职业技能列表自动复制出来,就太好了!要是能使用计算机将那些技能与招聘职位对应起来,就更好了!要是能够使用相同的流程为您的经理预备您所在部门的业绩报告,就最理想了。
您能够使用 XML 来实现上述(以及更多的)设想。
您能够从各种原始资料中提取数据,并将这些数据集中存储在一个位置,以便在您随时随地需要数据时,明白到哪里查找数据并再次使用这些数据。
例如,您是否需要汇报过去三年的预算数据?不管您用什么方法存储那些数据,假如数据是 XML 格式,您就能够选择所需数据并视情况的需要将其导入文档、工作表或数据库。
实现业务流程的自动化一个部门输入的 XML 数据能够在其他部门的不同程序中使用。
XML 的另一项优点是:它能够使任意数量的业务流程实现自动化。
例如,客户给您发送了一份订单。
您收到的订单可能会是任何一种形式的文档,但文档中的信息是 XML 格式。
您的计算机系统能够自动将该订单转换为工作表以供您的发货部门使用,并将订单数据自动导入到财务数据库中。
第1章XML基础教程教案资料
1.2 HTML及其局限
1.2.1 HTML文档范例
HTML提供了一组固定的、预先定义 好的元素标记用来标注一般用途的网页元 素。常用的元素标记包括:标题、段落、 列表、表格、图片与超链接等。HTML在 创建普通网页时效果良好,大多数网页的 代码都是由HTML标记的内容构成的。
1.2.2 HTML文档基本架构
1.2.3 HTML文档常用标记
常用的HTML标记及其功能如表1-1所示。
表1-1 HTML网页中常用的标记
标记
标记功能
HTM L
HEA D
TITL E
BOD Y
标识整个网页文档
标识网页头部
标识网页标题内容,此内容将出现在 浏览器的标题栏中 标识网页的主体部份
H1
标识第一级标题文字
H2 H3 TABLE TR TH TD UL OL
XML与SGML、HTML的关系
SGML、HTML是XML的先驱。SGML是指“通 用标识语言标准”(Standard Generalized Markup Language), 它是国际上定义电子文件结 构和内容描述的标准,是一种非常复杂的文档的 结构,主要用于大量高度结构化数据的防卫区和 其他各种工业领域,利于分类和索引。同XML 相比,定义的功能很强大,缺点是它不适用于 Web数据描述,而且SGML软件价格非常价格昂 贵。 HTML相信大家都比较熟悉,即 “HyperText Markup Language” (超文本标识 语言),它的优点是比较适合web 页面的开发。
标识链接到其他位置或其他网页的超链接 (Anchor 元素) 标识文字的字体、字号与颜色 标识一个加强显示的斜体文字区块 标识一个粗体文字区块
1.2.4 HTML的局限
XML入门基础:XML的语法规则
XML入门基础:XML的语法规则想索取更多相关资料请加qq:649085085或登录PS;本文档由北大青鸟广安门收集自互联网,仅作分享之用。
提纲:一.XML语法规则二.元素的语法三.注释的语法四.CDATA的语法五.Namespaces的语法六.entity的语法七.DTD的语法一.XML语法规则XML的文档和HTML的原代码类似,也是用标识来标识内容。
创建XML 文档必须遵守下列重要规则:规则1:必须有XML声明语句这一点我们在上一章学习时已经提到过。
声明是XML文档的第一句,其格式如下:<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>声明的作用是告诉浏览器或者其它处理程序:这个文档是XML文档。
声明语句中的version表示文档遵守的XML规范的版本;standalone表示文档是否附带DTD 文件,如果有,参数为no;encoding表示文档所用的语言编码,默认是UTF-8。
规则2:是否有DTD文件如果文档是一个"有效的XML文档"(见上一章),那么文档一定要有相应DTD文件,并且严格遵守DTD文件制定的规范。
DTD文件的声明语句紧跟在XML 声明语句后面,格式如下:<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">其中:"!DOCTYPE"是指你要定义一个DOCTYPE;"type-of-doc"是文档类型的名称,由你自己定义,通常于DTD文件名相同;"SYSTEM/PUBLIC"这两个参数只用其一。
SYSTEM是指文档使用的私有DTD文件的网址,而PUBLIC则指文档调用一个公用的DTD文件的网址。
xml 教程
xml 教程XML(可扩展标记语言)是一种常用的数据交换格式,被广泛应用于各种领域,特别是在互联网和Web服务中。
它的设计目标是提供一种简单且人类可读的标记语言,用于描述和交换结构化的数据。
本篇教程将为你介绍XML的基本概念、语法规则和应用场景,帮助你快速入门并掌握XML技术。
一、XML的基本概念1. 标记语言:XML是一种标记语言,它使用尖括号(< >)标记开始和结束元素,来定义数据的结构和属性。
2. 可扩展性:XML具有可扩展性,即你可以根据需要定义自己的标签和属性,无需受到固定标准的限制。
3. 结构化数据:XML是一种用于描述和交换结构化数据的语言,数据可以按照自定义的层次结构和关系进行组织。
二、XML的语法规则1. 声明:XML文档以声明(Declaration)开头,使用<?xml?>标记,用于指定XML版本和编码方式。
2. 标签(Element):XML文档由标签组成,标签可以嵌套和包含其他标签,用于表示数据的不同层次和关系。
3. 属性(Attribute):标签可以包含属性,属性包含在标签的开始标记中,用于提供关于标签的额外信息。
4. 内容:标签可以包含文本内容或其他标签,用于描述数据或表示数据间的关系。
5. 注释:XML文档可以包含注释(<!-- -->),用于给文档添加说明和注解。
6. 实体引用:某些字符在XML中具有特殊的意义,使用实体引用(Entity Reference)表示这些字符,如<表示小于号(<), >表示大于号(>)等。
三、XML的应用场景1. 数据交换:XML可以作为一种通用的数据交换格式,用于不同系统之间的数据传输和共享。
2. Web服务:XML用于描述和传输Web服务的请求和响应数据,如SOAP(Simple Object Access Protocol)和REST (Representational State Transfer)。
xml格式讲解
xml格式讲解XML(eXtensible Markup Language)是一种用于描述和传输数据的标记语言。
它能够通过自定义标签来定义数据的结构和内容。
本文将对XML格式进行详细讲解。
一、XML的基本语法XML采用了类似于HTML的标签语法,但与HTML不同的是,XML标签必须自行定义,且对大小写敏感。
以下是XML的基本语法要点:1. 标签:XML使用尖括号(< >)来定义标签,标签通常成对出现,分为开始标签和结束标签。
例如:<book>...</book>2. 元素(Element):元素由开始标签、结束标签和标签内容组成。
例如:<name>John</name>3. 属性(Attribute):属性为元素提供更多的信息,通常出现在开始标签中。
例如:<book category="novel">...</book>4. 注释:注释用于添加对XML代码的说明,以"<!--"开头,以"-->"结尾。
例如:<!-- This is a comment -->二、XML的文档结构一个合法的XML文档必须包含一个根元素,并且所有的元素都必须严格嵌套。
以下是一个简单的XML文档示例:<?xml version="1.0" encoding="UTF-8"?><library><book><title>《Pride and Prejudice》</title><author>Jane Austen</author></book><book><title>《1984》</title><author>George Orwell</author></book></library>在上述示例中,根元素是"library",它包含了两个子元素"book",并且每个"book"元素分别包含了"title"和"author"元素。
XML基础教程课后习题解答
X M L基础教程课后习题习题一1.答:HTML 是用来编写 Web 页的语言、不一样意用户自定义标记,HTML 表达数据的显示格式。
XML 描述数据的组织结构、可自定义标记,其标记名称是对标记所包含的数据内容含义的抽象,而不是数据的显示格式。
2.答:使用UTF-8 保存5.答:〔1〕不可以,〔2〕可以,〔 3〕不可以6.答::time{ display:block;font-size:18pt;font-weight:bold}hour{ display:line;font-size:16pt;font-style:italic}mimute{ display:line;font-size:9pt;font-weight:bold}习题二 1.答:〔 1〕使用 ANSI 编码。
〔 2〕可以。
〔 3〕不合理。
2.答:不一样样。
3.答:〔 1〕和〔 2〕。
4.答: A3.xml 。
5.答:“ root 〞标记包含的文本内容都是空白字符。
“ a1〞标记包含的文本内容: <CCTV5>。
“ a2〞标记包含的文本内容:子曰"有朋自远方来,不亦乐乎"。
习题三 1.答:一个标准的XML 文件若是和某个DTD文件相关系,并遵守该DTD文件规定的拘束条件,就称之为有效的XML 文件。
2.答: DTD 文件的编码必定和其拘束的XML 文件的编码相一致。
3.答:没关。
4.答: (1) 使用 SYSTEM 文档种类声明的格式:<DOCTYPE根标记的名称 SYSTEM "DTD文件的 URI">(2)使用 PUBLIC 文档种类声明的格式:<!DOCTYPE 根标记的名称PUBLIC " 正式公用表记符 " "DTD 文件的 URI">5.答:必然。
6.答:〔 1〕拘束标记“张三〞必定有“学号〞属性〔2〕拘束标记“张三〞必定有“学号〞属性,而且学号的属性值是固定的220213。
XML基础知识课件
PPT学习交流
7
XML与HTML的比较
• HTML将数据和其显示效果混在一起,它是一种表现技术 ; XML 文档只是存储了数据和描述了数据之间的关系,没有规定该如何 显示数据。
• HTML的格式要求比较松散 ;而XML是非常严格的标记语言。
• HTML的标记集合是固定的;而XML只是提供了一个标准,人们 可以按照这个标准来定义自己专用的标记。
PPT学习交流
13
元素的标记名称建议
• 不要使用“.”,因为在很多程序语言中,“.”用于引用对象的属性。 • 最好不要用减号(-),而以下划线(_)代替,以避免与表达式中的
减号(-)运算符发生冲突。 • 名称尽量简短,以减少XML文档的大小。 • 名称的大小写尽量采用同一标准,要么全部大写,要么全部小写。 • 名称可以使用非英文字符,例如中文,但是有些软件可能不支持非英
11
元素定义
• 一个XML元素由一个标记来定义,包括开始和结束标记以及其中 的内容,例如:
<书名>Java就业培训教程</书名>
• 一个元素中可以嵌套若干子元素。
• 格式良好的XML文档必须有且仅有一个根元素,其它元素都是这 个根元素的子孙元素。
• 空元素可以不使用结束标记,但必须在起始标记的结束定界符 (>)前面增加一个正斜杠(/)字符,例如:
PPT学习交流
4
XML的起源与作用
• 在线电子商务活动交换的电子文档必须采用某种标准格式,统一电 子文档的标准规范是电子商务的基础。
• HTML不适合作为电子商务的文档标准。 • SGML(Standard Generalized Markup Language)过于复杂,无法
《XML基础教程期末考试及答案》
一选择填空第一章:1.xml2.Xml P7)3.XML4.下面选项中A.数据组织与管理B.扩展标记语言C.使网页的表现形式更丰富D.扩展网络的通用性第二章:1.XML部分。
2.3.A.month/day/yearB._4lineC.我的电脑D.full nameE.Jim'sF.内存4.元素内容的文本数据包括“>”时应该使用的实体引用方式为__A(P20)A.>B.&It;C.&D."大于号 > 小于号 &It; 和 & 双引号 ";第三章:1.DTD的声明方法包括P40)2.DTD3种类型。
(P49)第四章:1.css个部分。
(P88)2.选择文档目录树(DOM)中的所有类型的单-对象时,用以构成完整的选择符。
(P77)3.使用属性选择符时以下使用方法合法的是 A、B (P78)A.A[attr]{property:value;}B.A[attr=value]{property:value;}C.A[attr~=value]{property:value;}D.A[attr|=value]{property;value;}4.以下颜色设置中 A、B、C 表示红色。
P83A.RGB(255,0,0)B.#FF0000C.RGB(100%,0%,0%)D.#FFF 第五章:1.XSL个部分。
(P96)2.XSLT3.)C.sortD.param4.<fo:flow>几个部分。
P127第六章:1.DOM是用于操作XML文档的,对于DOM来讲,所有XML2.XML它被各种不同的节点类型所实体参数节点12个节点类型组成。
(P176) 下面 D 接口不是从(P142)A.ELEMENTB.TEXTC.ATTRIBUTEVD.NODELIST4.下面C_接口不是从字符数据接口继承而来的。
本章中将学习到如下内容
entry元素有三个子元素: name,tel,comments。
一、XML基础语法 基础语法
1、XML标记初步 、 标记初步 6) 元素嵌套
<!-- Not legal XML markup -- > <p> <b>I <i>really love</b> XML. </i> </p> (I) <!-- legal XML markup -- > <p> <b>I <i>really love</i></b> <i> XML. </i> </p> (II)
<?xml version=“1.0”?> <!-- An invalid document -- > <greeting> Hello,World! </greeting> <greeting> Hola, el Mundo! </greeting>
此文档不包含单一根元素, 不管该文档可能包含什么信息, XML解析器会拒绝它。
一、XML基础语法 基础语法
2、XML文档中的其它项 、 文档中的其它项 8) 注释 注释以<!-- 开始,以-- >结束。 注释可以出现在文档的任何位置,包括根元素的前面或后面。
注意: 注意: 注释不能在结束部分以外包含双连字符( -- ), 除此之外,注释可以包含任何内容。 注释内容将被解析器忽略,即注释内的标记也会被忽略。
一、XML基础语法 基础语法
2、XML文档中的其它项 、 文档中的其它项 10) Unicode Unicode是由统一编码联盟(Unicode Consortium)发布的,它是对 ASCII字符集进行的一项扩展。 国际标准化组织ISO也发布了同一个标准,ISO/IEC 10646 Unicode支持所有的语言(地球上存在的)以及数学和其他符号。 支持英语、西欧语言、西里尔语、日语、汉语等等。 ASCII字符集: 8 byte ---- 一个字符; Unicode字符集:16 byte ---- 一个字符;
XML入门教程
XML入门教程本教程将向初学者介绍XML的基础知识,包括语法、元素、属性、命名空间、文档类型定义等内容。
1.XML语法:XML使用尖括号(<>)来标记开始和结束,如<element>。
每个XML文档必须有一个根元素,所有其他元素必须嵌套在根元素内。
2.XML元素:XML文档由元素构成,元素由开始标记和结束标记包围,如<element>data</element>。
元素可以嵌套在其他元素中,形成层次结构。
3.XML属性:元素可以包含属性,属性用于为元素提供额外的信息。
属性由名称和值组成,如<element attribute="value">data</element>。
4.XML命名空间:XML命名空间用于解决元素和属性名称冲突的问题。
通过为元素和属性添加命名空间前缀,可以将其归属于特定的命名空间。
例如:<ns:element>。
5.XML文档类型定义(DTD):DTD定义了XML文档的结构和规则。
它可以定义允许的元素、元素顺序、元素类型、元素属性等。
DTD还可以定义实体和符号,用于表示特殊字符和文本片段。
6.XML解析和生成:XML解析是将XML文档解析为可供程序使用的数据结构的过程。
常用的XML解析技术包括DOM(文档对象模型)和SAX(简单API for XML)。
XML生成是将程序数据转换为XML文档的过程,可以使用XML库或编程语言提供的API来生成XML文档。
7.XML相关技术:XML还有许多相关技术,例如XSLT(可扩展样式表语言转换)、XPath(XML路径语言)、XQuery(XML查询语言)和XML Schema(XML模式定义语言)。
这些技术通过增强XML的功能和表达能力,使得XML在数据转换、数据查询和数据验证方面变得更加强大和灵活。
希望这个XML入门教程可以帮助初学者快速上手XML,了解XML的基础知识和相关技术。
XML学习总结(二)——XML入门
XML学习总结(⼆)——XML⼊门⼀、XML语法学习 学习XML语法的⽬的就是编写XML ⼀个XML⽂件分为如下⼏部分内容:⽂档声明元素属性注释CDATA区、特殊字符处理指令(processing instruction)1.1、xml语法——⽂档声明 在编写XML⽂档时,需要先使⽤⽂档声明,声明XML⽂档的类型。
最简单的声明语法:<?xml version="1.0" ?> 例如:1<?xml version="1.0"?>2<softCompany>3<company>MicroSoft</company>4<company>google</company>5<company>Apple</company>6</softCompany> 浏览器解析结果如下: ⽤encoding属性说明⽂档的字符编码:<?xml version="1.0" encoding="GB2312" ?> 当XML⽂件中有中⽂时,必须使⽤encoding属性指明⽂档的字符编码,例如:encoding="GB2312"或者encoding="utf-8",并且在保存⽂件时,也要以相应的⽂件编码来保存,否则在使⽤浏览器解析XML⽂件时,就会出现解析错误的情况。
例如:1<?xml version="1.0"?>2<softCompany>3<company>MicroSoft</company>4<company>google</company>5<company>Apple</company>6<company>百度</company>7</softCompany> 这个XML⽂件中没有使⽤encoding属性来指明⽂档的字符编码,但⽂档⾥⾯有“百度”这样的中⽂字符,在使⽤IE浏览器解析该XML⽂件时,IE就不知道该使⽤什么编码去解析该⽂件,就⽆法解析了,出现的错误如下图(图-1)所⽰: 图-1 要想正确解析该XML⽂档,就可以使⽤encoding属性指明该⽂档的字符编码。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节:xml的概述Xml的全称是Extensible Markup Language 可扩展标记语言。
它是由SGML(Standard Gerneralized Markup language)发展而来的,允许开发者自定标签,可以将标签和内容有效的分离。
(可扩展):相对于标记语言来说它可以自定标签。
标记语言html 标签<table> <h1> <p> 都是规定好的标签,我们才可以使用Xml与html的区别:Xml用来传输和存储的数据的。
它可以自定义标签.Html:显示数据<p></p> <p><p>所以说xml并不是用来代替html的,二者的为不同的目的而设计。
Xml的优势:1、简单易用2、严格的格式---xml的基本语法Xml是平台无关的数据交换语言,Java是平台无关的编程语言,有人为:xml与Java就是天生一对。
3、数据逻辑与显示逻辑分离---看似MVC模式理解Xml和JavaEE1、配置描述JavaEE 最开始接触的JSP技术,在web.xml中可以配置Servlet,Filter和Listener体现了xml的应用。
Struts1 struts-config.xmlHibernate hibernate.cfg.xml xxx.hbm.xmlStruts2 struts.xmlSpring2.5 bean.xml2、简化的数据交换Web Services使用基于xml的消息处理作为数据通讯方式,消除了不同组件模型、操作系统和编程语言之间存在的差异,使异构系统能作为单个计算机网络协同运行。
Csdn webservice编程开发csdn网站Xml的竞争对手:1、Jdk1.5 –>Java的Annontation(注解)2、轻量级的数据交换格式------JSON(JavaScript Object Notation)第二节:xml文档规范Xml文档的分类1、格式不良好(malformed)的xml文档:完全没有遵守xml文的基本规范的xml文档。
2、格式良好(well-formed)的但无效的xml文档: 遵守xml文的基本规范,但没有使用dtd或schema定义语义约束的xml文档。
3、有效(valid)的xml文档:遵守xml文的基本规范,并使用dtd或schema定义语义约束,而且也完全遵守了dtd或schema定义语义约束的xml文档。
Xml的语法•一个XML文件分为如下几部分内容:–文档声明–元素–属性–注释–CDATA区、特殊字符–处理指令(processing instruction)Xml的声明最简单声明<?xml version=”1.0”?>Encoding属性:字符编码如果没有指定默认的是UTF-8编码常见的字符集:简体中文:GBK 或GB2312繁体中文: BIG5西欧字符:ISO8859-1通用的国际编码:Unicode UTF-8演示案例:<?xml version="1.0" encoding="UTF-8"?><中国></中国>出现了:Standalone:指定该文档是否需要引用其它资源,属性值只有:yes或noYes:独立No:不独立Xml元素的基本规则元素是xml文档的基本单元,xml文档就是一个一个层层嵌套的元素组成的。
整个的xml 文档从根元素开始,根元素包含若干个子元素,而每个子元素又可以包含若干个子元素,从而可以组成一个xml文档。
Xml标签语法:1、Xml的标签分为两类:单标记:<商丘/>双标记:<中国></中国>2、xml标签的要求:1、标签名可以有字母(包括非西欧字符)、数字、下划线(_)、中划线(-)、冒号(:)和点号(.)组成,但不能以数字、中划线和点号开头。
2、标签名不能包含<、>、,、$等符号3、标签名种尽量不要出现英文的冒号(:),除非在使用命名空间。
4、标签名不能以字符xml、XML等任意大小写组合开始。
4、标签名不能包含空格。
5、标签名区分大小写3、xml标签嵌套子元素:xml允许深度嵌套子元素,只要保证元素之间合理的嵌套即可.而且xml元素可以嵌套多个重名的子元素,这多个子元素之间是有序的。
第一个:xml<中国><北京><海淀/><朝阳></朝阳><朝阳></朝阳></北京></中国>第二个xml:<中国><北京><朝阳></朝阳><朝阳></朝阳><海淀/></北京></中国>4、空元素:空元素不可以接受子元素,也不可以接受字符串内容。
第三个xml:<book><name>redarmy</name><content/> :备注:空元素但可以接受属性,而且可以接受多个属性</book><book><name>redarmy</name><content></content> :备注它包好的是一个空格空格也是字符</book>例如空元素接受属性:<book name=”Java建议” price=”30”/>5、字符数据<book><computer>Struts2开发详解</computer><computer>Struts2开发详解</computer></book>对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理如果文本字符中包含了一些特殊的字符,例如<和&由于这些字符都有特殊的含义,因此直接在xml文档中使用该字符串将引起文档的混乱。
<表达式><比较符>1+3<6</比较符></表达式>代表的是文本字符串中包含了特殊的字符有以下两种方法解决:1、使用实体引用:用另一个特殊符号代替这些特殊符号2、使用CDATA标记:将整个文档定义成字符串。
1、使用实体引用解决如下:<?xml version="1.0" encoding="UTF-8"?><表达式><比较符>1+3<6</比较符></表达式>2、使用CDATA标记在特殊标记CDATA下,所有的特殊字符,甚至是有效的元素都将被当成简单的字符串处理。
实体引用也会失去作用,变成直接的文本。
CDATA的语法格式如下:<![CDATA[文本内容]]><?xml version="1.0" encoding="UTF-8"?><表达式><比较符><![CDATA[1+3<6]]></比较符></表达式>备注:由于xml文档根本不会对CDATA标记内容进行任何解析,因此在CDATA内可以放置任何内容,其中的内容永远不会出错。
6、注释Xml文档还可以加入解释用的字符数据,这些解释用的字符串不会被xml解析器处理。
这些解释用的文本称为注释。
Xml的文档注释与html完全一致。
Xml注释的语法格式如下:<!--注释字符串-->Xml的注释允许包含元素和标签。
注意:1、Xml的注释不能够放在标签体内。
2、不要把xml文档放在xml文档声明之前xml文档的声明永远在第一行3、不在注释中使用双中划线(--)…..7、处理指令处理指令,简称PI (processing instruction)。
处理指令用来指挥解析引擎如何解析XML文档内容。
处理指令用于给处理xml文档的应用程序提供信息,告诉处理程序应该如何处理该文档。
一个完备的xml文档的处理程序,可以读取xml文档的处理指令,并根据处理指令进行相应处理,或将它传给下一个程序。
Xml处理指令的格式如下:<?处理指令名处理指令信息?>8、属性xml属性的特征:1、xml元素的属性必须有属性值,属性值必须用引号引起来。
2、同一个xml元素里不能有多个同名的属性3、Xml元素里的多个属性之间没有先后顺序。
<book><isbn>123456780</isbn><book_name>Java讲义</book_name><price>99</price></book>比如说这个book本身就有isbn book_name price的属性那么<book isbn=”” book_name=”” price=””/>Xml必须有一个根元素。
Xml文档的整体结构1、必须有一个根元素(有且只有一个)2、元素必须合理结束3、元素之间必须合理嵌套4、元素的属性必须有属性值只要不满足上面的条件就是一个格式不良好的xml文档只要满足上面的条件就是一个格式良好的xml文档并且遵守了dtd或者schema就是一个有效的xml文档。
Xml文档是一种标准的结构化文档,可以转换成DOM(Document Object Model)树,其根节点对应DOM树的根节点。
<book><name>网上介绍</computer><computer><name>网上介绍</computer></book>第三节dtd 第四节CRUD。