W3China社区首页　管理页面　写新日志　退出

首页(348)　弱水无形(45)　Semantic Web(66)　Tecaffe(28)　English(112)　语义检索(37)　叮叮咚咚XYZ(34)　信息组织(7)　

[Semantic Web]（连载）语义网之路－－XML文档（2）

原创空间, 电脑与网络

Lee 发表于 2007/1/25 20:39:14

　 1.2　XML元素元素是XML文档的基本单元，包含了XML文档的信息内容。所有的XML文档都应至少包含一个形式良好的根元素（又称为文件元素）。根元素紧跟在XML声明之后，如果该XML文件中还内嵌了DTD，则这个根元素应紧跟在DTD之后。根元素必须是拥有一个非空的标签，其中包含了整个文档的数据内容，例如代码清单3-3示例文档中的“搜索引擎列表”元素。一个典型的元素包括一个起始标签、一个结束标签以及起始和结束标签之间的元素内容。其形式为： <标签名称>元素内容</标签名称> 其中<标签名称>为起始标签，</标签名称>为结束标签，起始和结束标签中的“标签名称”必须完全相同。元素的内容可以是字符数据、其它（嵌套的）元素或者两者的组合。在代码清单3-3的示例文档中，每一个“搜索引擎”元素都包含一系列的嵌套元素，例如： [18] <搜索引擎> [19] <名称>谷歌</名称> [20] <网址>www.google.com </网址> [21] </搜索引擎> <搜索引擎>为起始标签，</搜索引擎>为结束标签，起始和结束标签中的文本“搜索引擎”表示该元素的类型名称。两个标签之间的内容（[19]和[20]行）为元素“搜索引擎”的内容，它由两个嵌套的元素构成。每一个嵌套在“搜索引擎”元素中元素，例如“名称”，都只包含字符数据，如： <名称>谷歌</名称> 除了XML预留的一些特殊字符外，字符数据可以是任何合法的UNICODE字符，起始和结束标签之间出现的所有合法字符都将被忠实地传递给XML处理程序。例如： <Timon>Hakuna Matata</Timon> 和 <Timon>　Hakuna Matata　</Timon> 的信息内容就是不同的，因为后者多了几个空格。为了避免将字符数据和XML标记中需要用到的一些特殊符号相混淆，XML提供了实体引用。当在字符数据中需要使用这些特殊符号时，可以采用实体引用来代替。这些特殊的XML实体引用包括：字符实体引用 > > < < & & “ " ‘ ' 表3-1　XML特殊字符的实体引用因此，当需要在“创始人”这个标记中出现文本“<姓名>李彦宏</姓名>”时，正确的写法应该是： <创始人><姓名>李彦宏</姓名></创始人> 对于带有少量特殊字符的文本，可以通过实体引用很好地解决。当在一段文本中出现大量的特殊字体时，再使用实体引用不仅麻烦费事、容易出错，而且也影响XML文档的可读性，为此XML提供了一个特殊的标记CDATA。在标记CDATA的作用下，所有包含在CDATA中的标记、实体引用都被忽略，XML处理程序将一视同仁地将其中的内容作为字符数据看待。CDATA的形式为： <![CDATA[ 文本内容 ]]> CDATA的文本内容中不能包含字符串“]]>”，因为它代表了CDATA数据块的结束标志。代码清单3-3的示例文档中就包含了CDATA数据段（[11]-[14]行）。（未完待续）

阅读全文(3486) | 回复(0) | 编辑 | 精华

发表评论：

昵称：
密码：
主页：
标题：

验证码： (不区分大小写,请仔细填写,输错需重写评论内容！)

狂潮怒啸

站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.031 second(s), page refreshed 144800607 times.
《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号