|
 |
[Semantic Web](连载)语义网之路--XML文档(2) |
Lee 发表于 2007/1/25 20:39:14 |
1.2 XML元素
元素是XML文档的基本单元,包含了XML文档的信息内容。所有的XML文档都应至少包含一个形式良好的根元素(又称为文件元素)。根元素紧跟在XML声明之后,如果该XML文件中还内嵌了DTD,则这个根元素应紧跟在DTD之后。根元素必须是拥有一个非空的标签,其中包含了整个文档的数据内容,例如代码清单3-3示例文档中的“搜索引擎列表”元素。
一个典型的元素包括一个起始标签、一个结束标签以及起始和结束标签之间的元素内容。其形式为:
<标签名称>元素内容</标签名称>
其中<标签名称>为起始标签,</标签名称>为结束标签,起始和结束标签中的“标签名称”必须完全相同。
元素的内容可以是字符数据、其它(嵌套的)元素或者两者的组合。在代码清单3-3的示例文档中,每一个“搜索引擎”元素都包含一系列的嵌套元素,例如:
[18] <搜索引擎>
[19] <名称>谷歌</名称>
[20] <网址>www.google.com </网址>
[21] </搜索引擎>
<搜索引擎>为起始标签,</搜索引擎>为结束标签,起始和结束标签中的文本“搜索引擎”表示该元素的类型名称。两个标签之间的内容([19]和[20]行)为元素“搜索引擎”的内容,它由两个嵌套的元素构成。每一个嵌套在“搜索引擎”元素中元素,例如“名称”,都只包含字符数据,如:
<名称>谷歌</名称>
除了XML预留的一些特殊字符外,字符数据可以是任何合法的UNICODE字符,起始和结束标签之间出现的所有合法字符都将被忠实地传递给XML处理程序。例如:
<Timon>Hakuna Matata</Timon>
和
<Timon> Hakuna Matata </Timon>
的信息内容就是不同的,因为后者多了几个空格。
为了避免将字符数据和XML标记中需要用到的一些特殊符号相混淆,XML提供了实体引用。当在字符数据中需要使用这些特殊符号时,可以采用实体引用来代替。这些特殊的XML实体引用包括:
字符
实体引用
>
>
<
<
&
&
“
"
‘
'
表3-1 XML特殊字符的实体引用
因此,当需要在“创始人”这个标记中出现文本“<姓名>李彦宏</姓名>”时,正确的写法应该是:
<创始人><姓名>李彦宏</姓名></创始人>
对于带有少量特殊字符的文本,可以通过实体引用很好地解决。当在一段文本中出现大量的特殊字体时,再使用实体引用不仅麻烦费事、容易出错,而且也影响XML文档的可读性,为此XML提供了一个特殊的标记CDATA。在标记CDATA的作用下,所有包含在CDATA中的标记、实体引用都被忽略,XML处理程序将一视同仁地将其中的内容作为字符数据看待。CDATA的形式为:
<![CDATA[
文本内容
]]>
CDATA的文本内容中不能包含字符串“]]>”,因为它代表了CDATA数据块的结束标志。代码清单3-3的示例文档中就包含了CDATA数据段([11]-[14]行)。
(未完待续)
|
|
| |
 | |
|
Blog 信 息 |
blog名称:风落沙 日志总数:348 评论数量:550 留言数量:52 访问次数:1593218 建立时间:2005年1月28日 |
|
友 情 连 接 |

|
|
|

| |
|