| |
 |
|
[Semantic Web](连载)语义网之路--XML文档(1) |
Lee 发表于 2007/1/25 20:31:35 |
1 基本构成
一个XML文档由XML序言(Prolog)、XML元素和其他一系列可选项构成。请看下面的例子。
代码清单3-3
[1] <?xml version="1.0" encoding="GB2312" standalone="no" ?>
[2] <?xml-stylesheet type="text/xsl" href="se.xsl" ?>
[3]
[4] <!--一个XML的例子 -->
[5]
[6] <搜索引擎列表>
[7] <搜索引擎>
[8] <名称>百度</名称>
[9] <网址>www.baidu.com </网址>
[10] <创始人>
[11] <![CDATA[
[12] <姓名>李彦宏</姓名>
[13] <电邮>LYH@baidu.com</电邮>
[14] ]]>
[15] </创始人>
[16] </搜索引擎>
[17]
[18] <搜索引擎>
[19] <名称>谷歌</名称>
[20] <网址>www.google.com </网址>
[21] </搜索引擎>
[22]
[23] <搜索引擎>
[24] <名称>雅虎</名称>
[25] <网址>www.yahoo.com</网址>
[26] </搜索引擎>
[27] </搜索引擎列表>
在本例中,[1]-[4]为序言,其中包含一些可选项。[6]-[27]为XML元素,其中,[6]和[27]为文档元素,也称根元素,一个XML文档有且仅有一个文档元素;[7]-[26]为包含在文档元素中的元素。
1.1 XML序言
在代码清单3-3所给出的实例文档中,序言部分包括四行:
[1] <?xml version="1.0" encoding="GB2312" standalone="no" ?>
[2] <?xml-stylesheet type="text/xsl" href="se.xsl" ?>
[3]
[4] <!--一个XML的例子 -->
第一行是XML声明(XML declaration)。XML声明在XML文档中是可选的,尽管如此,W3C仍推荐加入这一行声明。因此,作为一个良好的习惯,我们通常把XML声明作为XML文档的第一行。
<?xml表明这是一个XML文档,version="1.0"说明其版本号为1.0。XML支持一个庞大的编码集合,到底采用哪种编码取决于文件中用到的字符集。本例中encoding="GB2312"表明字符编码格式为中文简体国标编码GB2312。Encoding是可选项,默认为Unicode编码。
Standalone表明该XML文件是否和一个独立的文档类型定义文件(即DTD文件)配套使用,其值为yes或no。如果为yes,表明该XML文件单独使用;如果为no,表明该XML文件将和一个单独的DTD文件配套使用。
序言的第二行是处理指示。处理指示是提供给XML应用程序使用的,XML应用程序按照它所提供的信息进行处理,或者再把它原封不动地传给下一个应用程序使用。处理指示的格式为:
<?处理指示名称 处理指示内容 ?>
在本例中,我们使用一个处理指示来指定与这个XML文件配套使用的样式单的类型及其文件名。该处理指示的名称为xml-stylesheet,内容为type="text/xsl" href="se.xsl"。实际上,XML声明也是一个处理指示。
序言的第三行是一个空行。为了增加可读性,可以在XML文档中插入任意数量的空行。XML处理器将忽略这些空行。
序言的第四行是注释。给XML文档添加注释是可选的,但是这样可以增强文档的可读性。注释以“<!--”作为开头,以“-- >”作为结尾。你可以在这两个字符串之间输入任意数量的文本,XML处理器将忽略这些文本。但在添加注释时必须注意以下几点:
l 在注释中不能出现字符“-”或字符串“--”;
l 不要把注释放在标记或实体声明中;如
<姓名 <!-- 一个XML的例子 -->>
l 不要把注释放在XML声明之前,永远用XML声明作为XML文件中的第一行;
l 不能进行嵌套注释。如
<!-- 一个XML的例子
<!--这是一个注释-->
-->
实际上,整个XML序言部分包括XML声明、处理指示和注释都是可选的。但对一个“形式良好的”或“有效的”XML文档来说,有些确是必需的。
(未完待续)
|
|
|
| |
 | |
|
| Blog 信 息 |
blog名称:风落沙 日志总数:348 评论数量:550 留言数量:52 访问次数:1607816 建立时间:2005年1月28日 |
|
| 友 情 连 接 |
|

|
|
|

| |
|