« | September 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | | | | | |
| 公告 |
谦卑,荣誉,牺牲,英勇,怜悯,诚实,精神,公正。 |
Blog信息 |
blog名称: 日志总数:183 评论数量:698 留言数量:7 访问次数:3030221 建立时间:2005年12月29日 |

| |
[编程学习]xml和html有什么区别 随笔, 软件技术, 科学研究, 校园生活
newqiang 发表于 2005/12/29 16:07:53 |
XML应用概述
截至目前为止,我们已经介绍了与XML相关的各种标准和技术。限于篇幅,对其中许多内容未能展开介绍,只是起到一个领路的作用,还需要各位读者在进行实际开发中,再参考更详细更权威的资料。在最后一章里,我们将简要介绍一下目前XML在各个领域的应用以及它的发展前景。一方面,XML的广泛应用和广阔前景恰恰是我们学习XML的最好理由;另一方面,我们曾经在各个章节中曾经反反复复地强调了XML的优点,而XML在实际应用中所发挥的巨大作用也正是对前面内容最好的证明和总结。
虽然人们对XML的某些技术标准尚有争议(也许这就是许多标准迟迟不能推出的原因),但是人们已经普遍认识到XML的作用和巨大潜力。作为SGML的简化子集,XML在SGML的应用领域依然有它的用武之地,如:文档、信息管理、出版系统等。另外,XML自身的特点决定了它在SGML的应用领域外拓展出了更为广阔的天地。
考察现在的XML应用,可以将它们分为以下几类。需要大家注意的是,这个分类并没有涵盖所有的XML应用,只是希望利用这个分类为读者提供一个XML应用的概况,而且随着时间的推移,XML的应用范围和方式必将会极大地拓展。
设计置标语言
作为元置标语言,XML为用户提供了定义本行业本领域的置标语言的最好工具。目前这一应用的成功例子比比皆是,例如化学领域的CML,数学领域的MathML,移动通信领域的WML等。
文件保值
XML良好的保值性和自描述性使它成为保存历史档案,如政府文件、公文、科学研究报告等的最佳选择。
数据交换
数据交换无疑是XML最令人激动的应用。数据交换的核心问题是信息的标准化,主要解决信息的可理解性问题,包括人和机器对信息的理解。而且,更重要的是机器对信息的识别,并能根据数据进行自动处理。XML的出现,为信息的标准化提供了有力的工具。
由于不同的应用领域对数据的要求千差万别,因此要想制订一个放之四海而皆准的数据交换标准是不现实的,同时也是不必要的。最典型的作法是在同一应用领域制订一个标准,参与者按照这个标准组织数据,就可以进行数据交换。比如,IBM、UNISYS和其他合作伙伴定义的XMI(XML Metadata Interchange)是一个存储和共享面向对象的程序设计信息的标准。Microsoft和Marimba合作提出的开放软件描述(Open Software Description,简写为OSD)是用于描述软件的一个XML标准。
由于数据交换在电子商务尤其是企业-企业电子商务的核心作用,XML为电子商务带来了新的机遇和活力。
替代传统的EDI电子数据交换(Electronic Data Interchange,简称为EDI)是XML出现以前的数据交换标准,用于在异构系统间交换数据并进行事务处理,但由于EDI难于使用和实施费用昂贵等缺点使得它没有成为数据交换的主流技术。XML的出现,使得数据交换更为廉价和方便。
智能代理智能代理能够理解接收到的数据,然后作出相应的反应。如果数据是结构化的XML数据,智能代理就能够非常容易利用已有的知识库理解数据。XML的出现,为智能代理的发展提供了新的推动力。
Web应用
由于XML是由SGML特别为Web简化的,因此XML文档将成为Web资源的重要组成部分,XML使得搜索引擎更为智能和准确。XML还可以用于建立多层Web应用。
集成不同数据源XML文档可以用来描述包含在不同应用的数据,从Web页面到数据库记录等,Web应用的中间层服务程序将这些用XML表示的数据组合起来,然后提交给客户端或者下一步的应用。XML还提供了客户端包含机制,可以将多个来源的数据集成在一个文档内显示。
本地计算XML数据传输到客户端后,客户端可以利用XML分析器对数据进行解析和操作,在完成系统所需功能的同时,合理分配客户端和服务器的负荷。比如:数据库记录可以直接传输到客户端,然后再进行排序,传统的HTML就无法做到这一点。
数据的多种显示XML将内容与表现分离,XML只描述数据的结构和语义,显示外观则通过样式单文件(CSS或XSL)进行描述。因此,只需在显示时配置不同的样式单,即可实现多种显示效果。
网络出版随着互联网的发展,网络已经成为一种新的媒体,人们在网络上发布各种信息,信息的发布形式和发布语言也多种多样,其中基于XML的显示技术和显示语言发挥了重要作用。比如eBook、eNewspaper等,就利用了XML的显示语言。
支持Web应用的互操作和集成Web界面定义语言(Web Interface Definition Language,简称为WIDL)是webMethods定义的一个XML应用,它是一个能够用于Web的资源和企业应用接口的语言标准。通过它,Web应用可以自动存取Web资源和企业应用。
10.2.1 资源描述框架RDF
其实,XML的应用在现阶段虽然不能称之为随处可见,但是只要留心一下,就可以发现身边其实早就存在着XML应用。
在Netscape Navigator 4.06以后的版本中,有一项功能称为“What s Related”,用来指示与当前浏览的网页相关的站点或网页,在其中起作用的关键技术,除了数据库和搜索引擎外,就是资源描述框架RDF(Resource Description Framework)。RDF是用于处理元数据的XML应用。当用户按下“What s Related”的菜单或按钮时,浏览器将当前浏览的网页的网址传递到Netscape公司的服务器上,服务器在数据库中找到该网页,并且将与这个网页关系最密切的其他网页和相关资料,以RDF格式传送回浏览器。然后以菜单方式呈现给使用者,供使用者选择。那么,究竟什么是RDF呢?它又是如何在这一应用中发挥作用的呢?RDF是一个处理元数据的XML应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。也许这样解释元数据有些令人难以理解,举个简单的例子,书的内容是书的数据,而作者的名字、出版社的地址或版权信息就是书的元数据。数据和元数据的划分不是绝对的,有些数据既可以作为数据处理,也可以作为元数据处理,例如可以将作者的名字作为数据而不是元数据处理。
众所周知,对资源的描述是领域和应用相关的,比如对一本书的描述和对一个Web站点的描述是不一样的,即对不同资源的描述需要采取不同的词汇表。因此RDF规范并没有定义描述资源所用的词汇表,而是定义了一些规则,这些规则是各领域和应用定义用于描述资源的词汇表时必须遵循的。当然,RDF也提供了描述资源时具有基础性的词汇表。
通过RDF,人们可以使用自己的词汇表描述任何资源,但人们更乐意将它用于描述Web站点和页面,由于使用的是结构化的XML数据,搜索引擎可以理解元数据的精确含义,使得搜索变得更为智能和准确,完全可以避免当前搜索引擎经常返回无关数据的情况。当然前提是RDF和标准化的RDF词汇表在Web上广泛使用,而且搜索引擎需要能够理解使用的词汇表。
简单而言,一个RDF文件包含多个资源描述,而一个资源描述是由多个语句构成,一个语句是由资源、属性类型、属性值构成的三元体,表示资源具有的一个属性。资源描述中的语句可以对应于自然语言的语句,资源对应于自然语言中的主语,属性类型对应于谓语,属性值对应于宾语。由于自然语言的语句可以是被动句,因此前面的简单对应仅仅是一个概念上的类比。
下面的例子描述了三个知名的XML站点,其中使用的词汇表是Dublin Core定义的元素集合,由命名空间http://purl.org/DC/指定,标记CREATOR表示资源的人员或组织,标记TITLE表示资源的名称。Dublin Core元素集合还包括其他已经确定的元素,另有一些元素还处于实验阶段,感兴趣的读者可以查阅相关资料。
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/DC/ "> <rdf:Description about="http://www.w3.org/XML/"> <dc:CREATOR>World Wid Web Consortium</dc:CREATOR> <dc:TITLE>W3C XML Resource</dc:TITLE> </rdf:Description> <rdf:Description about="http://www.XML.org"> <dc:CREATOR>OASIS GROUP</dc:CREATOR> <dc:TITLE>XML.org</dc:TITLE> </rdf:Description> <rdf:Description about="http://www.XML.com "> <dc:CREATOR>XML.commune</dc:CREATOR> <dc:TITLE>XML.com</dc:TITLE> </rdf:Description></rdf:RDF>
关于RDF的深入讨论,已经超出了本节的范畴,有兴趣的读者可以参考http://www.w3.org/TR/rdf-schema和http://www.w3.org/TR/REC-rdf-syntax,这两个文件是W3C定义的RDF规范。
10.2.2 频道定义格式CDF
前一小节介绍的是Netscape推出的技术,事实上,在XML的应用上,IE也不甘落后。在Internet Explorer 4.0及其以后的版本中,Microsoft推出了“频道”(Channel)的概念,用户可以通过订阅频道实现站点更新内容的自动获取。在频道定义中所使用的格式CDF(Channel Definition Fomat),也是一个XML应用。
使用过IE的人可能都知道,频道使Web站点能自动通知读者重要信息的变化,这种技术称为“Web广播”(Web Casting)或“推送”(push)。可能Microsoft早期希望将CDF发展成为一个标准,因此在CDF推出初期将其提交给了W3C,但W3C对CDF显然不够热心,自从1997年3月9日提交后,W3C一直没有正式承认接收该规范,而且估计以后也不会采取进一步的动作。因此Micosoft在以后的CDF版本更新都没有公布其完整文档。现在唯一支持CDF的浏览器就是Internet Explorer(4.0以上版本),其他的浏览器都不支持而且似乎也不准备支持CDF。
CDF文件是一个定义了读者和站点内容的连接参数的XML文件,它与站点上的HTML文件分开,但链接到某个或某几个HTML文件上。浏览器根据定义的参数决定新内容传递的方式,包括:
将频道添加到频道栏并且订户可以随时检查;
新内容通过电子邮件通知订户,订户可以随时加载频道;
浏览器定期检查站点并自动更新和下载改变的内容。
CDF文件是站点的附加物,通常将定义好的CDF文件链接在站点的主页,比如可以在主页中插入如下链接:
<A HREF="website.cdf">订阅该站点</A>
如果用户使用的是支持CDF的浏览器,可以点击这个链接订阅该频道。否则将下载这个CDF文件。
CDF实际上是Micosoft用XML定义的一个词汇表。下面是Internet Explorer自带的一个简单的CDF文件,本例并没有包括所有的CDF元素,只是希望通过这个例子说明CDF和XML的关系。
<?XML VERSION="1.0" ENCODING="gb2312"?><CHANNEL HREF="http://www.zdnet.com.cn/channel/welcome.htm"> <ABSTRACT>最丰富的电脑业界信息,成功源自您的信任。</ABSTRACT></CHANNEL>
其中第一行是XML声明。第二行是CDF文件的根元素CHANEL,它是CDF文件唯一要求的元素,根元素CHANEL必须包含一个HREF属性以指定监视修改的页面。第三行是ABSTRACT元素,其内容是描述频道的文本,该描述通常出现在频道栏的工具提示窗口。
关于CDF词汇表的其他元素,本节不再做详细介绍。一方面原因在于CDF并没有获得业界的广泛支持,另一方面在于Microsoft没有公布当前版本CDF的完整DTD。而且Microsoft提供了一个软件CDF Generator(http://msdn.microsoft.com/downloads/tools/3rdparty/423.asp),可以利用它生成自己站点的CDF文件,根本无需了解CDF的内部细节,下图是CDF Generator运行时的主界面。
500)this.width=500'>500)this.width=500" border=0>
如果你确实希望了解CDF的内部细节,可以在http://www.w3.og/TR/Note-CDFSubmit.html处获取早期的CDF定义文档,但这是一个过时的文档,与CDF的当前版本有一定差距。当前版本的CDF定义可以参见MSDN文档(Microsoft Develop Network)和Microsoft的站点(http://www.microsoft.com/)。
10.3.1 XML——电子商务的基石
简而言之,电子商务就是利用电子手段尤其是互联网进行商务活动。电子商务的出现和发展,已经并仍然在改变个人和团体的商务活动的模式。电子商务延伸了商务联系,能够极大地降低成本,加快商品和资金流通的速度,增强市场信息的可预测性和各种商务活动的可控制性。不难看出,将来能在市场中取胜的,必是能充分利用电子商务的商家。
从技术上说,电子商务是通过互联网传输和交换商务数据,并能根据商务数据进行人工或自动处理。数据的标准化在数据传输和交换过程中起着至关重要的作用,它决定了数据的语义,增强了数据的可读性和可理解性。XML的可扩展性和自相容性,使它成为数据标准化和信息交换的有力工具。
电子商务的发展,首先出现的是企业-消费者(B2C)和消费者-消费者(C2C)模式。在这些模式当中,由于数据的传输路径是Web服务器-浏览器或者浏览器-Web服务器-浏览器,数据最后发布在浏览器上,供人们阅读和理解,侧重于信息对人的可理解性,因此数据表现被提到一个重要的地位,数据的结构化显得较为次要一些,侧重于数据表现的HTML基本上能够满足这些应用。但是随着电子商务的发展,HTML在B2C和C2C这两种模式中已经开始显得力不从心。
首先,我们知道,从数据库提取信息生成HTML页面后,信息的语义、结构已消失殆尽,如果建立在其基础上的进一步应用需要用到这种结构化信息,开发就非常困难。例如现在电子商务中时兴的比较购物,它需要在各个电子商务网站的页面中抓取商品的信息,将同一品名的商品放在一起比较。如果各个电子商务网站都按照自己的方式组织页面,对于从事比较购物的网站,难度就可想而知。
相反,XML可以保持数据的结构。现有的主流关系数据库如SQL Server 7.0、Oracle 8i和Informix等都提供了对XML的支持,可以直接保存或生成XML文件。再为其配上相应的XSL样式文件,就可以将数据直接显示在浏览器上。而且,XML使得数据在数据库之间交换显得非常容易,有人预测,XML将是数据在数据库之间交换时的标准方式。
其次,现在很多电子商务网站都提供个性化服务,例如Web服务器可以根据客户的定制生成和传输不同的页面。事实上,不同显示效果的页面之后的数据是相同的,因而一个自然的想法就是将数据及其表现分离开来。显然,XML在这方面比HTML要擅长得多。利用XSL,无须改变数据内容本身,只传送样式文件就可以实现页面的重新显示。
随着企业-企业电子商务(B2B)尤其是供应链管理的出现,数据的传输路径转变为Web服务器-Web服务器,数据的传输过程不需要浏览器。Web服务器不仅需要接收对方传送的数据,而且还应该能够理解数据的含义,并能根据数据作出相应的处理。两个Web服务器直接进行通信,无需人工干预,在这种情况下,数据的结构化和标准化就显得至关重要。
在电子商务的发展过程中,传统的EDI作为数据交换的方式,对数据的标准化起到了重要的作用。EDI将商业文件如订单、发票、货运单、报关单等按统一的标准,编制成计算机能够识别和处理的数据格式,在计算机之间进行传输。不过,传统EDI存在着巨大的局限性:
首先,EDI需要建设专用网络,开发专用程序,投入巨大,因此它的应用往往仅局限于少数大银行和大企业。
其次,EDI数据侧重于信息对机器的可读性,人工阅读EDI数据简直就是灾难。
再次,所有EDI数据都不能通过Web来进行数据搜索和定位,也无法在Web上显示,而这正是那些现代INTERNET小型企业与一些不固定商业伙伴进行小型交易的最基本要求。
最后,传统EDI经过几十年的发展,EDI信息标准仍然得不到统一,没有形成一个全球通用的标准。现在国际上存在两大标准体系:一个是流行于欧亚由联合国欧洲经济委员会(UN/ECE)制订的UN/EDIFACT;另一个是流行于北美由美国国家标准化委员会(ANSI)制订的ANSI X1.2标准。此外,各行业也有自己的行业标准,如:CIDX(化工)、VICX(百货)、TDCC(运输业)等。
XML自从出现以来,以其可扩展性、自描述性、自相容性等优点,被誉为信息标准化过程的有力工具,基于XML的标准将成为以后信息标准的主流。由于XML提供了一个四海通行的方法来传送自我描述的资料,因此它是将文件和结构化资料一起移动和沟通的最佳机制。不过,为了保护企业在EDI上的巨大投资,传统的EDI也没有被彻底废除,而是与XML相结合,形成了XML-EDI。
XML技术对电子商务有重大影响,XML的人机互动式架构提供了使用者与电脑之间的互动交流,利用其可延伸性及自我描述特性,电子通讯文件可以在企业间的应用程式中自动传输、处理及储存,不同厂商的电子商品目录可以在同一个使用者界面同时呈现,资讯的搜寻变得更为精确快速,不同系统间可以流畅地互通,不同网站之间的资料得以动态共享,强化了使用者与系统之间的聚合性。
据Gartner的估计,三年以后到2003年,企业―企业的网上数据流量,将10倍于企业―个人的网上数据流量,而其中80%的数据,将采用XML格式。由于XML为信息的自动交换提供了必要的技术支持,因此有人提出“eXe”将成为最基本的连接模式,其中的“e”是指企业(enterprise),而“X”就是XML。
10.3.2 电子商务中的XML“构件”
自从XML出现以来,基于XML的应用取得了长足的发展,随着客户化工具的出现,浏览器对XML支持的增强,可以说基于XML的电子商务已经基本准备就绪。
成熟的标准体系
自从XML1.0规范成为正式标准以来,XML的整个标准体系正在逐步成熟。虽然还有许多XML相关的规范正在制订之中,但对电子商务的应用而言,也许只需要XML和XSLT就足够了。电子商务的方案提供商和组织利用XML定义标准和词汇表,网站的建设者则利用XSLT将XML文件转化为HTML文件或其他的XML文件,并显示在浏览器或其他显示设备中。
现在已经有很多企业和组织开始利用XML定义标准和词汇表,形成了一些标准,而且每个标准都有一些工具和应用厂商支持,为从事电子商务的人们提供了许多选择。不过,也许对于定义这些新标准的人而言,现有的标准体系还存在一个“洞”需要填充,这就是schema规范。在schema成为正式标准之前,DTD仍然是定义标准和词汇表时的唯一选择。
客户化工具
自从XML出现以来,人们抱怨最多的也许就是客户化工具的缺乏,尤其是可视化工具。人们希望能够象利用现有的HTML编辑器生成HTML文件一样,能够有可视化的XML编辑器能够直接生成XML文件和XSL文件,无需详细了解XML内部的机制。随着时间的推移,可视化的XML工具已经开始出现,比如SoftQuad的XmetaL和eXcelon的Object Design都提供了可视化编辑XML的能力。除此之外,软件提供商还为XML提供了各式各样的小工具,包括XML服务器,schema设计工具等等。
XML的客户化工具为XML使用者提供了巨大的支持,他们可以无需了解XML的内部机制,直接使用XML,使得XML的广泛应用成为可能。
浏览器支持
也许人们会担心浏览器对XML的支持情况。事实上,当前的主流浏览器中,IE5.0已经有了一个内置的XML分析器和XSL转换器,Netscape对XML的支持落在了后面,仅限于XML分析。随着时间的推移,相信浏览器对XML的支持将会越来越强。
但是,即使没有本地的浏览器支持,XML的应用仍然不成问题。对于大多数应用而言,数据可以放在数据库中,需要时将数据取出来形成XML文件,然后加上XSL文件,在服务器端生成HTML文件,发送到浏览器上。甚至于可以在服务器端判断客户端的显示设备,根据显示设备应用不同的样式单,生成显示设备能够支持的页面发送过去。至于XML文件的生成,如果数据库支持XML,可以从数据库直接存取XML文件;如果数据库不支持XML,工作可能要多一些,系统需要把查询结果(一般而言是一个二维表)转化为XML。
10.3.3 基于XML的电子商务标准
当前,基于XML的电子商务标准比较多,一般也比较复杂。在5.3.5小节中我们简要地介绍了其中的几个,本节仍不打算深入标准的内部去探讨其实现,任何一个标准的深入介绍都足以形成一本专著,我们只帮助大家归纳一下这些主要标准的体系构架。
当前的电子商务标准可以分为以下三类:
体系结构相关的标准:这类标准关心的是整个电子商务的体系结构,包括通用XML消息的标准,schema库等;
功能相关的标准:这类标准关心供应链中各个环节的数据交换;
业界相关的标准:这类标准与所涉及的行业相关,是某个行业内部的数据交换标准。
体系结构相关的标准
这类标准主要包括几个正在制定和已经完成的体系。
BizTalkBizTalk是Microsoft发起的电子商务的schema库,配合的产品有Microsoft的BizTalk服务器。在3.2.3节中我们曾给出了关于它的详细介绍。
ebXMLebXML是联合国UN/CEFACT小组和OASIS共同发起的计划,要在15-18个月内制定出基于XML的全球范围的电子商务数据交换的标准。ebXML涉及的方面比较广,包括:
体系结构
核心部件
消息的封装和传输
注册和保存schema的库
业务处理模式
这个标准正在制定中,期望会是一个比较全面的标准。它的Requirment、消息封装和传输已经有草案。
eCoeCo是CommerceNet 1998年就开始的一个计划,CommerceNet是由银行、通讯公司、增值网提供商、ISP、在线服务,软件和服务公司和最终用户等组成的协会,现有成员600多家公司和组织,其目的是促进B2B电子商务的发展。eCo的体系结构有点儿象网络的分层结构,它分为七层:
网络(networks)
市场(markets)
业务(businesses)
服务(services)
交互作用(interactions)
文档(documents)
信息项(information items)
每一层都有类型注册,接口是向外发布的,文档要包裹一层(document wrapper),发布的接口必须有一些必要的方法进行查询,查询返回的文档是特定的DTD的xml文档,每层的方法和返回的文档的结构都在规范中有描述。后两层eCo推荐使用simple_EDI和xCBL这两种XML的交换格式。
RosettaNet的PIP(Partner Interface Process)和RosettaNet应用网络标准。RosettaNet由诸多IT业的巨子组成的一个标准化组织,目前会员包括象Cisco Systems、Compaq、GE、HP、IBM、Intel、Microsoft、NEC、Oracle等60个企业,目的是制定一个适用于IT产品,通过WEB技术在网络上实时进行企业级交易的电子商务标准。这个标准也是分层结构,包括:
动作(Action)
事务(Transaction)
处理(Process)
服务(Sservices)
消息处理(Message Handling)
代理(Agent)
传输(Transfer)
安全(Security)
每一层的消息都会加一些信息上去,如header,它的消息都是http的MIME消息,其中的XML正文是内容。这个标准比较注重事务处理和安全性。RosettaNet用guideline定义和约束供应链中的消息。guideline其实就是消息的DTD及其说明,但其描述能力比DTD强。
功能相关的标准
这类标准关心电子商务的具体环节的数据交换。XML/EDI就是这一类的标准,另外,我们前面讲到的xCBL、tpaML、cXML、WIDL(Web界面定义语言)和OTP(开放贸易协议)也都属于此类。
业界相关的标准
这类标准主要涉及一个行业,定义行业内部的词汇表。由于它们涉及的是特定的行业,因此数量非常的多,而且随着时间的推移,这类标准将更多。这里给出两个典型的例子:
开放金融交换格式(Open Financial Exchange Format,简写为OFX),是一种用于描述保存在个人财务软件中的金融数据的标准。
个性化印刷置标语言(Personalized Print Markup Language,简写为PPML),是PODi组织于2000年2月发布的个性化印刷格式语言,并已开发出相应的产品,该标准用于按需印刷(ondemand-print)。
10.4.1 网络出版
随着网络的飞速发展,互联网已经成为继报刊、电台、电视台之后的一种新型媒体。在1998年5月举行的联合国新闻委员会年会上,互联网被正式冠以“第四媒体”的称号。
相对于传统媒体,数字化的第四媒体具有难以比拟的优点。它具有信息的综合性和丰富性、充分的互动性与开放性、信息传递的快捷与超时空以及信息的大容量和灵活性。因此,互联网出现以来,就受到一些传统媒体如美联社、路透社、CNN等的关注,它们迅速登陆互联网,利用互联网提供新闻和经济信息服务。现在的网络媒体基本上可以划分为以下几类:传统媒体上网、传统媒体与其他行业共建网站、无传统媒体依托的网络媒体。也正是由于传统媒体和网络媒体的广泛合作,使得跨媒体出版愈来愈成为一种趋势。
网络出版自从出现以来,用于信息发布的主要是HTML技术,但是这种方式在跨媒体出版时遇到了极大的困难。比如现在的报纸大多需要同时在网上发布和印刷发行,报社不得不需要两组人力,同时进行印刷组版和网络组版。下图示意了大多数报纸的现行作业:
500)this.width=500'>500)this.width=500" border=0>
如果能够将筛选编辑过程合并,然后分别进行组版,就可以节省人力,从而达到降低成本的目的,如下图:
500)this.width=500'>500)this.width=500" border=0>
另外,随着后PC时代的到来,各种如信息家电、手机、PDA等新的上网设备层出不穷。单独的HTML已经不能满足网络出版的需求,显示语言也各不相同。如果根据显示设备的要求制作多个版本会造成人力物力的巨大浪费,系统需要一种制作一次出版多次的技术。XML的内容与显示相分离的特点,使得它在跨媒体出版上有着得天独厚的优势,如图所示:
500)this.width=500'>500)this.width=500" border=0>
10.4.2 电子书与OEB
随着互联网技术的发展,人们希望能够在线阅读书或报纸,于是乎电子书和电子报纸应运而生。
电子书和电子报纸分别是eBook与eNewspaper的中文译名,是互联网发展的又一新兴产物。它们分别采用数据化文档的形式组织书和报纸的内容,读者可通过特制的阅读工具来阅读其中的内容。
目前已经上市的eBook阅读器有四种,它们是SoftBook公司推出的SoftBook、 NuvoMedia推出的RocketBook、GlassBook推出的GlassBook和EveryBook推出的EB Dedicated Reader。其外观分别如图所示:
500)this.width=500'>500)this.width=500" border=0>SoftBook
500)this.width=500'>500)this.width=500" border=0>RocketBook
500)this.width=500'>500)this.width=500" border=0>打开的EveryBook
500)this.width=500'>500)this.width=500" border=0>关闭的EveryBook
500)this.width=500'>500)this.width=500" border=0>GlassBook
这些电子书阅读器都可以通过连线与计算机相连,然后下载网上书店的书籍,并具有加书签、标注和书架管理等功能。可以想象,电子书的普及将改变目前传统出版的工作流程,对面向以纸介质为主要承印物的传统的出版及印刷行业会造成较大的冲击。
随着电子书的出现,另一种新媒介——电子报纸也呼之欲出。新型的电子报纸既不同于传统的纸介质报纸,也不同于电子书阅读器所采用的LCD液晶显示器,它是用全新的材料制作而成。“纸”的材料采用一种类似于玻璃纤维的物理材料,而“墨”则是一种新研制的电子墨,如下图所示。目前IBM、施乐、eInk等公司正在致力于eNewsPaper的阅读器及电子墨的研究,并已有原型产品诞生。
500)this.width=500'>500)this.width=500" border=0>
有了电子书和电子报,可大大减少纸张的消耗,节约资源。另外,在办公、出游时携带薄薄的一本电子书,相当于随身携带一个小型的图书馆,信息、资料一应俱全,真是方便之至。
eBook近两年来发展很快,受到了包括作家、出版商、书刊销售商、软件开发公司、硬件制造厂商的普遍关注,并成立了一个由四十多个组织组成的Open eBook Authoring Group(以下简称为OEB组织)。参加的组织中有eBook先锋Nuvomedia Inc.、SoftBook Inc.、GlassBook Inc、Libius Inc.、EveryBook Inc.,以及Microsoft、Adobe、Motorola、Nokia等一大批软件及硬件厂商,还包括了一些著名的印刷出版商。经过OEB组织的努力,于1999年9月21日完成了OEB1.0标准的制定,从此eBook有了统一的文档数据格式标准。
OEB1.0是“Open eBook Structure Specification 1.0”的缩写,OEB文档基于HTML和XML语言,是标准的XML文档。它的出台,从根本上统一了eBook的文档数据存储方式,保证了消费者购买任何一个品牌的阅读机都可正确阅读eBook文档,使得消费者不用承担由于购买阅读机而带来的格式兼容方面的风险,奠定了建立eBook市场的坚实基础。在5.3.7节中,我们给出了对于OEB的简要介绍。
随着Internet应用的普及,eBook和eNewsPaper将得到广泛的应用。前面所介绍的几种电子书的阅读机厂家都拥有自己的网上书店,开数字化书刊出版及发行的先河,必将带动整个行业进一步向数字化发展。进入到21世纪以后,中国的网上书店也如雨后春笋,显示出勃勃生机与发展实力,目前已有企业在进行eBook的研究与开发,台湾也有厂商投资生产eBook阅读机,相信不久将会看到中文eBook阅读机的面世。这是一个刚刚启动的市场,也是一个极有潜力的市场。它将极大地促进网络出版的发展,它的出现,标志着印刷出版业进入到了一个崭新的时代。
10.5 XML与移动通信
1990年以来,互联网和移动通信的发展极大地改变了人们的生活、学习和工作。人们不仅仅将互联网视为一种手段或工具,更将它视为一种生活方式,他们要求能够随时随地与互联网保持连接,并且能够在移动中获取信息。但是由于互联网需要与固定的有线网相连,无法满足人们的这个需要。移动电话生产商和电信运营商顺应人们需求,利用无线上网技术,将互联网与无线网结合起来。
随着移动电话与互联网结合,无线上网的趋势正在形成,新的移动通信标准使得移动终端的带宽可以达到最高2Mbps。有人预言,随着无线带宽的增加和无线上网技术的迅速发展,.move将替代.com成为新的潮流。一些网络先锋将电子商务应用与无线上网结合起来,开始展开移动电子商务的业务。在这过程当中,WAP(Wireless Application Protocol)起着决定性的作用。
WAP的提出是为了满足人们在移动中连接互联网的需要,相对互联网而言,无线数据网络的带宽窄,连接的稳定性差,手机的CPU功率相对于PC会更小,内存和显示器更小,输入设备更为简单等等。由于无线网络和移动设备的这些特点,使得WAP规范无法直接利用互联网的技术和标准,而必须重新定义符合移动设备和无线网络特点的规范。1997年6月,Phone.com联合了Nokia、Ericsson、Motorola合作建立了WAP论坛,旨在利用已有的互联网技术和标准,为移动设备连接互联网建立全球性的统一规范。它们的工作很快有了成果,在1998年5月,推出了WAP规范(Specification)1.0版,并于1999年11月发布最新的1.2版。
WAP规范1.2版包括了31个文件,它定义了一种无线应用程序的编程模型和语言,并且定义了一套用来实现无线互联网访问的规范。其中主要定义了以下几种组件:
WAP编程模型
这个模型在很大程度上利用了现有的WWW编程模型,这样可以给应用开发人员带来许多好处,可以最大限度地利用他们原来掌握的经验和各种开发工具。WAP编程模型还针对无线环境的通信特点对原有的WWW编程模型进行了优化和扩展,见图示:
500)this.width=500'>500)this.width=500" border=0>
无线置标语言(WML)
WML是利用XML1.0标准定义的面向显示的置标语言,特别适合于在性能方面严重受限的手持设备。WML和WML Script并不要求用户使用传统的PC机键盘或鼠标进行输入,而且它设计时就考虑到了手机的屏幕尺寸限制。使用WAP网关,所有的WML内容都可以通过Internet使用HTTP 1.1请求进行访问,因此传统的Web服务器、工具和技术可以继续使用。在5.3.6节中对WML给予了详细的描述。
微浏览器规范
这个规范与标准的Web浏览器规范类似,它定义了一个适合于手持设备的功能强大的用户接口模型。这个规范定义手机如何解释WML和WMLScript并且显示给用户。
用户通过上移键和下移键而不是鼠标在各个卡之间来回进行导航。为了保持与标准浏览器的一致,微浏览器还提供了各种导航功能如Back、Home、书签等。微浏览器允许具有较大屏幕和更多特性的设备自动显示更多的内容,就像传统的浏览器当浏览窗口扩大时能显示更多的信息一样。
轻量级协议栈
这个协议栈将无线手机访问Internet的带宽需求降到最低,保证了各种无线网络都可以使用WAP规范。通过使用WAP协议栈可以节省大量的无线带宽。要完成同样一个访问操作,使用WAP协议栈涉及到的包数量不到使用全标准的HTTP/TCP/IP协议栈的一半,这对于带宽严重受限的无线网络来讲无疑是十分有用的。
无线电话应用(WTA)框架
它允许无线手机访问各种电话功能如呼叫控制和来自WML Script applet中的信息。这允许商家开发各种电话应用并且将其集成到WML/WML Script服务中。如呼叫转移这样的服务,商家可以提供一个用户接口,提醒用户是准备接受呼叫、转移到他处还是将其转发成一个语音邮件。
WAP网关
WAP规范使用标准的Web代理技术将无线网络与Web连接起来。通过将处理功能集中在WAP网关中,WAP结构大大减少了手机上的操作负载,因此为手机实现价廉物美提供了基础。如,一个WAP网关一般可以使用所有的DNS服务来解析URL中使用的域名,因此就不再需要手机来完成这个计算任务。还可以利用WAP网关来为用户提供各种服务并且可以帮助网络服务商防止诈骗和服务利用, 见下图。
500)this.width=500'>500)this.width=500" border=0>
一个WAP网关一般包括以下功能:
协议网关:协议网关将来自WAP协议栈的请求翻译到WWW协议栈(HTTP和TCP/IP)中;
内容编码器和解码器:内容编码器将Web内容翻译成紧密编码的格式,以减少通过无线数据网络传输的数据包的大小和数量。
下面,我们再来详细讲一讲所谓的WAP协议栈。如下图所示,WAP的协议栈采用层次化设计,这为应用系统的开发提供了一种可伸缩和扩展的环境。每层协议栈均定义有接口,可被上一层协议所使用,亦可被其他的服务或应用程序直接应用。在设计中,WAP充分借鉴了Internet的协议栈思想,并加以修改和简化,使之可以有效应用于无线应用环境。
500)this.width=500'>500)this.width=500" border=0>
WAE层WAE(Wireless Application Enviroment,无线应用环境)是一个结合了WWW和移动通信技术的常用编程环境。WAE的主要目的,就是要建立一个可互操作的环境,以便在用户终端部分和服务供应商部分开发程序或提供服务,而不去考虑各种无线网络平台的不同。WAE包括一个微浏览器环境,以及:
WML(Wireless Markup Language)。这是WAP制定的基于XML的置标语言;
WMLScript。这是对WML语言的补充,与JavaScript很相似;
WTA/WTAI(Wireless Telephony Application)。这是一个通信服务和编程接口;
内容格式。这是WAP定义的一组数据格式,其中包括图片,电话簿,日历信息等等。
WSP层WSP(Wireless Session Protocol,无线会话协议)是WAP的应用程序层,用于对两种会话服务提供统一的接口:一种是建立在事务层协议WTP基础上的面向连接的(connection-oriented)服务,另一种是建立在安全或非安全的数据报文(datagram)服务(WDP)基础上的无连接服务。
WTP层WTP(Wireless Transaction Protocol,无线事务协议)运行于数据报文服务之上,并提供部分的面向事务(transaction-oriented)协议(因为移动数字终端属于“瘦”客户端,及它无法支持大数据量的事务服务)。
WTLS层WTLS(Wireless Transport Layer Security,无线传输层安全)是WAP在另一个工业标准TLS(Transport Layer Secureity,传输层安全)协议的基础上制定的一个安全协议。其制定的目的就是在窄带宽的通讯频道上安全地使用WAP的传输协议。
WDP层WDP(Wireless Datagram Protocol,无线数据报文协议)是WAP的传输协议。作为一种通用的传输服务,WDP为其上的其他WAP协议提供统一的服务,并向其下的各种承载器(Bearer)进行透明的通讯。正是因为这种透明性,WDP之上的安全、会话和应用层可以与WAP结构中最下层的各种无线网络互相独立。
承载器(Bearer)层各种承载器所能够提供的服务是不一样的,根据数字终端的接受/发送能力,误码率,和延迟时间的不同,承载器所能够提供的服务质量也会不一样。WAP协议可以容忍这些差异,或者可以对这些差异进行补偿,从而达到对上层协议透明。
其他服务和应用通过WAP定义的一系列接口,外部服务或程序可以访问WAP协议堆栈的各个层面。
总之,WAP创造了一种商业机会,它使得现有的业务或新的业务可以每时每刻被用户访问,它可以发掘出各种崭新的、甚至目前无法想像的增值业务,这为电信业务运营商提供了创造丰厚利润的宝贵商业机会。
WAP最有潜力的应用是与电子商务结合,实现移动中的电子商务。例如随时参与证券交易,使用移动网络银行业务,在移动中实现网上购物。现在您随身可能携带钱包、电话本、信用卡、手机等,在将来,可能您只需携带一部具有WAP功能的移动电话,就可以完成打电话、付账、买车票、管理个人工作安排等一系列事情。
但是,行业内部也有不同的声音。以通信市场调查咨询而闻名的美国Ovum公司在其2000年5月23日发表的报告“WAP市场策略”(WAP Market Strategies)中警告:“采用WAP技术的第一代手机已投放市场,但这种技术未必就是最好的。想抢搭WAP头班车的笠当匦肭宄厝鲜兜絎AP不是唯一可以利用的、最好的技术。”Ovum公司提醒那些参与移动因特网服务的企业在制定战略时,需要考虑到WAP以外的技术,诸如以XML为基础的技术等。
10.6 XML的发展前景
XML自推出以来,尤其是在1998年2月成为W3C推荐标准以来,受到了广泛的支持。各大软件厂商如IBM、Microsoft、Oracle、Sun等都积极支持并参与XML的研究和产品化工作,先后推出了支持XML的产品或者将改造原有的产品以支持XML,W3C也一直致力于完善XML的整个理论体系。
XML虽然获得了极大的支持,但是它还有很长的路要走。首先,XML的规则只是迈出了第一步,还有许多技术细节没有解决。其次,现在虽然出现了一些XML工具和应用,但是其市场反应还有待进一步观察。另外如何让更多的人迅速学会使用XML,并利用它进行开发,进而促进XML的应用也是一个问题。因此XML的出现和迅猛发展并不意味着HTML即将退出互联网舞台,由于HTML的易学易用和非常多的工具支持,HTML将在较长的时间里继续在Web舞台上充当主角。但是如果用户想超越HTML的范围,XML将是最佳的选择。
另外,由于XML是用于定义语言的元语言,任何个人、公司和组织都可以利用它来定义自己的置标语言(通过DTD或schema表示),这虽然是XML的魅力和灵活性之所在,但同时也是XML的最大问题之所在。如果每个人、公司和组织都定义了自己的置标语言,它们之间的通信就会出现困难。因此在一些领域先后出现了一些标准化组织,它们的任务就是规范本领域的置标语言,形成统一的标准,使得在本领域内的通讯成为可能。但在标准推出并得到广泛认可之前,各自为政的局面将继续下去。更糟糕的是,由于对应用的理解不一致和商业利益等原因,同一个领域也许还有多个标准化组织,它们形成的置标语言并不完全兼容,使得采取不同标准的计算机仍然难以通信。
无论如何,XML的出现使互联网跨入了一个新的阶段,它将成为因特网领域中一个重要的开发平台。XML的诞生已经而且将继续促使全新种类的应用程序的产生,而这些新的应用程序又将需要新的软件和硬件工具。可以预测,无论是在软件还是硬件上,XML都将开辟一系列的新市场,促成互联网上新的革命。 |
|
|