新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 中文XML论坛 - 专业的XML技术讨论区W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → Think XML:从书本学习 XML Topic Maps 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 3938 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: Think XML:从书本学习 XML Topic Maps 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18407
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 Think XML:从书本学习 XML Topic Maps

    Think XML:从书本学习 XML Topic Maps  英文原文   
    初窥另一种 Semantic Web 格式
    级别:中级

    Uche Ogbuji (uche.ogbuji@fourthought.com)
    首席顾问,Fourthought, Inc.
    2003 年 11 月

    Topic Map 提供了一种用于组织信息的系统,XML Topic Maps 使这种系统进入了 XML 的世界中。在本文中,Uche Ogbuji 讨论了 XML Topic Maps,并通过评论有关该主题的关键著作,把这种技术介绍给大家。
    Semantic Web 技术用于概念的形式化描述与分类。这些技术试图降低由于概念不匹配而给信息系统互联带来的难度。您可以想像得出,在这样一个主观而雄心勃勃的事业当中,可能适应它的方法和技术很多。Topic Maps(主题地图)便是其中的一组技术。

    这个专栏直到现在都还没有提到 Topic Maps 技术,这是我的失职。主要的问题在于,我还没有完全理解这些技术。最近,我收到一本书,名为 XML Topic Maps: Creating and Using Topic Maps for the Web,是 Jack Park 和 Sam Hunting 编著的,书中有些章节是由 Topic Maps 世界中的专家们编写的。对我而言,这本书是个很好的机会,我可以通过它提高我对 Topic Maps 的理解,同时,我也打算把对这本书的评论与相关技术的介绍结合起来。

    很好的起点
    Jack Park 用精简的三段论形式为这本书撰写了绪论,不过里面的内容似乎有些离题,也相当混乱。我原本希望绪论能用清晰的语言,为处于启蒙阶段的人勾勒出 Topic Maps 技术的基本概念,并用这些基本概念向读者清晰地描述出书中的其余内容。在第 2 章当中,Michel Biezunski 的确很好地介绍了 Topic Maps 的范例,但是却假设读者已经具备了相关的背景知识,了解了引发 Topic Maps 技术的一般性问题。通过阅读这篇专栏文章,读者们就能获得这些背景知识,也将会发现这一章是 Topic Maps 技术的优秀初级读本。

    Topic Maps 最初是 SGML 社团中的一群人开发的,用来实现索引和辞典构建过程的形式化。这些早期努力的结果就是 ISO/IEC 13250,这项标准定义出了 Topic Maps 的完整模型。它早于 XML 出现,但是 XML 与 Web 的迅速发展导致出现了 XML Topic Maps(XTM)。XTM 的基础是 ISO/IEC 13250 模型,但是定义的是一种 XML 语法,并限制它自己只能通过 URI 实现。事实上,XTM 被定义为一种 XLink 应用程序,其中的链接专门表示 Topic Maps 模型中的语义。

    Topic(主题)是 Topic Maps 中的基本构成单元——Topic 就是某个概念的计算机表述。通过主题表述的概念被形式化之后就是 subject(标题)。Topic Maps 需要解决的一个基本问题就是如何形式化抽象题目及其主题表述之间的差异。主题之间通过 associations (关联)相互联系。主题还具有一组位置(location),可以按照某种特定的形式从这些位置上访问该主题。这些位置名叫 topic occurrences(主题出现)。主题可以有 name(名称),也可以没有名称,或者有多个名称。Topic Maps 还可以将 base name(基本名称)的两个变体:display name(显示名称)和 sort key(排序键值)构建到核心模型中,这样就能按照辞典顺序显示出模型的根。

    当我和别人讨论 XML 的时候,我说的实际上是一种抽象。这种抽象很容易就可以成为 Topic Maps 的一个标题。如果我打算将这个概念形式化,我可以画一幅图,图中有一个主题,代表 XML。该主题的一次出现是在 W3C 网站上 HTML 格式的规范。另一次是该规范的 PDF 形式的下载位置。与这个主题有关联的其他主题的标题可以是 SGML、XSLT、HTML 或 Unicode。这个主题的基本名称是 XML,但是人们也可以选择“XML (Extensible Markup Language)”作为它的显示名称,这样就能通过工具浏览 Topic Maps,而不用再解释这个缩写是什么意思。

    Topic Maps 的另一个基本概念是 scope(范围)。范围是一个特殊的主题,它定义了一组或一定界限内的相关主题。IBM developerWorks 的作者们可以创建一个范围,其中的主题代表所有在他们的文章中涉及到的概念。范围的作用与命名空间类似:基本名称在某个范围内应该是惟一的,如果两个主题具有相同的基本名称,而且在同一个范围内,它们两者就可以合并(merged)。举个例子来说,假设我已经创建了一幅表示 XML 的主题地图,而另一名 developerWorks 作者可能也在做相同的事情,且并不知道我已经做好了。由于我们正在维护的范围是统一的,因此这两个基本名称都是“XML”的主题就可以合并。Topic Maps 为合并、出现、关联等等定义了非常详细的规则。

    这本书的第 3 章由 Steven Newcomb 编写,他用独到的眼光评论了 Topic Maps 的历史、出现的动机以及文化。这一章在很多方面都和绪论有重复,但是里面的表述却更加连贯。随后,Sam Hunting 在第 4 章中简明扼要地讲述了从 ISO 到基层人员为 Topic Maps 的标准化所做的努力。此后,这本书中就一直是中级和高级主题不断穿插在一起的样子。读者如果想从实用的角度很好地理解 Topic Maps,我推荐按照下面的顺序阅读本书:

    第 2 章,“Introduction to the Topic Maps Paradigm”(Michel Biezunski)。
    第 6 章,“How to Start Topic Mapping Right Away with the XTM Specification”(Sam Hunting)。
    第 12 章,“Topic Maps and RDF”(Eric Freese)——读过本专栏的读者应该都对 RDF 比较熟悉了吧。
    第 10 章,“Open Source Topic Map Software”(Eric Freese,Kal Ahmed,Jack Park,Sam Hunting)——如果您喜欢 Java 技术,就读这一章,否则得读第 9 章,“Creating and Maintaining Enterprise Web Sites with Topic Maps and XSLT”(Nikita Ogievetsky)。
    第 8 章,“Topic Maps in the Life Sciences”(John Park and Nefer Park)—— 一个全面的示例。
    第 5 章,“Topic Maps from Representation to Identity: Conversation, Names, and Published Subject Indicators”(Bernard Vatant)。
    第 3 章,“A Perspective on the Quest for Global Knowledge Interchange”(Steven Newcomb)。
    在您阅读本书,以及今后深入研究的过程中,您肯定会经常参考最后一章之后列出的词汇表。这个词汇表对于 XTM 规范 1.3 节中那个袖珍的词汇表是很好的补充。上面列出的这些章节已经足够您熟悉 Topic Maps 了,在实践中也能给您足够的帮助。其余的章节我认为都是比较高级的主题,您可以自己研究。

    用标记表示主题地图
    Topic Maps 上的很多实际工作都是构建在 XML 工具之上的,其中包括 XSLT 和 Java API。清单 1 是从 XTM 规范中所带的例子里截取的一小段代码。您可以看到 XML 的语法有多么清晰:

    清单 1: 莎士比亚及其著作的 Topic Maps 节选

    <!-- A topic representing the Elizabethan playwright
         William Shakespeare.  No occurrences because you cannot download
         a person -->

    <topic id="shakespeare">
      <baseName>
        <baseNameString>William Shakespeare</baseNameString>
      </baseName>
    </topic>

    <!-- A topic representing the play "Hamlet" -->

    <topic id="hamlet">
      <instanceOf><topicRef xlink:href="#play"/></instanceOf>
      <baseName>
        <baseNameString>Hamlet, Prince of Denmark</baseNameString>
      </baseName>

    <!-- An occurrence given by Project Gutenberg's plain text download
         of the Hamlet -->

      <occurrence>
        <instanceOf>
          <topicRef xlink:href="#plain-text-format"/>
        </instanceOf>
        <resourceRef
    xlink:href="ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws2610.txt"/>
      </occurrence>
    </topic>

    <!-- An association representing an authorship relationship -->

    <topic id="written-by">
      <baseName>
        <baseNameString>written by</baseNameString>
      </baseName>
    </topic>

    <!-- Used here to associate Shakespeare and the play Hamlet -->

    <association>
      <instanceOf><topicRef xlink:href="#written-by"/></instanceOf>
      <member>
        <roleSpec><topicRef xlink:href="#author"/></roleSpec>
        <topicRef xlink:href="#shakespeare"/>
      </member>
      <member>
        <roleSpec><topicRef xlink:href="#work"/></roleSpec>
        <topicRef xlink:href="#hamlet"/>
      </member>
    </association>

    普通的 XLinke 处理器就可以访问这段文档,您也可以使用特定的 Topic Maps 工具。它和一般的 XML 文档一样冗长,但是结构性非常好。

    结束语
    XML Topic Maps 一书中有很多好材料,不过组织得相当不好。这本书读起来就像是一些介绍性的文章和 Topic Maps 会议论文集的拼盘。我已经按照我的感觉为初学者推荐了一个 阅读顺序。我想,如果把这本书分成两部分可能会更有帮助。第一部分包含所有介绍性章节,还有一些章节来探讨理论与设计、介绍 Topic Maps 的文化与社团,以及一些编程技巧。相关领域内的进展将有助于人们找到更新鲜更有趣的话题。

    Topic Maps 是非常有意思的技术。它们为 Semantic Web 领域带来了高度的精确性。然而,获得这么高的精确性是要付出代价的,规范中定义的名词和细节变幻莫测,令人眼花缭乱,这样的模型理解起来非常困难。最近有很多人在讨论将 Topic Maps 与其他相关技术,如 RDF 互通起来的办法。这项工作的意义十分重大,因为 RDF 可能从 Topic Maps 的精确性中受益,而 Topic Maps 也将获益于 RDF 的简单与直接。至少有一点可以确定,我会及时在这个专栏中与您分享这项工作最新的进展。

    参考资料

    请在讨论论坛上参与本文的讨论。(您也可以单击文章顶部或底部的讨论来访问论坛。)


    请阅读 Jack Park 和 Sam Hunting 编著的 XML Topic Maps: Creating and Using Topic Maps for the Web 一书(Addison-Wesley,2002 年)和 Topic Maps 社团领军人物的最新进展。


    TopicMaps.org 上有大量关于 XTM 的介绍性材料及相关资源,还有 官方规范。


    Topicmaps.net 上有关于更一般的 Topic Maps 模型的讨论。Topic Maps 领域的软件提供商也建立了一个社区网站 topicmap.com。


    请您阅读 Lars Marius Garshol 关于这一主题的著名介绍性文章:“What Are Topic Maps?”,还有他坚定的追随者 Steve Pepper 的“The TAO of Topic Maps”。


    学习 XLink:Fabio Arciniegas 的 What is XLink? 虽然过时了,但依然是这项技术最好的介绍。读完之后再看看 developerWorks 上 Kevin Williams 的 XML for Data column on XLink(2001 年)。


    请到 developerWorks XML 专区 上查找更多的 XML 资料,还可以找到 Think XML 专栏 以前的文章。


    IBM 的 DB2 数据库不仅支持关系数据库存储,也提供与 XML 有关的工具,比如可作为 XML 与关系系统之间桥梁的 DB2 XML Extender。要学习有关 DB2 的更多知识,请访问 DB2 开发者园地。


    请了解如何成为一名 IBM 认证的 XML 及相关技术的开发人员。


    关于作者
    Uche Ogbuji 是 Fourthought Inc. 的顾问和共同创始人,该公司是专为企业知识管理提供 XML 解决方案的软件供应商和咨询公司。Fourthought 开发了 4Suite,它是一个用于 XML、RDF 和知识管理应用程序的开放源码平台。Ogbuji 先生是一位出生于尼日利亚的计算机工程师和作家,他现在美国科罗拉多州博耳德(Boulder)生活和工作。可以通过 uche.ogbuji@fourthought.com 与 Ogbuji 先生联系。


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2003/11/18 12:40:00
     
     萧霄 帅哥哟,离线,有人找我吗?
      
      
      等级:大二(研究C++)
      文章:42
      积分:253
      门派:XML.ORG.CN
      注册:2004/10/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给萧霄发送一个短消息 把萧霄加入好友 查看萧霄的个人资料 搜索萧霄在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看萧霄的博客2
    发贴心情 
    非常好的一篇文章,非常感谢
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/11/25 19:44:00
     
     superc_7 帅哥哟,离线,有人找我吗?射手座1983-12-15
      
      
      威望:6
      等级:研一(彻夜钻研J2EE)
      文章:504
      积分:3396
      门派:XML.ORG.CN
      注册:2005/4/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给superc_7发送一个短消息 把superc_7加入好友 查看superc_7的个人资料 搜索superc_7在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给superc_7  引用回复这个贴子 回复这个贴子 查看superc_7的博客3
    发贴心情 
    多谢lz
    最近正要写一些关于TM的东西
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/11/27 13:58:00
     
     GoogleAdSense射手座1983-12-15
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/9/17 2:40:15

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    3,536.133ms