| |
 |
|
[Semantic Web]叙词表与本体的异同  |
Lee 发表于 2006/3/3 22:25:18 |
1、叙词表的概念与应用特点
叙词表又称为主题词表,它是一种语义词典,由术语及术语之间的各种关系组成,能反映某学科领域的语义相关概念。ANSI Thesaurus标准(Z39.19-1980)规定有13种词汇间关系。这13种关系完全包括了中国《汉语主题词表》的"用、代、属、分、参"结构。
叙词表主要用于检索时的后控制和标引时的自动或辅助选择索引词,是提高查全率和查准率、实现多语种检索和智能化概念检索的的重要途径。
2、本体的概念和应用特点
本体(以下统称ontology)是一个关于一些主题的清晰规范的说明。它是一个规范的、已经得到公认的描述,它包含词表(或称名称表、术语表),词表中的术语全是与某一学科领域相关的,词表中的逻辑声明全部是用来描述那些术语的含义和术语间关系的(它们是怎样和其它术语相关联的)。因此,ontology提供了一个用来表达和交流某些主题知识的词表,还包括一个关系集,关系集把握着词表中这些术语间的联系。
3、叙词表与ontology的区别联系
(1)叙词表中的术语均是规范的科学语言,而ontology中的概念、术语可以用自然语言和半自然语言来表达。这是两者在逻辑表达形式上的区别。
(2)在组织结构上,叙词表中知识点的分布是线性的、一维的。而ontology中的知识点/概念分布是网状的,它不单纯是一张平面的网格,而是一个在四维空间中伸缩的网状结构。
(3)Ontology是一个开放集成的体系,它的底层知识库与概念集可以随着学科领域的更新和发展随时进行修正和更新,在这一点上,叙词表则"望尘莫及"。利用ontology动态更新的特点,可以找出学科发展的规律。
(4)叙词表中只包含"用、代、属、分、参、族"这样的简单的语义关系[9~11]。而ontology中概念间的关系,则被描述得更为广泛、深入、细致和全面。这是两者的最主要区别,也是为什么基于ontology的系统可以实现语义检索和半自然语言、乃至自然语言检索功能的奥妙所在。基本说来,ontology中概念间的关系分为六种:①A synonym B;②A hypernym B;③ A hyponym B ;④A overlaps B ;⑤ A disjoint B ;⑥ B, C, D cover A。
(5)叙词表是一个词汇库(语料库)但不是知识库,而ontology不仅仅是概念集、语料库,还可以是一个知识库。一个实际存在的ontology可以是一个自备知识库或知识底层的完备的知识组织体系,具有智能查询、回答用户问题、机器翻译和预测知识增长点等等传统的基于叙词表的检索系统不具备的功能。
(6)叙词表相对稳定,结构保守而单一;不可能经常修订。而ontology的结构应该是一个基于XML的开放体系[13],可以被复用,可以增加或减少枝节,可以对每个枝节处进行修改和校验,可以对原有的模式进行保存。
而且,将概念内容掏空后的框架skeleton又可以用作其它领域本体(Domain ontology)的框架(Framework)。譬如,花卉学本体一旦构建完成,如果将其中的木本植物分类部分去掉,就变成为"草本花卉本体";如果将植物分类树的其它不属于观赏植物的部分添加完整,那么就可以成为一个完整的植物学本体;再将植物学本体推而广之,添加上分类体系框架相同的微生物学和动物学的知识与术语词汇,就会成为完整的宏观生物学本体。
4、结语
由于目前,大量的工作必需依赖手工的录入和标引,机器标引和自动编目存在很大的局限性,其精确性尚无法和手工标引媲美。低效率的手工标引成为制约ontology系统构建和完善更新的最大瓶颈。而且研究ontology构建的技术体系与研究检索的技术体系之间存在脱节问题。这导致了ontology工程的生命周期不能顺利进行。Ontology的应用有着非常广阔的前景,而针对ontology工程的生命周期,进行自动标引、自动的信息抽提、信息更新和数据挖掘等智能代理技术已然成为ontology研究的焦点核心。
---- 李 景 中国科学院文献情报中心《研究生通讯》2003年第二期
|
|
|
| |
 | |
|
| Blog 信 息 |
blog名称:风落沙 日志总数:348 评论数量:550 留言数量:52 访问次数:1608216 建立时间:2005年1月28日 |
|
| 友 情 连 接 |
|

|
|
|

| |
|