以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  [原创]语义标注算法!请各位大虾指导下!  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=84279)


--  作者:Avansky
--  发布时间:4/13/2010 1:06:00 PM

--  [原创]语义标注算法!请各位大虾指导下!
本人举一个最简单的例子:
根据这条规则,有公式计算本体实例ind与文档d之间的相关度:
R(ind,d)=tf(ind,d)×len(ind)/len(d)
其中,
(1) tf(ind,d) 表示本体实例ind在文档d中出现的次数;
(2)len(ind)表示ind标签的长度,len(d)表示文档d的长度;

通过公式可以计算出本体实例ind与文档d之间的相关度R(ind,d)。

1)但本人不知道如何用R(ind,d)对语义标注产生影响?

2)是不是Jena可以对本体进行任何操作,包括语义标注,是不是用Jena对实例进行语义标注时,同时把相关度R(ind,d)加进去?

3)还有相关度R(ind,d)是以什么样的形式加进去呢?是作为类的一个属性吗?
因为本人考虑到检索结果是按照相关度R(ind,d)排序的。(当然检索的匹配度是相关度R(ind,d)和语义相似度的共同结果)

刚刚学习,说的不够清楚,还请大虾们多多指教!!


--  作者:Avansky
--  发布时间:4/14/2010 11:33:00 AM

--  
版主,在嘛?给点指导啊!呵呵!
小弟先谢谢啦!
--  作者:beyondlei
--  发布时间:4/14/2010 11:37:00 PM

--  
我理解的语义标注就是指出文档 d 和本体实例 ind 的是相关的 (即文档 d 是描述实例 ind 的),可以是实例标注文档也可以是文档标注实例。
(1)实例标注文档,譬如有一篇文档 d,可以用一个实例ind来标注d,然后在检索到文档 d (IR-style检索) 的同时可以得到 d 所描述的实例 ind。
(2)文档标注实例,譬如有一个实例ind,可以用一篇文档 d 来标注ind,然后在检索到实例 ind (本体实例检索) 的同时得到 描述 ind 的文档。

LZ希望做的是类似这样的系统吗?


--  作者:Avansky
--  发布时间:4/15/2010 8:55:00 AM

--  
beyondlei,你好!
谢谢你的回答!

我最近学习的也是基于这方面的。
我想问一下,你是在Eclipse中实现这样的查询的吗?我现在可以在Eclipse中实现简单的查询。

但我不理解如何把相似度算法加入到查询程序中,最终实现根据相似度从高到低的结果排序?

应该是要对用户输入的关键词进行分词处理,然后才能计算。。。。学习中!!

望大虾们指点一下思路!!


--  作者:beyondlei
--  发布时间:4/15/2010 6:39:00 PM

--  
基于关键字的查询基本上都要借助于全文检索引擎来完成,比较常用的如lucene,对于文档得检索直接用lucene就可以很容易的完成。对于本体实例的检索,如果你希望用户输入的关键字匹配本体实例的dataproperty值(或者说literal),那么先要用lucene对每一个literal进行index操作(其中包括了分词处理,当然可以加入其它操作如stemming等等),你所说相似度如果是指关键字匹配的相似度,那么已经直接包含在lucene,查询时可以按照关键字匹配的相似度从高到低的结果排序。你可以参考一下其它项目中是如何完成基于关键字查询的

项目apexaifbxxplore
http://code.google.com/p/apexaifbxxplore/source/browse/trunk/q2semantic/src/org/team/xxplore/core/service/q2semantic/build/KeywordIndexBuilder.java
http://code.google.com/p/apexaifbxxplore/source/browse/trunk/q2semantic/src/org/team/xxplore/core/service/q2semantic/search/KeywordSearcher.java


--  作者:Avansky
--  发布时间:4/15/2010 11:53:00 PM

--  
beyondlei,太谢谢啦!
很兴奋!有你的帮助!加你好友了!论坛高手如云啊!

之前我也了解过lucene,但是不是很理解。有你的项目我定会受益匪浅!!

我在关注我的帖子好久了,一直在等你的回复。

不多说了,你 的东西我收下了。

大恩不言谢!


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms