以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 Semantic Web(语义Web)/描述逻辑/本体 』 (http://bbs.xml.org.cn/list.asp?boardid=2) ---- [原创]语义标注算法!请各位大虾指导下! (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=84279) |
-- 作者:Avansky -- 发布时间:4/13/2010 1:06:00 PM -- [原创]语义标注算法!请各位大虾指导下! 本人举一个最简单的例子: 根据这条规则,有公式计算本体实例ind与文档d之间的相关度: R(ind,d)=tf(ind,d)×len(ind)/len(d) 其中, (1) tf(ind,d) 表示本体实例ind在文档d中出现的次数; (2)len(ind)表示ind标签的长度,len(d)表示文档d的长度; 通过公式可以计算出本体实例ind与文档d之间的相关度R(ind,d)。 1)但本人不知道如何用R(ind,d)对语义标注产生影响? 2)是不是Jena可以对本体进行任何操作,包括语义标注,是不是用Jena对实例进行语义标注时,同时把相关度R(ind,d)加进去? 3)还有相关度R(ind,d)是以什么样的形式加进去呢?是作为类的一个属性吗? 刚刚学习,说的不够清楚,还请大虾们多多指教!! |
-- 作者:Avansky -- 发布时间:4/14/2010 11:33:00 AM -- 版主,在嘛?给点指导啊!呵呵! 小弟先谢谢啦! |
-- 作者:beyondlei -- 发布时间:4/14/2010 11:37:00 PM -- 我理解的语义标注就是指出文档 d 和本体实例 ind 的是相关的 (即文档 d 是描述实例 ind 的),可以是实例标注文档也可以是文档标注实例。 (1)实例标注文档,譬如有一篇文档 d,可以用一个实例ind来标注d,然后在检索到文档 d (IR-style检索) 的同时可以得到 d 所描述的实例 ind。 (2)文档标注实例,譬如有一个实例ind,可以用一篇文档 d 来标注ind,然后在检索到实例 ind (本体实例检索) 的同时得到 描述 ind 的文档。 LZ希望做的是类似这样的系统吗? |
-- 作者:Avansky -- 发布时间:4/15/2010 8:55:00 AM -- beyondlei,你好! 谢谢你的回答! 我最近学习的也是基于这方面的。 但我不理解如何把相似度算法加入到查询程序中,最终实现根据相似度从高到低的结果排序? 应该是要对用户输入的关键词进行分词处理,然后才能计算。。。。学习中!! 望大虾们指点一下思路!! |
-- 作者:beyondlei -- 发布时间:4/15/2010 6:39:00 PM -- 基于关键字的查询基本上都要借助于全文检索引擎来完成,比较常用的如lucene,对于文档得检索直接用lucene就可以很容易的完成。对于本体实例的检索,如果你希望用户输入的关键字匹配本体实例的dataproperty值(或者说literal),那么先要用lucene对每一个literal进行index操作(其中包括了分词处理,当然可以加入其它操作如stemming等等),你所说相似度如果是指关键字匹配的相似度,那么已经直接包含在lucene,查询时可以按照关键字匹配的相似度从高到低的结果排序。你可以参考一下其它项目中是如何完成基于关键字查询的 项目apexaifbxxplore
|
-- 作者:Avansky -- 发布时间:4/15/2010 11:53:00 PM -- beyondlei,太谢谢啦! 很兴奋!有你的帮助!加你好友了!论坛高手如云啊! 之前我也了解过lucene,但是不是很理解。有你的项目我定会受益匪浅!! 我在关注我的帖子好久了,一直在等你的回复。 不多说了,你 的东西我收下了。 大恩不言谢! |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
46.875ms |