以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  本体的Jena查询,比如搜索诺基亚和nokia,Nokia,nokiA等  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=84597)


--  作者:wofy1987
--  发布时间:5/5/2010 12:43:00 PM

--  本体的Jena查询,比如搜索诺基亚和nokia,Nokia,nokiA等
在谷歌或百度等搜索引擎的时候,查询诺基亚和nokia
出现的结果是不一样的。

那么如果我想以本体库为载体,以Jena为工具,进行sparql查询,怎么实现查询的结果一致的情况呢?

谢谢各位大虾回答!也可以积极参与讨论,互相进步。


--  作者:service365
--  发布时间:5/6/2010 11:58:00 AM

--  
以下是引用wofy1987在2010-5-5 12:43:00的发言:
在谷歌或百度等搜索引擎的时候,查询诺基亚和nokia
出现的结果是不一样的。

那么如果我想以本体库为载体,以Jena为工具,进行sparql查询,怎么实现查询的结果一致的情况呢?

谢谢各位大虾回答!也可以积极参与讨论,互相进步。



什么鸟东西?
sparql。。。

建立本体就行了吧,自己查询时时区匹配?


--  作者:wofy1987
--  发布时间:5/6/2010 6:38:00 PM

--  
可是情况很多,它只会一个一个完整的匹配,比如是本体库中是诺基亚,你输入诺 (这里有个空格)基亚,那么就会不一样,再举一个例子,如果是Nokia,那么输入查询条件是nokia的时候也是不会匹配的,查出的属性是空的。

对于这种情况,有什么比较好的方法呢?


--  作者:service365
--  发布时间:5/7/2010 12:53:00 AM

--  
以下是引用wofy1987在2010-5-6 18:38:00的发言:
可是情况很多,它只会一个一个完整的匹配,比如是本体库中是诺基亚,你输入诺 (这里有个空格)基亚,那么就会不一样,再举一个例子,如果是Nokia,那么输入查询条件是nokia的时候也是不会匹配的,查出的属性是空的。

对于这种情况,有什么比较好的方法呢?



。。。
能否介绍下你的应用场景,那样可以有针对性地回答啊
--  作者:wofy1987
--  发布时间:5/7/2010 10:46:00 AM

--  
现在大部分的搜索引擎都是基于关键字的
我想实现一个基于本体的搜索引擎
在谷歌百度想要查询某一条信息的时候,比如输入关键字诺基亚N97型号的手机,因为不同用户输入关键字不一样,有的人会输入nokia N97,有人会输入中文,目前的搜索引擎查出的结果是不一样的

可是实质上这两个关键字对于用户来说是一样的,由于是基于关键字的搜索,所以导致不同的结果

现在我想实现一个基于带有语义的本体搜索,由于诺基亚与nokia是sameAs的关系,照理说,查出的结果应该是一致的。

针对这个需求,我该怎么借助Jena和本体库实现呢?是在本体库上的编辑下功夫还是在搜索的核心代码上下功夫?

第一,如果在本体库上的编辑上下功夫,由于等同诺基亚的情况有很多,比如nokia,Nokia,nokiA,noKia等等,那么编辑起来太麻烦,也不现实,因为有更多不同字符可相同语义的实例

那么就想在搜索上下功夫了,可是不知道怎么下功夫~~不知道这个思路对不对?

谢谢!


--  作者:service365
--  发布时间:5/7/2010 11:45:00 AM

--  
以下是引用wofy1987在2010-5-7 10:46:00的发言:
现在大部分的搜索引擎都是基于关键字的
我想实现一个基于本体的搜索引擎
在谷歌百度想要查询某一条信息的时候,比如输入关键字诺基亚N97型号的手机,因为不同用户输入关键字不一样,有的人会输入nokia N97,有人会输入中文,目前的搜索引擎查出的结果是不一样的

可是实质上这两个关键字对于用户来说是一样的,由于是基于关键字的搜索,所以导致不同的结果

现在我想实现一个基于带有语义的本体搜索,由于诺基亚与nokia是sameAs的关系,照理说,查出的结果应该是一致的。

针对这个需求,我该怎么借助Jena和本体库实现呢?是在本体库上的编辑下功夫还是在搜索的核心代码上下功夫?

第一,如果在本体库上的编辑上下功夫,由于等同诺基亚的情况有很多,比如nokia,Nokia,nokiA,noKia等等,那么编辑起来太麻烦,也不现实,因为有更多不同字符可相同语义的实例

那么就想在搜索上下功夫了,可是不知道怎么下功夫~~不知道这个思路对不对?

谢谢!



这个很容易做到的吧,即使没有本体,不用OWL也可以做到的。
建Nokia索引时,把Nokia和诺基亚的页面都加进去。
建诺基亚索引时,把Nokia和诺基亚的页面都加进去。
。。。
nokia Nokia noKia,通常的做法,建立索引时只使用小写的nokia,
以nokia,Nokia,noKia查询之前,也都会转化成nokia来查询的
--  作者:wofy1987
--  发布时间:5/7/2010 12:00:00 PM

--  
利用protege建立本体的时候,有“本体索引”这么一说?
小弟不才,可否再详细点呢?还讲到页面?页面在这里是什么个概念?
我还没有做成B/S架构的系统,就单纯的java程序,初步的探测。

如果有需要,可以加QQ请教你么?
70658223,谢谢!


--  作者:wofy1987
--  发布时间:5/16/2010 9:54:00 AM

--  
顶,有人么?
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
2,777.344ms