新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 中文XML论坛 - 专业的XML技术讨论区W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → [原创]语义标注算法!请各位大虾指导下! 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 5581 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [原创]语义标注算法!请各位大虾指导下! 举报  打印  推荐  IE收藏夹 
       本主题类别: Ontology Engineering    
     Avansky 帅哥哟,离线,有人找我吗?
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:103
      积分:675
      门派:W3CHINA.ORG
      注册:2008/12/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Avansky发送一个短消息 把Avansky加入好友 查看Avansky的个人资料 搜索Avansky在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Avansky的博客楼主
    发贴心情 [原创]语义标注算法!请各位大虾指导下!

    本人举一个最简单的例子:
    根据这条规则,有公式计算本体实例ind与文档d之间的相关度:
    R(ind,d)=tf(ind,d)×len(ind)/len(d)
    其中,
    (1) tf(ind,d) 表示本体实例ind在文档d中出现的次数;
    (2)len(ind)表示ind标签的长度,len(d)表示文档d的长度;

    通过公式可以计算出本体实例ind与文档d之间的相关度R(ind,d)。

    1)但本人不知道如何用R(ind,d)对语义标注产生影响?

    2)是不是Jena可以对本体进行任何操作,包括语义标注,是不是用Jena对实例进行语义标注时,同时把相关度R(ind,d)加进去?

    3)还有相关度R(ind,d)是以什么样的形式加进去呢?是作为类的一个属性吗?
    因为本人考虑到检索结果是按照相关度R(ind,d)排序的。(当然检索的匹配度是相关度R(ind,d)和语义相似度的共同结果)

    刚刚学习,说的不够清楚,还请大虾们多多指教!!


       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    本人的论文是基于语义网的搜索引擎技术。
    望同路人多交流!
    Email:avan1017@163.com

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/13 13:06:00
     
     Avansky 帅哥哟,离线,有人找我吗?
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:103
      积分:675
      门派:W3CHINA.ORG
      注册:2008/12/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Avansky发送一个短消息 把Avansky加入好友 查看Avansky的个人资料 搜索Avansky在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Avansky的博客2
    发贴心情 
    版主,在嘛?给点指导啊!呵呵!
    小弟先谢谢啦!

    ----------------------------------------------
    本人的论文是基于语义网的搜索引擎技术。
    望同路人多交流!
    Email:avan1017@163.com

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/14 11:33:00
     
     beyondlei 帅哥哟,离线,有人找我吗?天秤座1982-9-24
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:69
      积分:644
      门派:XML.ORG.CN
      注册:2007/8/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给beyondlei发送一个短消息 把beyondlei加入好友 查看beyondlei的个人资料 搜索beyondlei在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看beyondlei的博客3
    发贴心情 
    我理解的语义标注就是指出文档 d 和本体实例 ind 的是相关的 (即文档 d 是描述实例 ind 的),可以是实例标注文档也可以是文档标注实例。
    (1)实例标注文档,譬如有一篇文档 d,可以用一个实例ind来标注d,然后在检索到文档 d (IR-style检索) 的同时可以得到 d 所描述的实例 ind。
    (2)文档标注实例,譬如有一个实例ind,可以用一篇文档 d 来标注ind,然后在检索到实例 ind (本体实例检索) 的同时得到 描述 ind 的文档。

    LZ希望做的是类似这样的系统吗?

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/14 23:37:00
     
     Avansky 帅哥哟,离线,有人找我吗?
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:103
      积分:675
      门派:W3CHINA.ORG
      注册:2008/12/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Avansky发送一个短消息 把Avansky加入好友 查看Avansky的个人资料 搜索Avansky在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Avansky的博客4
    发贴心情 
    beyondlei,你好!
    谢谢你的回答!

    我最近学习的也是基于这方面的。
    我想问一下,你是在Eclipse中实现这样的查询的吗?我现在可以在Eclipse中实现简单的查询。

    但我不理解如何把相似度算法加入到查询程序中,最终实现根据相似度从高到低的结果排序?

    应该是要对用户输入的关键词进行分词处理,然后才能计算。。。。学习中!!

    望大虾们指点一下思路!!

    ----------------------------------------------
    本人的论文是基于语义网的搜索引擎技术。
    望同路人多交流!
    Email:avan1017@163.com

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/15 8:55:00
     
     beyondlei 帅哥哟,离线,有人找我吗?天秤座1982-9-24
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:69
      积分:644
      门派:XML.ORG.CN
      注册:2007/8/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给beyondlei发送一个短消息 把beyondlei加入好友 查看beyondlei的个人资料 搜索beyondlei在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看beyondlei的博客5
    发贴心情 
    基于关键字的查询基本上都要借助于全文检索引擎来完成,比较常用的如lucene,对于文档得检索直接用lucene就可以很容易的完成。对于本体实例的检索,如果你希望用户输入的关键字匹配本体实例的dataproperty值(或者说literal),那么先要用lucene对每一个literal进行index操作(其中包括了分词处理,当然可以加入其它操作如stemming等等),你所说相似度如果是指关键字匹配的相似度,那么已经直接包含在lucene,查询时可以按照关键字匹配的相似度从高到低的结果排序。你可以参考一下其它项目中是如何完成基于关键字查询的

    项目apexaifbxxplore
    http://code.google.com/p/apexaifbxxplore/source/browse/trunk/q2semantic/src/org/team/xxplore/core/service/q2semantic/build/KeywordIndexBuilder.java
    http://code.google.com/p/apexaifbxxplore/source/browse/trunk/q2semantic/src/org/team/xxplore/core/service/q2semantic/search/KeywordSearcher.java

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/15 18:39:00
     
     Avansky 帅哥哟,离线,有人找我吗?
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:103
      积分:675
      门派:W3CHINA.ORG
      注册:2008/12/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Avansky发送一个短消息 把Avansky加入好友 查看Avansky的个人资料 搜索Avansky在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Avansky的博客6
    发贴心情 
    beyondlei,太谢谢啦!
    很兴奋!有你的帮助!加你好友了!论坛高手如云啊!

    之前我也了解过lucene,但是不是很理解。有你的项目我定会受益匪浅!!

    我在关注我的帖子好久了,一直在等你的回复。

    不多说了,你 的东西我收下了。

    大恩不言谢!

    ----------------------------------------------
    本人的论文是基于语义网的搜索引擎技术。
    望同路人多交流!
    Email:avan1017@163.com

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010/4/15 23:53:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/3/7 3:06:40

    本主题贴数6,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    84.961ms