以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 Semantic Web(语义Web)/描述逻辑/本体 』 (http://bbs.xml.org.cn/list.asp?boardid=2) ---- 概念相似度 Similarity Measurement in Ontology (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=22329) |
-- 作者:BenLin -- 发布时间:9/18/2005 10:05:00 PM -- 概念相似度 Similarity Measurement in Ontology 下面有人在讨论关于概念相似度的文章下载,可是没有人讨论怎么定义、计算概念相似度,我来抛个砖。 我所用的是Tanimoto度量,就是用相交的数目处于整体的数目。比如说,A概念的父节点有(K,L,M,N),B概念的父节点有(O,P,M,N),那么有(M,N)2个节点相同;总共有(A,B,K,L,M,N,O,P)8个节点,所以A与B的相似度为2/8=0.25。 希望大家说说大家所看到的计算方式。 |
-- 作者:jpz6311whu -- 发布时间:9/18/2005 11:29:00 PM -- One method is to measure the minimum edge count distance between C1 and C2 by the maximum depth D of a taxonomic hierarchy the only use hyponymy, is a , type links between concepts. Sim(C1,C2)= -logP(C3) Sim (“mammal”,”reptile”) = -log P (“beast”) =-log P(6/12)= -log (0.5) Sim (“bird”,”beast”) =-log P (“animal”)= -log(8/12) = - log(0.75) Sim (“eagle”,”gull”) =-log P (“bird”)= -log(2/12) = - log(1/6) |
-- 作者:BenLin -- 发布时间:10/31/2005 11:44:00 PM -- 为什么要用负号? -log()? 我所想的是:相邻的两个concept,越具体(底层)就应该越相识;越抽象(上层)相识度就少一些。 总的说来,你的方法也是找到最小的共同祖先,用它来计算相似度。 |
-- 作者:Jamsauce -- 发布时间:11/1/2005 3:51:00 PM -- 不错不错。 |
-- 作者:jiexincao -- 发布时间:11/1/2005 6:56:00 PM --
可以给个出处吗?先谢谢了! |
-- 作者:jpz6311whu -- 发布时间:11/1/2005 7:44:00 PM -- Ontology-Driven Semantic Information Retrieval Huang Hai, Wang Rujin, Huang He, Wei Yuanyuan, Xiao Bo (huanghai@ustc.edu) (Institute of Intelligent Machines of Chinese Academy of Science,Hefei 230031,China) |
-- 作者:jiexincao -- 发布时间:11/1/2005 8:05:00 PM -- 非常感谢! |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
62.500ms |