以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  急求:词语相似度计算  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=20310)


--  作者:wang_duncan
--  发布时间:7/12/2005 12:14:00 AM

--  急求:词语相似度计算

请问:

    词语 相似度 的计算 用什么方法 比较精确!???

另外 那位对wordnet 了解 ?
激切渴望 你的支援!!


--  作者:iamwym
--  发布时间:7/12/2005 4:42:00 AM

--  
近似度是什么概念,这属于语义学上的范畴还是什么,怀疑是否有一个统一标准呢?
你还是要做一个文本挖掘的东东?无论如何,能否把问题问得更加清楚些?
--  作者:wang_duncan
--  发布时间:7/12/2005 10:09:00 AM

--  
属于文本挖掘领域
比如:比较两个文本的相似程度,那么归根到底是比较文本中词的相似程序,现在的方法很多,比如余弦矢量法等,但是都不够精确,能否有更精确的方法来计算两个词之间的相似程度?
--  作者:npubird
--  发布时间:7/12/2005 1:40:00 PM

--  
计算词语之间的相似度已经有很多成熟的算法,请参见[Bach2004] T. L. Bach, J. Barrasa, P. Bouquet, et al. D2.2.3: State of the art on ontology alignment. Technical Report, KWEB EU-IST-2004-507482, 2004.中的一些总结。

BTW,从相似度去寻找本体映射局限很多。


--  作者:wang_duncan
--  发布时间:7/12/2005 2:22:00 PM

--  
谢谢! 我先看看!
还有类似的东西,希望多多共享!
--  作者:wang_duncan
--  发布时间:7/12/2005 2:26:00 PM

--  
能把链接也发出来么??
--  作者:iamwym
--  发布时间:7/12/2005 5:54:00 PM

--  
呵呵,我和朋友专门讨论过这个问题,文本挖掘用于本体映射不止局限很多的问题,基本上感觉是不可用。文本挖掘使大量文本的处理,利用诸多算法,比如模式识别中的隐含马尔科夫模型,贝耶斯方法,自然语言处理技术,适合大集合的无关联文本,本体所提供的文本都是内联而且数量不多,不怎么适合,做出来效果不好。
--  作者:wang_duncan
--  发布时间:7/13/2005 10:56:00 AM

--  
我现在做的是文本的聚类,如果不引入background knowledge ,那么还有什么好的方法呢?
我现在有点迷茫,论文作不下去了.
愁!!!
--  作者:iamwym
--  发布时间:7/14/2005 4:08:00 AM

--  
文本的聚类,显然是text mining咯,有很多现成的工具做Mining吧
和语义网有关吗?
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
62.500ms