中文XML论坛 - 专业的XML技术讨论区--显示贴子

以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  急求：词语相似度计算  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=20310)

--  作者：wang_duncan
--  发布时间：7/12/2005 12:14:00 AM

--  急求：词语相似度计算

请问：

词语相似度的计算用什么方法比较精确！？？？

另外那位对wordnet 了解？
激切渴望你的支援！！

--  作者：iamwym
--  发布时间：7/12/2005 4:42:00 AM

--
近似度是什么概念，这属于语义学上的范畴还是什么，怀疑是否有一个统一标准呢？
你还是要做一个文本挖掘的东东？无论如何，能否把问题问得更加清楚些？

--  作者：wang_duncan
--  发布时间：7/12/2005 10:09:00 AM

--
属于文本挖掘领域
比如：比较两个文本的相似程度，那么归根到底是比较文本中词的相似程序，现在的方法很多，比如余弦矢量法等，但是都不够精确，能否有更精确的方法来计算两个词之间的相似程度？

--  作者：npubird
--  发布时间：7/12/2005 1:40:00 PM

--
计算词语之间的相似度已经有很多成熟的算法，请参见[Bach2004] T. L. Bach, J. Barrasa, P. Bouquet, et al. D2.2.3: State of the art on ontology alignment. Technical Report, KWEB EU-IST-2004-507482, 2004.中的一些总结。

BTW，从相似度去寻找本体映射局限很多。

--  作者：wang_duncan
--  发布时间：7/12/2005 2:22:00 PM

--
谢谢！我先看看！
还有类似的东西，希望多多共享！

--  作者：wang_duncan
--  发布时间：7/12/2005 2:26:00 PM

--
能把链接也发出来么？？

--  作者：iamwym
--  发布时间：7/12/2005 5:54:00 PM

--
呵呵，我和朋友专门讨论过这个问题，文本挖掘用于本体映射不止局限很多的问题，基本上感觉是不可用。文本挖掘使大量文本的处理，利用诸多算法，比如模式识别中的隐含马尔科夫模型，贝耶斯方法，自然语言处理技术，适合大集合的无关联文本，本体所提供的文本都是内联而且数量不多，不怎么适合，做出来效果不好。

--  作者：wang_duncan
--  发布时间：7/13/2005 10:56:00 AM

--
我现在做的是文本的聚类,如果不引入background knowledge ,那么还有什么好的方法呢?
我现在有点迷茫,论文作不下去了.
愁!!!

--  作者：iamwym
--  发布时间：7/14/2005 4:08:00 AM

--
文本的聚类，显然是text mining咯，有很多现成的工具做Mining吧
和语义网有关吗？

W 3 C h i n a ( since 2003 ) 旗下站点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》

62.500ms