以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 Semantic Web(语义Web)/描述逻辑/本体 』 (http://bbs.xml.org.cn/list.asp?boardid=2) ---- 急求:词语相似度计算 (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=20310) |
-- 作者:wang_duncan -- 发布时间:7/12/2005 12:14:00 AM -- 急求:词语相似度计算 请问: 词语 相似度 的计算 用什么方法 比较精确!??? 另外 那位对wordnet 了解 ? |
-- 作者:iamwym -- 发布时间:7/12/2005 4:42:00 AM -- 近似度是什么概念,这属于语义学上的范畴还是什么,怀疑是否有一个统一标准呢? 你还是要做一个文本挖掘的东东?无论如何,能否把问题问得更加清楚些? |
-- 作者:wang_duncan -- 发布时间:7/12/2005 10:09:00 AM -- 属于文本挖掘领域 比如:比较两个文本的相似程度,那么归根到底是比较文本中词的相似程序,现在的方法很多,比如余弦矢量法等,但是都不够精确,能否有更精确的方法来计算两个词之间的相似程度? |
-- 作者:npubird -- 发布时间:7/12/2005 1:40:00 PM -- 计算词语之间的相似度已经有很多成熟的算法,请参见[Bach2004] T. L. Bach, J. Barrasa, P. Bouquet, et al. D2.2.3: State of the art on ontology alignment. Technical Report, KWEB EU-IST-2004-507482, 2004.中的一些总结。 BTW,从相似度去寻找本体映射局限很多。 |
-- 作者:wang_duncan -- 发布时间:7/12/2005 2:22:00 PM -- 谢谢! 我先看看! 还有类似的东西,希望多多共享! |
-- 作者:wang_duncan -- 发布时间:7/12/2005 2:26:00 PM -- 能把链接也发出来么?? |
-- 作者:iamwym -- 发布时间:7/12/2005 5:54:00 PM -- 呵呵,我和朋友专门讨论过这个问题,文本挖掘用于本体映射不止局限很多的问题,基本上感觉是不可用。文本挖掘使大量文本的处理,利用诸多算法,比如模式识别中的隐含马尔科夫模型,贝耶斯方法,自然语言处理技术,适合大集合的无关联文本,本体所提供的文本都是内联而且数量不多,不怎么适合,做出来效果不好。 |
-- 作者:wang_duncan -- 发布时间:7/13/2005 10:56:00 AM -- 我现在做的是文本的聚类,如果不引入background knowledge ,那么还有什么好的方法呢? 我现在有点迷茫,论文作不下去了. 愁!!! |
-- 作者:iamwym -- 发布时间:7/14/2005 4:08:00 AM -- 文本的聚类,显然是text mining咯,有很多现成的工具做Mining吧 和语义网有关吗? |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
62.500ms |