求真务实打基础, 宁缺毋滥读好书。
数据挖掘青年(DMman)
纪录片之家
数据挖掘者神威异度空间数据挖掘斗士中途出家不准阁烟雨朦胧神威智能挖掘中心
KDnuggetsACM SIGKDD数据挖掘研究院计算机科学论坛Weka中文论坛 北京福爱迪翻译中心
谢谢
DM(游客)发表留言于2008/6/23 9:39:20
您好!
我现在有个关联规则的新算法,要实验验证其高效性,请问我要用什么来编程实现:weka? matlab? 直接用C++编程? 亦或是3者结合? 哪种方法最简单易学呢?能简要说说3者吗? 非常感谢!
我的邮箱是:panyiting5@126.com. 期待您的回复
以下为blog主人的回复:
您可以再网上搜搜介绍关联规则算法的经典论文,看看人家是怎么实验的。咱要验证效率,就要和人家使用相同的平台,相同的实验数据
命令行
充感(游客)发表留言于2008/5/27 10:52:03
chonggan(游客)发表留言于2008/5/27 0:20:47
命令行实际上和explorer的功能是对应的。请先查看:
命令行执行
充感(游客)发表留言于2008/5/25 23:25:39
weka的安装目录下有weka.jar,我们可以在命令行进入该目录下,通过java -jar weka.jar运行jar文件。
解压weka.jar后,即为class文件,也可以用java命令运行指定的界面或算法。
首先要确定java安装正确。
诚心求教
随梦而飞(游客)发表留言于2008/5/23 14:28:40
您好!我的邮箱就在左边;流数据的处理weka不一定有合适的算法;找数据集可以使用google,用英文搜索 ** dataset
能从算法的角度解释一下,为什么利用weka做EM聚类结果中的
veraxxrr(游客)发表留言于2008/5/19 15:06:12
打扰了,能从算法的角度解释一下,为什么利用weka做EM聚类结果中的对于离散属性,Discrete Estimator. Counts会有小数吗(如下例),看了很多论文,但是都没有结果,非常感谢!!!
(F) (T)
Attribute: /students/Discrete Estimator. Counts = 83.51 2.49 (Total = 86)
衡量分布的时候,连续属性使用均值和方差,离散属性采用概率,如a、b、c、d出现次数分别是0|1、2、3,则b为1/6,a为0/6,这个0在算法中是需要处理的,一般方法是在所有的分子上都加上一个数,如1.我觉得EM中的counts就是这个(1+1)/6。