DMman(数据挖掘青年)--留言板

本站首页 管理页面写新日志退出

公告

求真务实打基础，
宁缺毋滥读好书。

数据挖掘青年(DMman)

我的分类（专题）

首页(102)
Weka(11)
Java SE(8)
数据挖掘(26)
数据库(1)
程序人生(17)
Java EE(20)
操作系统(2)
杂谈(14)

日志更新

问君能有几多愁，恰似一群太监上青楼
我和僵尸有个约会：灵异世界或真实存在？
赤壁（下）观后小感：雷人
英科学家：酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校硕士计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得（摘）
为学
EI收录中国期刊-核心（2008-5）
混沌理论：随机世界的建模
分子计算机已经问世，纳米计算机指日可待？
绝对好用免费的网络电话
NLP：基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

留言板

签写新留言

weka分類問題
聚类算法的准确率怎么计算勒~
请教
求助
weka如何做20次10折交叉验证？
急求：weka属性简约后为什么没有提高分

链接

纪录片之家

数据挖掘者
 神威异度空间
 数据挖掘斗士
 中途出家
 不准阁
 烟雨朦胧

 神威智能挖掘中心

KDnuggets
ACM SIGKDD
数据挖掘研究院
 计算机科学论坛
 Weka中文论坛

北京福爱迪翻译中心

Blog信息

blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1817871
建立时间:2007年4月9日

留言板(签写留言)

谢谢

DM(游客)发表留言于2008/6/23 9:39:20

您好!

我现在有个关联规则的新算法,要实验验证其高效性,请问我要用什么来编程实现:weka? matlab? 直接用C++编程? 亦或是3者结合? 哪种方法最简单易学呢?能简要说说3者吗? 非常感谢!

我的邮箱是:panyiting5@126.com. 期待您的回复

以下为blog主人的回复：

您可以再网上搜搜介绍关联规则算法的经典论文，看看人家是怎么实验的。咱要验证效率，就要和人家使用相同的平台，相同的实验数据

| 编辑 | 主人回复 | 删除

命令行

充感(游客)发表留言于2008/5/27 10:52:03

您好！老师，我这些已经看过了，那只大略介绍了一些，我还是不太了解，java weka.classifiers.trees.J48 -t a.arff -T b.arff，参数是怎么传递的，传到了什么地方，J48的main()只有一个参数，而这个是两个，再打扰了，谢谢！

| 编辑 | 主人回复 | 删除

命令行

chonggan(游客)发表留言于2008/5/27 0:20:47

谢谢！我要运行这样一个命令，java weka.classifiers.trees.J48 -t a.arff -T b.arff 具体调用那几个函数，实现原理？谢谢！我对weka还不太了解。我的QQ：442815849

以下为blog主人的回复：

命令行实际上和explorer的功能是对应的。请先查看：

weka入门教程1 http://blogger.org.cn/blog/more.asp?name=idmer&id=21854

weka入门教程2 http://blogger.org.cn/blog/more.asp?name=idmer&id=21856

weka入门教程3 http://blogger.org.cn/blog/more.asp?name=idmer&id=21857

| 编辑 | 主人回复 | 删除

命令行执行

充感(游客)发表留言于2008/5/25 23:25:39

老师，您好，很荣幸查资料查到这里，我刚接触weka，请问怎么在cmd中我只是把weka-3-5和JDK6安装上，请问还需要其他设置吗？谢谢！在线等待！

以下为blog主人的回复：

weka的安装目录下有weka.jar，我们可以在命令行进入该目录下，通过java -jar weka.jar运行jar文件。

解压weka.jar后，即为class文件，也可以用java命令运行指定的界面或算法。

首先要确定java安装正确。

| 编辑 | 主人回复 | 删除

诚心求教

随梦而飞(游客)发表留言于2008/5/23 14:28:40

DMman你好！我是一名研二的学生，很开心在查资料的时候找到了这个地方，发现很多都跟weka有关，可是这个东西我都没有用过。我的论文选题是跟点击流数据有关的，是要在数据仓库的基础上进行数据挖掘，可是一直苦于没能有测试数据，同时也以此为借口没好好做研究，现在有点焦急了。看了你的BLOG，觉得你是一位非常热心的人，不知能否给点建议？谢谢！还有能否告知你的邮箱之类的，谢谢了！我的邮箱是zoulixin@hqu.edu.cn

以下为blog主人的回复：

您好!我的邮箱就在左边；流数据的处理weka不一定有合适的算法；找数据集可以使用google，用英文搜索 ** dataset

| 编辑 | 主人回复 | 删除

能从算法的角度解释一下，为什么利用weka做EM聚类结果中的

veraxxrr(游客)发表留言于2008/5/19 15:06:12

打扰了，能从算法的角度解释一下，为什么利用weka做EM聚类结果中的对于离散属性，Discrete Estimator. Counts会有小数吗（如下例），看了很多论文，但是都没有结果，非常感谢！！！

(F) (T)

Attribute: /students/
Discrete Estimator. Counts = 83.51 2.49 (Total = 86)

以下为blog主人的回复：

衡量分布的时候，连续属性使用均值和方差，离散属性采用概率，如a、b、c、d出现次数分别是0|1、2、3，则b为1/6，a为0/6，这个0在算法中是需要处理的，一般方法是在所有的分子上都加上一个数，如1.我觉得EM中的counts就是这个（1+1）/6。

| 编辑 | 主人回复 | 删除

留言数：74　 « 1 2 3 4 5 6 7 8 9 10 › »

给DMman签写留言：

昵称：
密码：
主页：
标题：

验证码： (不区分大小写,请仔细填写,输错需重写留言内容！)

站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.727 second(s), page refreshed 144830703 times.
《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号