本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1755677
建立时间:2007年4月9日




[Weka]weka中文教程及开源DM软件推荐 
网上资源

数据挖掘青年 发表于 2007/4/14 16:58:11

weka中文论坛http://bbs.wekacn.org/index.php提供,非常不错的学习资料。  500)this.width=500'>ExplorerGuide-3[1].5.5.rar 500)this.width=500'>ExperimenterTutorial-3.5.3.rar   weka入门教程1 http://blogger.org.cn/blog/more.asp?name=idmer&id=21854 weka入门教程2 http://blogger.org.cn/blog/more.asp?name=idmer&id=21856 weka入门教程3 http://blogger.org.cn/blog/more.asp?name=idmer&id=21857   weka的源码: 很多朋友找不到weka的源码。其实,安装了weka后 它的安装目录下 weka-src.jar解压后就是原文件。 下载Weka可以到它的官方网站 http://www.cs.waikato.ac.nz/ml/weka/ 有一本书《数据挖掘:实用机器学习技术》第2版是和Weka配套的,如果能结合这本书,学Weka比较快捷些。   推荐几个开源的数据挖掘软件:1 weka http://www.cs.waikato.ac.nz/ml/weka/ 2 Yale http://rapid-i.com/ 3 KNIME http://www.knime.org/index.html 4 R (统计软件) http://www.r-project.org/ 5 Rattle(R基础上的GUI)  http://rattle.togaware.com/ 6 AlphaMiner(哈工大基于weka内核开发) http://bi.hitsz.edu.cn/AlphaMiner/index.htm 7 在Excel中实现了决策树、神经网络等算法。可惜VBA工程被作者加密了,不能看到源码。 http://www.geocities.com/adotsaha/ 8 Apache Lucene是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 http://lucene.apache.org/


阅读全文(50008) | 回复(20) | 编辑 | 精华
 


回复:weka中文教程及开源DM软件推荐
网上资源

fishermanfriend(游客)发表评论于2007/12/8 15:25:15

weka 中有没有LOF的算法代码 请各位指教


个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

gyzhen(游客)发表评论于2007/11/18 22:58:11

楼主您好, 谢谢你的分享。 我想请教楼主一个关于weka聚类的问题。在weka中的attribute是有顺序的,比如说一个instance有5个属性,取值分别为a b c d e,另外一个instance的对应的属性值为b d e a c,则这2个instance被认为是不同的。 但我现在的数据集中属性是没有顺序的, 上面的2个instance在我的数据集中是完全一样的,应该被划在同一个cluster里。也就是说只要值abcde分别出现在不同的5个位置, 这些instance就是一样的。所以在我的数据集中,如果有4个instance: a b d e c, c d c e b, d e f c b, g h f a i, 则前3个该被分为一个cluster,最后一个自成一个cluster,因为前3个instance中至少有4个值是相同的,而最后一个的值却很不同。 请问weka可以实现这样的属性无顺序的聚类吗?谢谢。  我的邮箱gyzhen1@163.com  以下为blog主人的回复:  您所说的算法Weka中没有。而且处理这类聚类问题的算法我也没有见过。因为聚类算法的核心标准就是距离的定义,属性没有顺序应该预处理一下。bty,您的数据为什么没有属性的顺序?天生没有,还是采集的时候不一致?

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

TT(游客)发表评论于2007/7/4 11:42:09

谢谢!找到原因了 因为我们在开发过程中 定义了自己的eclipse error标准只需要恢复默认值就可以了 谢谢! 以下为blog主人的回复:  呵呵,不客气.eclipse确实功能挺繁多,很不错的平台.我正在学习使用!

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

TT(游客)发表评论于2007/7/4 9:53:04

Hi DMman ! 为什么我把weka的源代码倒入eclipse之后 会出现许多分号错误 类似于不应该在for while 之后加上分号?? 以下为blog主人的回复:  我没有出现过那样的错误.在eclipse中倒入Weka,我实现的比较顺利,Weka源码本身应该不会有错误的.可以参考一个网友整理的:http://www.ieee.org.cn/dispbbs.asp?boardID=69&ID=48633

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

数据挖掘青年发表评论于2007/6/23 10:51:50

  很多朋友找不到weka的源码。其实,安装了weka后 它的安装目录下 weka-src.jar解压后就是原文件。  下载Weka可以到它的官方网站 http://www.cs.waikato.ac.nz/ml/weka/

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

NICOLE(游客)发表评论于2007/5/17 13:32:35

请问你会在WEKA中添加一个新的聚类算法么? 以下为blog主人的回复:  请参看我的日志 如何在weka中加入自己的算法http://blogger.org.cn/blog/more.asp?name=DMman&id=24788

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

HE(游客)发表评论于2007/4/16 20:21:18

不错不错。

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:weka中文教程及开源DM软件推荐
网上资源

数据挖掘青年发表评论于2007/4/16 17:51:31

在Excel中实现了决策树、神经网络等算法。可惜VBA工程被作者加密了,不能看到源码。 http://www.geocities.com/adotsaha/

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


» 1 2 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.063 second(s), page refreshed 144753327 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号