本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1753852
建立时间:2007年4月9日




[数据挖掘]数据挖掘的数据集资源收集 
网上资源

数据挖掘青年 发表于 2007/4/16 11:55:39

 DMman按:以下链接转自互联网,链接的有效性与可用价值DMman没有逐个进行测试。  1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b 2、几个实用的测试数据集下载的网站 http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html 3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果可能有一些不能访问,但是总有能访问的吧: UCI收集的机器学习数据集ftp://pami.sjtu.edu.cn/http://www.ics.uci.edu/~mlearn//MLRepository.htm statlib http://liama.ia.ac.cn/SCILAB/scilabindexgb.htmhttp://lib.stat.cmu.edu/ 样本数据库http://kdd.ics.uci.edu/http://www.ics.uci.edu/~mlearn/MLRepository.html 关于基金的数据挖掘的网站http://www.gotofund.com/index.asp http://lans.ece.utexas.edu/~strehl/ reuters数据集http://www.research.att.com/~lewis/reuters21578.html 各种数据集:http://kdd.ics.uci.edu/summary.data.type.htmlhttp://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.htmlhttp://lib.stat.cmu.edu/datasets/http://dctc.sjtu.edu.cn/adaptive/datasets/ http://fimi.cs.helsinki.fi/data/http://www.almaden.ibm.com/software/quest/Resources/index.shtmlhttp://miles.cnuce.cnr.it/~palmeri/datam/DCI/ 进行文本分类&WEBhttp://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html http://www.w3.org/TR/WD-logfile-960221.htmlhttp://www.w3.org/Daemon/User/Config/Logging.html#AccessLoghttp://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.web-caching.com/traces-logs.htmlhttp://www-2.cs.cmu.edu/webkbhttp://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdfhttp://www.cs.cornell.edu/projects/kddcup/index.html 时间序列数据的网址http://www.stat.wisc.edu/~reinsel/bjr-data/ apriori算法的测试数据http://www.almaden.ibm.com/cs/quest/syndata.html 数据生成器的链接http://www.cse.cuhk.edu.hk/~kdd/data_collection.htmlhttp://www.almaden.ibm.com/cs/quest/syndata.html 关联:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jarhttp://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData WEKA:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar1。A jarfile containing 37 classification problems, originally obtained from the UCI repositoryhttp://prdownloads.sourceforge.net/weka/datasets-UCI.jar2。A jarfile containing 37 regression problems, obtained from various sourceshttp://prdownloads.sourceforge.net/weka/datasets-numeric.jar3。A jarfile containing 30 regression datasets collected by Luis Torgohttp://prdownloads.sourceforge.net/weka/regression-datasets.jar 癌症基因:http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi 金融数据:http://lisp.vse.cz/pkdd99/Challenge/chall.htm   另一个人提供的http://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html 以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html 进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html Download the Financial Data (~17.5M zipped file, ~67M unzipped data) Download the Medical Data (~2M zipped file, ~6M unzipped data)http://lisp.vse.cz/pkdd99/Challenge/chall.htm kdnuggets 相关链接数据集(借花献佛了):http://www.kdnuggets.com/datasets/index.html 你也可以到http://blogger.org.cn/blog/more.asp?name=idmer&id=24017察看kdnuggets 数据集资源的详细介绍。


阅读全文(31807) | 回复(2) | 编辑 | 精华
 


回复:数据挖掘的数据集资源收集
网上资源

Amy(游客)发表评论于2010/9/14 9:49:08

对可用于网络入侵检测的数据集,除Kdd99外,还有其他的数据集吗?急求


个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

lk(游客)发表评论于2009/10/7 16:19:22

《招聘标题》 急聘兼职打字员(4000元/月适合在校学生在家待业人员兼职) 3000元/月急聘兼职淘宝客服人员,适合在校学生在家待业人员兼职) SounetVIP公司急聘兼职网络信息回复员,130元/天!适合在校学生在家待业人员兼职) 130元/天急聘兼职网络信息回复员(适合在校学生在家待业人员兼职) 《招聘内容》 薪资待遇: 工作每天3-8小时,100元/天工资每日支付;适合人群:适合在校学生、在家待业人员兼职。岗位描述: 负责信息回复工作(有内容样版),工作地点不限,专兼职均可!应聘要求: 上网熟练,平均每天工作投入约3小时,具体根据效率自定; 学历不限,在职或学生皆可;勤奋,认真,有责任感;熟悉用电脑发消息的整个流程。(很简单,学一下就会!) 详情看SounetVIP公司招聘:http://www.suk99.cn/?17564-1.html 邮箱:vipkeor@126.com 最近工资发放查看:www.suk99.cn/gz.html (请注意,应聘不用交任何费用,押金等)     Sounet VIP公司网络兼职员工招聘

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

mhoney发表评论于2008/12/7 10:44:30

要做一份空间数据挖掘的毕业论文,开发什么系统简单点呢

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

mhoney发表评论于2008/12/7 10:39:05

以下引用xiaomic(游客)在2008-12-3 23:02:07的评论: 我想知道与数据挖掘有关的实例源码有共享的么 以下为blog主人的回复: google code search 不知道怎么用啊,好心人能不能教教啊

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

xiaomic(游客)发表评论于2008/12/3 23:04:23

我想知道与数据挖掘有关的实例源码有共享的么 有的朋友能加我Q么,谢谢了276320192

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

xiaomic(游客)发表评论于2008/12/3 23:02:07

我想知道与数据挖掘有关的实例源码有共享的么 以下为blog主人的回复: google code search

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

Olivia(游客)发表评论于2008/11/7 23:47:36

楼主,请问有中文的吗?我是小菜鸟,水平比较低,还请多多指教,谢谢啦!

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

随梦而飞(游客)发表评论于2008/5/23 14:15:59

以下引用清水幽萍(游客)在2007-12-27 14:39:02的评论: 非常感谢给的这些数据集! 我是一名在校研究生,研究方向定了数据挖掘,看了一些这方面的书,对其有了一个大概了解,但是对数据挖掘在实际中的实现过程不是很明白。例如要仿真算法,数据怎样导入?   以下为blog主人的回复:  每种软件实现的算法都要求有自己特定的文件、数据格式;可以体验下开源软件Weka 我的情况也差不多是这样。 不过我主要是WEB日志挖掘(购物网站),不知道是否了解哪里有相关测试的数据集?还有 apriori算法的测试数据http://www.almaden.ibm.com/cs/quest/syndata.html不知道测试数据在哪?可以下吗?

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

各个(游客)发表评论于2008/5/11 22:05:09

有没有二维的数据集合,可视化的以下为blog主人的回复: 没有用过。您也可以自动生成一些任意维度的数,如在matlab中

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

清水幽萍(游客)发表评论于2007/12/27 14:39:02

非常感谢给的这些数据集! 我是一名在校研究生,研究方向定了数据挖掘,看了一些这方面的书,对其有了一个大概了解,但是对数据挖掘在实际中的实现过程不是很明白。例如要仿真算法,数据怎样导入?   以下为blog主人的回复:  每种软件实现的算法都要求有自己特定的文件、数据格式;可以体验下开源软件Weka

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


» 1 2 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.047 second(s), page refreshed 144762925 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号