公告 |
求真务实打基础, 宁缺毋滥读好书。
数据挖掘青年(DMman) |
链接 |
|
Blog信息 |
blog名称:DMman(数据挖掘青年) 日志总数:102 评论数量:564 留言数量:57 访问次数:1753852 建立时间:2007年4月9日 |

| |
[数据挖掘]数据挖掘的数据集资源收集  网上资源
数据挖掘青年 发表于 2007/4/16 11:55:39 |
DMman按:以下链接转自互联网,链接的有效性与可用价值DMman没有逐个进行测试。
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b
2、几个实用的测试数据集下载的网站
http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果可能有一些不能访问,但是总有能访问的吧:
UCI收集的机器学习数据集ftp://pami.sjtu.edu.cn/http://www.ics.uci.edu/~mlearn//MLRepository.htm
statlib http://liama.ia.ac.cn/SCILAB/scilabindexgb.htmhttp://lib.stat.cmu.edu/
样本数据库http://kdd.ics.uci.edu/http://www.ics.uci.edu/~mlearn/MLRepository.html
关于基金的数据挖掘的网站http://www.gotofund.com/index.asp
http://lans.ece.utexas.edu/~strehl/
reuters数据集http://www.research.att.com/~lewis/reuters21578.html
各种数据集:http://kdd.ics.uci.edu/summary.data.type.htmlhttp://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.htmlhttp://lib.stat.cmu.edu/datasets/http://dctc.sjtu.edu.cn/adaptive/datasets/ http://fimi.cs.helsinki.fi/data/http://www.almaden.ibm.com/software/quest/Resources/index.shtmlhttp://miles.cnuce.cnr.it/~palmeri/datam/DCI/
进行文本分类&WEBhttp://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
http://www.w3.org/TR/WD-logfile-960221.htmlhttp://www.w3.org/Daemon/User/Config/Logging.html#AccessLoghttp://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.web-caching.com/traces-logs.htmlhttp://www-2.cs.cmu.edu/webkbhttp://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdfhttp://www.cs.cornell.edu/projects/kddcup/index.html
时间序列数据的网址http://www.stat.wisc.edu/~reinsel/bjr-data/
apriori算法的测试数据http://www.almaden.ibm.com/cs/quest/syndata.html
数据生成器的链接http://www.cse.cuhk.edu.hk/~kdd/data_collection.htmlhttp://www.almaden.ibm.com/cs/quest/syndata.html
关联:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jarhttp://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData
WEKA:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar1。A jarfile containing 37 classification problems, originally obtained from the UCI repositoryhttp://prdownloads.sourceforge.net/weka/datasets-UCI.jar2。A jarfile containing 37 regression problems, obtained from various sourceshttp://prdownloads.sourceforge.net/weka/datasets-numeric.jar3。A jarfile containing 30 regression datasets collected by Luis Torgohttp://prdownloads.sourceforge.net/weka/regression-datasets.jar
癌症基因:http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi
金融数据:http://lisp.vse.cz/pkdd99/Challenge/chall.htm
另一个人提供的http://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html
以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html
进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
Download the Financial Data (~17.5M zipped file, ~67M unzipped data) Download the Medical Data (~2M zipped file, ~6M unzipped data)http://lisp.vse.cz/pkdd99/Challenge/chall.htm
kdnuggets 相关链接数据集(借花献佛了):http://www.kdnuggets.com/datasets/index.html
你也可以到http://blogger.org.cn/blog/more.asp?name=idmer&id=24017察看kdnuggets 数据集资源的详细介绍。 |
|
回复:数据挖掘的数据集资源收集 网上资源
Amy(游客)发表评论于2010/9/14 9:49:08 |
对可用于网络入侵检测的数据集,除Kdd99外,还有其他的数据集吗?急求 |
|
回复:数据挖掘的数据集资源收集 网上资源
lk(游客)发表评论于2009/10/7 16:19:22 |
《招聘标题》 急聘兼职打字员(4000元/月适合在校学生在家待业人员兼职) 3000元/月急聘兼职淘宝客服人员,适合在校学生在家待业人员兼职) SounetVIP公司急聘兼职网络信息回复员,130元/天!适合在校学生在家待业人员兼职) 130元/天急聘兼职网络信息回复员(适合在校学生在家待业人员兼职) 《招聘内容》 薪资待遇: 工作每天3-8小时,100元/天工资每日支付;适合人群:适合在校学生、在家待业人员兼职。岗位描述: 负责信息回复工作(有内容样版),工作地点不限,专兼职均可!应聘要求: 上网熟练,平均每天工作投入约3小时,具体根据效率自定; 学历不限,在职或学生皆可;勤奋,认真,有责任感;熟悉用电脑发消息的整个流程。(很简单,学一下就会!)
详情看SounetVIP公司招聘:http://www.suk99.cn/?17564-1.html 邮箱:vipkeor@126.com
最近工资发放查看:www.suk99.cn/gz.html
(请注意,应聘不用交任何费用,押金等)
Sounet VIP公司网络兼职员工招聘 |
|
回复:数据挖掘的数据集资源收集 网上资源
mhoney发表评论于2008/12/7 10:44:30 |
要做一份空间数据挖掘的毕业论文,开发什么系统简单点呢 |
|
回复:数据挖掘的数据集资源收集 网上资源
mhoney发表评论于2008/12/7 10:39:05 |
以下引用xiaomic(游客)在2008-12-3 23:02:07的评论:
我想知道与数据挖掘有关的实例源码有共享的么
以下为blog主人的回复:
google code search
不知道怎么用啊,好心人能不能教教啊 |
|
回复:数据挖掘的数据集资源收集 网上资源
xiaomic(游客)发表评论于2008/12/3 23:04:23 |
我想知道与数据挖掘有关的实例源码有共享的么
有的朋友能加我Q么,谢谢了276320192 |
|
回复:数据挖掘的数据集资源收集 网上资源
xiaomic(游客)发表评论于2008/12/3 23:02:07 |
我想知道与数据挖掘有关的实例源码有共享的么
以下为blog主人的回复:
google code search |
|
回复:数据挖掘的数据集资源收集 网上资源
Olivia(游客)发表评论于2008/11/7 23:47:36 |
楼主,请问有中文的吗?我是小菜鸟,水平比较低,还请多多指教,谢谢啦! |
|
回复:数据挖掘的数据集资源收集 网上资源
随梦而飞(游客)发表评论于2008/5/23 14:15:59 |
以下引用清水幽萍(游客)在2007-12-27 14:39:02的评论:
非常感谢给的这些数据集!
我是一名在校研究生,研究方向定了数据挖掘,看了一些这方面的书,对其有了一个大概了解,但是对数据挖掘在实际中的实现过程不是很明白。例如要仿真算法,数据怎样导入?
以下为blog主人的回复:
每种软件实现的算法都要求有自己特定的文件、数据格式;可以体验下开源软件Weka
我的情况也差不多是这样。
不过我主要是WEB日志挖掘(购物网站),不知道是否了解哪里有相关测试的数据集?还有
apriori算法的测试数据http://www.almaden.ibm.com/cs/quest/syndata.html不知道测试数据在哪?可以下吗? |
|
回复:数据挖掘的数据集资源收集 网上资源
各个(游客)发表评论于2008/5/11 22:05:09 |
有没有二维的数据集合,可视化的以下为blog主人的回复: 没有用过。您也可以自动生成一些任意维度的数,如在matlab中 |
|
回复:数据挖掘的数据集资源收集 网上资源
清水幽萍(游客)发表评论于2007/12/27 14:39:02 |
非常感谢给的这些数据集!
我是一名在校研究生,研究方向定了数据挖掘,看了一些这方面的书,对其有了一个大概了解,但是对数据挖掘在实际中的实现过程不是很明白。例如要仿真算法,数据怎样导入?
以下为blog主人的回复:
每种软件实现的算法都要求有自己特定的文件、数据格式;可以体验下开源软件Weka |
|
|