Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2510757 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
回复:数据挖掘模型的评估问题  |
|
|
|
|
|
数据挖掘者 发表于 2007/5/19 22:09:42 |
|
|
|
在07-5-11,Changjiang写道:
Mr Zhang,我是一名大四学生,想请教你一下数据挖掘模型评估方面的问题。配置数据源,进行挖掘设置,选择挖掘算法,运行产生挖掘模型后,给出的结果很难让人信服。如那简单的购物篮分析来讲,产生关联规则和频繁集后,还是需要进一步分析才能弄清楚结果的含义。让某个不太懂数据挖掘的人一时很难获得应有的信息,是结果可视化的问题,还是模型评估的问题?我不太明白,希望给予解答和帮助。还有模型评估的资料从哪找啊?网上挺少的感觉? |
|
|
|
阅读全文(8913) | 回复(4) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
南京大学小百合BBS数据挖掘版精华  |
|
|
|
|
|
数据挖掘者 发表于 2006/5/24 22:38:07 |
|
|
|
[“智能信息检索论坛”旧贴回放系列]
在附件中:2_119.zip http://bbs.nju.edu.cn/cgi-bin/bbs/bbsadl2?board=DataMining (链接已失效,在南大小百合BBS上找不到数据挖掘版了)
目录: 1 本版讨论范围 ashun Aug 30 2001 2 斑竹之家 Nov 22 2001 3 网络资源 Apr 5 2002 4 好书介绍 Ap |
|
|
|
阅读全文(13593) | 回复(5) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
数据挖掘的10个常见问题 |
|
|
|
|
|
数据挖掘者 发表于 2006/3/14 13:32:23 |
|
|
|
摘自:小木虫论坛
Q1. Data Mining 和统计分析有什么不同?
硬要去区分Data Mining和Statistics的差异其实是没有太大意义的。一般将之定义为Data Mining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计理论所发展衍生,换另一个角度看,Data Mining有相当大的比重是由高等统计学中的多变量分析所支撑。但是为什么Data Mining的出现会引发各领域的广泛注意呢?主要原因在相较于传统统计分析而言,Data Mining有下列几项特性:
1.处理大量实际资料更强势,且无须太专业的统计背景去使用Data Mining的工具;   |
|
|
|
阅读全文(6939) | 回复(5) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
统计学和数据挖掘:交叉学科(转) |
|
|
|
|
|
数据挖掘者 发表于 2005/12/15 23:41:38 |
|
|
|
以前在www.dmgroup.org.cn/zongshu050322/hand_gb.doc上下载的一篇文章,不好意思,没找到作者是谁。
摘要:统计学和数据挖掘有很多共同点,但与此同时它们也有很多差异。本文讨论了两门学科的性质,重点论述它们的异同。
关键词:统计学 知识发现
1. 简介
统计学和数据挖掘有着共同的目标:发现数据中的结构。事实上,由于它们的目标相似,一些人(尤其是统计学家)认为数据挖掘是统计学的分支。这是一个不切合实际的看法。因为数据挖掘还应用了其它领域的思想、工具和方法,尤其是计算机学科,例如数据库技术和机器学习,而且它所关注的某些领域和统计学家所关注的有很大不同。
统计学和数据挖掘研究目标的重迭自然导致 |
|
|
|
阅读全文(6865) | 回复(3) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
机器学习教程幻灯片 |
|
|
|
|
|
数据挖掘者 发表于 2005/10/28 13:49:21 |
|
|
|
来源:http://www.cs.utexas.edu/users/mooney/cs391L 附件:Machine Learning Leture Slides-UTEXAS cs391.zip
这个是我原来读书时学习机器学习的参考材料,很不错的。因为在数据挖掘中有很多算法和模型来自机器学习领域,所以对数据挖掘的研究和实践都有帮助。
如果想进一步了解机器学习,建议大家看Tom Mitchell的“Machine Learning”一书,国内有中文版“机器学习”。
附件中包含如下PDF: ========= |
|
|
|
阅读全文(9124) | 回复(5) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
M2005, the 8th annual Data Mining Technology Conference |
|
|
|
|
|
数据挖掘者 发表于 2005/10/24 16:34:23 |
|
|
|
转自:http://www.sas.com/events/dmconf/index.html
M2005, the largest data mining conference in the world, kicks off in Las Vegas today
(24Oct05) Attendees at M2005, held in Las Vegas Oct. 24 and 25, will have a forum for exchanging ideas with hundreds of data mining practitioners and nearly 40 of the most respected data mining experts in the world. The conference will feature keynote addres |
|
|
|
阅读全文(5794) | 回复(0) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
数据挖掘技术及其应用现状 |
|
|
|
|
|
数据挖掘者 发表于 2005/10/11 13:59:03 |
|
|
|
转自:http://www.cioworld.net/cgi-new/violethtml/8/2004-02-17/20040217195351.html
時間:2004/02/17 來源:王斌会 吴载斌
摘要:随着计算机、网络技术的发展,获得有关资料已经非常简单易行。但是对于数量大、涉及面宽的数据,依靠以往那种由简单汇总、按指定模式去分析的统计方法是无法完成这类数据的分析。因此,一种智能化的、综合应用各种统计分析、数据库、智能语言来分析庞大数据资料的技术就应运而生,这就是目前国际上统计最热门的话题“数据挖掘”(Data Mi |
|
|
|
阅读全文(7155) | 回复(2) | 编辑 | 精华 | 删除 |
|
|
|
|
|
| | |