首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2492752
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
SAS公司CEO Jim Goodnight访谈 
数据挖掘者 发表于 2007/1/25 18:05:09
转自:http://sasor.feoh.net/modules.php?name=News&file=categories&op=newindex&catid=1 SAS的创始人和CEO Jim Goodnight,他担任这个职位刚刚超过30年,而他领导的公司创造了统计分析。ZDNet UK采访了在日内瓦参加公司年会的Goodnight,采访中向他问起了 SAS下一个核心软件版本、应用开发的未来、他的计划,以及他的生活计划。 30年前,Jim Goodnight和John Sall成立了一家名为SAS Institute的公司(现名为SAS),并将这家公司培养为一家拥有17亿英镑营业额的大型软件开发和人力资源管理厂商。 在这些年里,Goodnight一直严格地管理着这家公司,让它成长为大型应

阅读全文(2741) | 回复(0) | 编辑 | 精华 | 删除
Weka入门教程(3)
数据挖掘者 发表于 2007/1/18 22:35:42
转自:http://bbs.wekacn.org/viewtopic.php?t=9

3. 分类与回归
背景知识
WEKA把分类(Classification)和回归(Regression)都放在“Classify”选项卡中,这是有原因的。
在这两个任务中,都有一个目标属性(输出变量)。我们希望根据一个样本(WEKA中称作实例)的一组特征(输入变量),对目标进行预测。为了实现这一目的,我们需要有一个训练数据集,这个数据集中每个实例的输入和输出都是已知的。观察训练集中的实例,可以建立起预测的模型。有了这个模型,我们就可以新的输出未知的实例进行预测了。衡量模型的好坏就在于预测的准确程度。
在WEKA中,待预测的目标(输出)被称作Class属性,这应该是来自分类任务的“类”。一般的,若Class属性是分类型时我们的任务才叫分类,

阅读全文(55029) | 回复(22) | 编辑 | 精华 | 删除
Weka入门教程(2)
数据挖掘者 发表于 2007/1/18 22:33:01
转自:http://bbs.wekacn.org/viewtopic.php?t=9

3.数据准备

使用WEKA作数据挖掘,面临的第一个问题往往是我们的数据不是ARFF格式的。幸好,WEKA还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的。此外,WEKA还提供了通过JDBC访问数据库的功能。
在这一节里,我们先以Excel和Matlab为例,说明如何获得CSV文件。然后我们将知道CSV文件如何转化成ARFF文件,毕竟后者才是WEKA支持得最好的文件格式。面对一个ARFF文件,我们仍有一些预处理要做,才能进行挖掘任务。

.* -> .csv
我们给出一个CSV文件的例子(
阅读全文(24349) | 回复(6) | 编辑 | 精华 | 删除
Weka入门教程(1)
数据挖掘者 发表于 2007/1/18 22:29:16
转自:http://bbs.wekacn.org/viewtopic.php?t=9

目录
1. 简介
2. 数据格式
3. 数据获取与预处理
3. 关联规则(购物篮分析)
4. 分类与回归
5. 聚类分析


1. 简介

WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEK
阅读全文(45777) | 回复(11) | 编辑 | 精华 | 删除
[转] ERP的下一个浪潮BI,当SAP遇到SAS
数据挖掘者 发表于 2007/1/18 10:48:27
http://www.amteam.org/static/69388.html ERP的下一个浪潮BI,当SAP遇到SAS
 企业资源管理-ERP>TONY在线>综合 文档号:00.069.388 发布时间:10-08-2005

在管理应用软件市场中,SAP可以说是一个绝对的领导者,从2001年度到2004年度,全球企业管理应用软件厂商TOP 100中,SAP一直稳居
阅读全文(3635) | 回复(0) | 编辑 | 精华 | 删除
关于“超大容量级数据挖掘商业解决方案”
数据挖掘者 发表于 2006/4/26 22:31:08
摘自:http://www.dmresearch.net/bbs/viewthread.php?tid=4461&extra=page%3D1
这个是我在数据挖掘研究院网站上的回复,转载如下: ljxgg:请大虾们赐教:拜求超大容量级数据挖掘商业解决方案!

小女子现在项目进行中遇到瓶颈,信息数据量太大,只能通过商业方案来解决!望知晓哪个公司(如IBM,Sybase,Oracle之类)做过超大容量级数据挖掘解
阅读全文(4551) | 回复(1) | 编辑 | 精华 | 删除
中国电信业BI系统建设全面分析
数据挖掘者 发表于 2006/3/20 17:08:00
转自:http://tech.ccidnet.com/art/14/20050623/273239_1.html
作者:林德  来源:中国信息化用户 随着市场的不断发展,企业在垄断资源和产品价格上的竞争优势越来越淡化,企业竞争逐步呈现出新的特点。由于未来通信市场发展具有很大的不确定性,短期内靠推出某种新技术或者新产品来获得产业高速发展的可能性越来越小。当外部环境优势得到充分利用之后,对内部资源的深层次开发利用理所当然成为首选。于是,"内部挖潜"、"向管理要效益"、"打造核心竞争力"等越来越多地开始被电信行业人士提起。电信运营商所追求的核心目标就是提高运营效率,降低成本,同时建立满足客户需求的市场营销能力。利用IT技术提高电信运营商对市场的快速反应能力无疑是最好的选择。 用BI
阅读全文(4059) | 回复(0) | 编辑 | 精华 | 删除
《Excel在统计中的应用》
数据挖掘者 发表于 2006/3/15 13:09:41
《Excel在统计中的应用》
作者:林飞
下载:http://www.riskage.com/main/Article/UploadFiles/excelstatslf.pdf

目录:

第一节  中文Excel概述.....................3
  一、中文Excel简介.......................3
  二、Excel 的安装和启动..................5
  三、Excel 工作界面简介..................6
第二节  Excel 基本操作....................8
  一、Excel 操作方法概述..................8
  二、文件基本操作..............
阅读全文(7253) | 回复(4) | 编辑 | 精华 | 删除
« 1 2 3 4 5 6 7 »


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.387 second(s), page refreshed 144774946 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号