Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2492241 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
Yahoo数据挖掘成功案例 |
|
|
|
|
|
数据挖掘者 发表于 2005/11/9 10:11:06 |
|
|
|
译自:KDnuggets:News:2005:n21:item3(http://www.kdnuggets.com/news/2005/n21/3i.html)
From: Gregory Piatetsky-Shapiro Date: 7 Nov 2005 Subject: Usama Fayyad Interview 5: on Yahoo Data Mining Successes
Usama Fayyad博士是Yahoo!的首席数据官,KDnuggets的Gregory对他进行了访谈。
Gregory Piatetsky-Shapiro:您可以介绍一些Yahoo!在数据挖掘方面的成功案例吗?
Usama Fayyad:Yahoo!是第一家招募了首席数据官的公司,以验证数据对公司而言,的确 |
|
|
|
阅读全文(9713) | 回复(3) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
2005年电信业商业智能大会召开 |
|
|
|
|
|
数据挖掘者 发表于 2005/9/15 13:55:01 |
|
|
|
转自:http://www.billingchina.com/meeting/bi2005/index.asp
2005年9月14-15日 北京
根据国际上建设实施商业智能(以下简称BI)系统的经验,BI系统从开始建设到为企业提供有力的营销支持需要5-7年的时间。在系统建设实施的初期,数据积累和数据沉淀和完善的数据仓库需要大量的资源投入。数据分析方面的应用通常是在2-3年后大规模开展。
国内大部分运营商在经历了两年的大规模建设之后,基本完成了BI系统的一期建设,实现了规划中的基本功能,在一定程度上满足了公司在营销工作中的需求。但目前BI系统的整体效果与运营商的期望值之间的还存在着较大差距,以系统自身功能的建设重点开始逐渐走向进一步扩展更深层次的面向业务部门的更多的应用:加大主题和专题分析,扩展数据来源,优化数据仓库,深入数据挖掘,完善系统架构,从而切实提高系统的应用水平,对营销活动提 |
|
|
|
阅读全文(3355) | 回复(0) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
当当的交叉销售 |
|
|
|
|
|
数据挖掘者 发表于 2005/7/19 13:39:32 |
|
|
|
本贴包含了我在数据仓库之路论坛上的回贴:
repou: 当当的交叉销售。买Zippo,提示
购买过该商品的顾客还购买过这些商品 (1).黑曜石手链 (2).芊娟吸油纸(体验装) (3).爱丽丝漫游奇境(世界十大著名哲理童话,彩色插图本) (4).激励女人:55篇女性喜与悲、感动与成长的故事 (5).zippo-打火机专用棉线 (6).感谢你,大五郎:亚马逊书店五星级畅销书 (7).绿檀佛珠手链 (8).火玛瑙手链 (9).美丽人生:获28项国际大奖(简装DVD) (10).哆啦A梦“冰一冰”双效护眼罩
呵呵 差好远啊
qinghero: 有意思。说明了什么问题? 好像里面有些东西很女性化的呀?
bruce_lee: 呵呵,我觉得亚马逊的交叉销售做的比较好,现在对web的点击流做挖掘好像是一个大趋势呀,尤其是关联分析,在一些专业性很强的电子商务网站上还是有很多应用空间的!
casoline: 据说当当的交叉销售并没有采用关联分析,好像是直接的SQL查询做出的,没有关联分析中最小支持度和可信度的限制。不知道国外是怎么做的?请教中
Sunstone: 分析应重于技术手段
我同意楼上的看法,当当的交叉销售看起来只是进行了SQL查询,把包含Zippo的交易中的其它商品按频次排序,然后输出了To |
|
|
|
阅读全文(3313) | 回复(0) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
关于聚类咨询一个问题 |
|
|
|
|
|
数据挖掘者 发表于 2005/7/19 13:27:06 |
|
|
|
本贴包含了我在数据仓库之路论坛上的回贴:
kaoro: 关于聚类咨询一个问题。对一个公司员工对企业的满意度调查,得到的样本以5、3、1、-1这样的数据来表示,直接用这些离散数据进行标准化(是否有标准化的需要?),然后主成分分析(把38个指标表示成12个),再利用系统聚类法中的最小方差法,得到7个类比较满意。 但是老师和师兄都说聚类方法只适用于连续数据,那么我是否需要把初始数据转化成连续的再作,还是说通过其他聚类方法呢?查了好久,还是没找到结果,初学者,请大家多多指教。
neptune: 试试clementine的kohonen算法,是个基于神经网络的聚类算法控件,被推荐应用于许多行业的聚类分析应用中。
civilstar: 的确,聚类分析的前提事连续变量,因此,我认为需要进行前期处理
cm0531: 同感。在进行顾客细分研究中经常假设一个价格区间和购买数量区间,最终得到的消费额也是离散的。同时收入水平等也是离散的,聚类也碰到类似如何标准化的问题。不知道楼主的这个问题解决了没有。如果有办法,敬请指教一二。
范蠡: 关注中
seabiscuit: 关注中
Sunstone: 聚类中的变量类型及标准化
首先关于变量类型的问题:kaoro给出的满意度数据应该是次序型变量,变量值之间 |
|
|
|
阅读全文(4891) | 回复(4) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
SAS V8的组件列表 |
|
|
|
|
|
数据挖掘者 发表于 2005/7/15 14:53:21 |
|
|
|
SAS V8的组件信息(\SAS v8\SAS\core\sasinst\data.zh\目录下的所有ini文件):
组件名称
说明
存储空间(M)
Base SAS
“SAS 系统”的基础,提供数据访问、管理、分析和展示功能
510
Core of SAS System
SAS 系统的核心
151614
IT Service Vision
IT Service Vision
1549
(下面还有66字) |
|
|
|
阅读全文(2860) | 回复(0) | 编辑 | 精华 | 删除 |
|
|
|
|
|
| | |