«July 2025»
12345
6789101112
13141516171819
20212223242526
2728293031

公告

欢迎到我的另一个家:http://haonan917.blog.163.com/ 。You can contact me at 163.com@haonan917.


导航
首页(102)
ComputerBy-talk(5)
商业智能(19)
English(6)
JAVA(5)
数据库(5)
读书笔记(1)
我爱电影(2)
数据挖掘(40)
开心一刻(5)
天下杂谈(14)
网易之道(3)

最新更新
国际版淘宝--速卖通多个职位虚位以待!
我的新浪微博,欢迎关注与交流
互联网产品数据化运营(一)氛围
一个合格数据分析人员的能力
TTNN BI观点 线下活动聚会——北京
网络用户行为挖掘的营销应用小结(转载)
新书介绍:Avinash的《网站分析2.
网站流量数据分析技巧【转】
libsvm-2.88中文帮助文档
2008,商业智能从业者曾如是说

新回复
回复:Apriori-java实现源码
回复:终于成功安装带EM的SAS9.1.
回复:终于成功安装带EM的SAS9.1.
回复:终于成功安装带EM的SAS9.1.
回复:终于成功安装带EM的SAS9.1.
回复:Apriori-java实现源码
回复:终于成功安装带EM的SAS9.1.
回复:互联网产品数据化运营(一)氛围
回复:互联网产品数据化运营(一)氛围
回复:终于成功安装带EM的SAS9.1.

留言
签写新留言

毕业论文
硕士论文写的什么方向,借点光
学习交流
1111
zzzzzz
急死我了
求助
请教
联系
请联系我

blog信息
blog名称:DMFighter(数据挖掘斗士)
日志总数:102
评论数量:527
留言数量:17
访问次数:909535
建立时间:2007年8月22日

链接

 我的HappyFranc

BICubes商务智能社区

     TTNN

SAS中文论坛

数据挖掘者博客

数据挖掘青年的博客

挖掘与人生

神威智能挖掘中心

神威异度空间

陆振波个人空间

Jerome's BI BLOG

Junelf's BLOG

Focus on BI'Blog

weka中文站论坛

weka英文站

数据挖掘讨论组

DataSciencesAnalyticsWebolg

数据挖掘研究院

ACM KDD Group

DataMining Course

中国商业智能网

 
















 


 把数据转化成智慧,并执行之

本站首页    管理页面    写新日志    退出

[数据挖掘]数据挖掘初学者大礼包之二
DMFighter 发表于 2008/12/23 10:39:30

   本文转载自:http://shzxqdj.blog.163.com/blog/   数据挖掘交流讨论(3,答Freshm 2008-12-9的留言) 博士你好: 从事数据挖掘应用,要打好那些基础,望结合您的经验给予详细指导,以及给一点应用于移动方面的实践案例。 我的回复:不好意思,我不是博士,请别叫我博士。非常高兴跟你交流数据挖掘的应用。数据挖掘因为是个综合性应用,涉及的专业知识很多(有数据仓库、统计专业、编程能力、展示展现技术、挖掘技能、所具体应用的相关业务能力),但是真正从数据挖掘项目实践的角度讲,沟通能力和对挖掘的兴趣爱好是最重要的,有了爱好才可以愿意钻研,有了不错的沟通能力,才可以正确理解业务问题,才能正确把业务问题转化成挖掘问题,才可以在相关不同专业人才之间清楚表达你的意图和想法,取得他们的理解和支持。所以我认为沟通能力和兴趣爱好是个人的数据挖掘的核心竞争力,是很难学到的;而其他的相关专业知识谁都可以学,算不上个人发展的核心竞争力。 除了最重要的沟通能力和兴趣爱好外,在专业能力培养中,如果你一定要排个先后次序的话, 一方面看你职业兴趣的侧重点,另一方面对于数据挖掘的应用来说,我觉得数据挖掘技能可能是相对而言最重要的, 因为数据挖掘作为一个典型的团队作业,一个人不可能完成所有相关专业的工作,而其中数据挖掘能力可能是挖掘实践中专业能力的核心,当然相关业务的能力同样(甚至更)重要,比如做数据库营销时,你不但应该有好的挖掘技能,你更应该是个市场营销专家。所以国内外面临数据挖掘复合型人才缺乏时,一致公认的好的解决办法是让业务人员学习挖掘技能(这比让挖掘技术人员学习业务技能更有效、更合理)。 说到这里可能很多数据仓库专家、程序员、统计师等等都要扔砖头了,对不起,我没有别的意思,你们的专业对于数据挖掘都很重要,大家本来就是一个整体的,但是作为单独一个个体的人来说,精力有限,时间有限,不可能这些领域都能掌握,在这种情况下,选择最重要的核心,我想应该是数据挖掘技能和相关业务能力吧(从另外的一个极端的例子,我们可以看, 比如一个迷你型的挖掘项目,一个懂得市场营销和数据挖掘技能的人应该可以胜任。这其中他虽然不懂数据仓库,但是简单的Excel就足以胜任高打6万个样本的数据处理;他虽然不懂专业的展示展现技能,但是只要他自己看的懂就行了,这就无需什么展示展现;前面说过,统计技能是应该掌握的,这对一个人的迷你项目很重要;他虽然不懂编程,但是专业挖掘工具和挖掘技能足够让他操练的;这样在迷你项目中,一个懂得挖掘技能和市场营销业务能力的人就可以圆满完成了,甚至在一个数据源中根据业务需求可以无穷无尽的挖掘不同的项目思路,试问就是这个迷你项目,单纯的一个数据仓库专家、单纯的一个程序员、单纯的一个展示展现技师、甚至单纯的一个挖掘技术专家,都是无法胜任的)。这从另一个方面也说明了为什么沟通能力的重要,这些个完全不同的专业领域,想要有效有机地整合在一起进行数据挖掘项目实践,你说没有好的沟通能力行吗? 数据挖掘能力只能在项目实践的熔炉中提升、升华,所以跟着项目学挖掘是最有效的捷径。国外学习挖掘的人都是一开始跟着老板做项目,刚开始不懂不要紧,越不懂越知道应该学什么,才能学得越快越有效果。我不知道国内的数据挖掘学生是怎样学的,但是从网上的一些论坛看,很多都是纸上谈兵,这样很浪费时间,很没有效率。 另外现在国内关于数据挖掘的概念都很混乱,很多BI只是局限在报表的展示和简单的统计分析,却也号称是数据挖掘;另一方面,国内真正规模化实施数据挖掘的行业是屈指可数(银行、保险公司、移动通讯),其他行业的应用就只能算是小规模的,比如很多大学都有些相关的挖掘课题、挖掘项目,但都比较分散,而且都是处于摸索阶段,但是我相信数据挖掘在中国一定是好的前景,因为这是历史发展的必然,呵呵。 讲到移动方面的实践案例,如果你是来自移动的话,你一定知道国内有家叫华院分析的公司(申明,我跟这家公司没有任何关系,我只是站在数据挖掘者的角度分析过中国大多数的号称数据挖掘服务公司,觉得华院还不错,比很多徒有虚名的大公司来得更实际),他们的业务现在已经覆盖了绝大多数中国省级移动公司的分析挖掘项目,你上网搜索一下应该可以找到一些详细的资料吧。我对华院分析印象最深的一点就是2002年这个公司白手起家,自己不懂不要紧,一边自学一边开始拓展客户,到现在在中国的移动通讯市场全面开花,的确佩服佩服呀。他们最开始都是用EXCEL处理数据,用肉眼比较选择比较不同的模型,你可以想象这其中的艰难吧。这个故事其实也告诉我们,数据挖掘也是可以创造一些神奇的故事的,你说呢? 至于移动通讯的具体的数据挖掘的应用,那太多了,比如不同话费套餐的制订、客户流失模型、不同服务交叉销售模型、不同客户对优惠的弹性分析、客户群体细分模型、不同客户生命周期模型、渠道选择模型、恶意欺诈预警模型,太多了,记住,从客户的需求出发,从实践中的问题出发,移动中可以发现太多的挖掘项目。最后告诉你一个秘密,当你数据挖掘能力提升到一定程度时,你会发现无论什么行业,其实数据挖掘的应用有大部分是重合的相似的,这样你会觉得更轻松。 以上是个人的浅见,仅供参考,祝挖掘快乐!

阅读全文(5251) | 回复(1) | 编辑 | 精华


回复:数据挖掘初学者大礼包之二
Freshman_DM(游客)发表评论于2008/12/29 19:59:01

哈哈~傅兄确实是个有心人,上面的内容是我在shzxqdj的博客 中的留言都被你挖到这了,太强了,数据挖掘人士应该向你好好学习 :)   我是hero

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除


» 1 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)
                                                                                                                                                 
                                                                                                                                     

                                                                      

站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.047 second(s), page refreshed 144752991 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号