以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 XML 与 数据库 』  (http://bbs.xml.org.cn/list.asp?boardid=17)
----  [原创]挑战书  (http://bbs.xml.org.cn/dispbbs.asp?boardid=17&rootid=&id=49087)


--  作者:aoeiuu
--  发布时间:6/27/2007 2:31:00 PM

--  [原创]挑战书
挑战书
在信息“爆炸”时代,数据呈指数方式的递增,如何从数据中挖掘出有价值的信息,成为当今企业中技术人员,尤其管理人员关注的重点。于是各种数据挖掘软件适时而生,各种数据挖掘算法得到长足发展。数据挖掘技术日渐流行,为了比较各种挖掘软件的性能,各种挖掘算法的优劣,特此以Unica的Model为挑战目标,其目的在于相互学习,相互交流,共同发展。
内容范围:
1 响应:可预测客户对某个产品或服务的认知度,客户流失或兴趣迁移等。比如:寻找对某一特定的服务与产品最可能感兴趣的消费群体。
2 交叉销售:比如预测现有客户的新的购买趋向,或组合购买模式。比如:如果一个客户已经购买产品A与D,他最可能下一步购买什么:拨号、ISDN、专线、VPN、全球漫游、宽带?
3 客户分类:按照已有客户的消费数据对客户按一定属性分组。确定细分市场的定义属性。细致地分析客户的群组模式
4 客户价值评估:客户的忠诚度评估,利润贡献度评估。多方位地定量评估客户的价值,并根据许多特征属性预测特定客户群组的价值
数据源:分为训练集和测试集,一般为7:3左右。训练集用于建立模型,测试集用于检验模型。最好提供变量表,说明变量的名称,描述,属性。
算法:可以包括各种数据挖掘算法。可以提供您认为最好的算法和相应的数据。
结果评估:以最好地拟合测试集的模型为最优。如结果能以图形,尤其以提升图表示为佳。结果将在论坛上公布。
欢迎各个行业的数据分析和数据挖掘专家和技术人员,为共同提高数据的价值积极参与,共同进步。
联系人:wxg319@126.com,   QQ:185727577

这里提供一些数据和背景资料。现最好的模型以后再在论坛上公布。


--  作者:aoeiuu
--  发布时间:6/27/2007 2:55:00 PM

--  
响应分析
1 本案例的背景:
VIC(Veteran’s Clearinghouse,Inc.)是美国的一家国内机构,接受来自社会各个层次的捐助,以帮助退役老兵.
现开展一项捐助活动,不过数据库中有350万个捐助者信息,需要对他们进行逐个发EMIAL进行联络。但VIC公司想提高他们的响应率。尽可能地对潜在的捐助者发送信息。

2 数据库中变量描绘

变量名称 变量描绘
ID 捐助者的标识号-号码
DOB 捐助者出生日期
DOMAIN 捐助者出生地,用代码表示
CLUSTER 捐助者从第一次捐助到现在的年数
AGE 捐助者年龄
HOMEVAL 对捐助者家庭状况的评估值(分数)
RFA1-RFA10 对过去已经开展活动1-活动10的个人反应态度代码
CARDPROM 收到的卡片回馈次数
REC_PROMO_DT 最近收到的回馈 日期
NUMPROM 一生中收到的回馈总次数
CARDPM12 最近12个月收到的卡片回馈次数
NUMPRM12 最近12个月收到的回馈总次数
DON_ATM12-DON_ATM19 从第12次捐助活动到第19次捐助活动的捐助额度。
DON_ATM——LIFE 一生捐助的次数
NUMGIEF_LIFE 一生中捐助获得礼物的次数
CARDGIFT_LIFE 捐助后,收到的从卡片回馈中,礼物的总次数
MIN_DON_AMT 最小的一笔捐助额度,单位:元
MIN_DON_DT 最小的一笔捐助日期
MAX_DON_AMT 最大的一笔捐助额度,单位:元
MAX_DON_DT 最大的一笔捐助日期
REC_DON_AMT 最近的捐助额度,
AVG_DON 客户的平均捐助额度,单位:元
CLUSTER_2 礼物类别代码
RESPONSE 客户是否响应的标识码  0表示不响应  1 表示响应
 
为了更好地命中潜在的客户,VIC的管理者从数据库中随机抽取5388个捐助者信息,并逐一发送EMAIL,并根据反馈情况予以登记,以变量RESPONSE标识,0表示不响应  1 表示响应,利用这5388个捐助者信息进行建模,得出模型。
本例子给出的一个数据表(*。dat),另一个是数据字典(*.dct),说明字段名称,属性等等。(都可以以记事本打开)。您可以随机抽样建立训练集合和测试集合。比例大致7:3,建立和检验模型。


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
42.969ms