新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   >>中国XML论坛<<     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Oracle, SQL Server与XML,XML在数据挖掘中的应用, PMML.
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - 高级XML应用『 XML 与 数据库 』 → [原创]挑战书 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 7181 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [原创]挑战书 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     aoeiuu 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:56
      门派:XML.ORG.CN
      注册:2007/6/27

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给aoeiuu发送一个短消息 把aoeiuu加入好友 查看aoeiuu的个人资料 搜索aoeiuu在『 XML 与 数据库 』的所有贴子 引用回复这个贴子 回复这个贴子 查看aoeiuu的博客楼主
    发贴心情 [原创]挑战书

    挑战书
    在信息“爆炸”时代,数据呈指数方式的递增,如何从数据中挖掘出有价值的信息,成为当今企业中技术人员,尤其管理人员关注的重点。于是各种数据挖掘软件适时而生,各种数据挖掘算法得到长足发展。数据挖掘技术日渐流行,为了比较各种挖掘软件的性能,各种挖掘算法的优劣,特此以Unica的Model为挑战目标,其目的在于相互学习,相互交流,共同发展。
    内容范围:
    1 响应:可预测客户对某个产品或服务的认知度,客户流失或兴趣迁移等。比如:寻找对某一特定的服务与产品最可能感兴趣的消费群体。
    2 交叉销售:比如预测现有客户的新的购买趋向,或组合购买模式。比如:如果一个客户已经购买产品A与D,他最可能下一步购买什么:拨号、ISDN、专线、VPN、全球漫游、宽带?
    3 客户分类:按照已有客户的消费数据对客户按一定属性分组。确定细分市场的定义属性。细致地分析客户的群组模式
    4 客户价值评估:客户的忠诚度评估,利润贡献度评估。多方位地定量评估客户的价值,并根据许多特征属性预测特定客户群组的价值
    数据源:分为训练集和测试集,一般为7:3左右。训练集用于建立模型,测试集用于检验模型。最好提供变量表,说明变量的名称,描述,属性。
    算法:可以包括各种数据挖掘算法。可以提供您认为最好的算法和相应的数据。
    结果评估:以最好地拟合测试集的模型为最优。如结果能以图形,尤其以提升图表示为佳。结果将在论坛上公布。
    欢迎各个行业的数据分析和数据挖掘专家和技术人员,为共同提高数据的价值积极参与,共同进步。
    联系人:wxg319@126.com,   QQ:185727577

    这里提供一些数据和背景资料。现最好的模型以后再在论坛上公布。


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/6/27 14:31:00
     
     aoeiuu 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:56
      门派:XML.ORG.CN
      注册:2007/6/27

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给aoeiuu发送一个短消息 把aoeiuu加入好友 查看aoeiuu的个人资料 搜索aoeiuu在『 XML 与 数据库 』的所有贴子 引用回复这个贴子 回复这个贴子 查看aoeiuu的博客2
    发贴心情 
    响应分析
    1 本案例的背景:
    VIC(Veteran’s Clearinghouse,Inc.)是美国的一家国内机构,接受来自社会各个层次的捐助,以帮助退役老兵.
    现开展一项捐助活动,不过数据库中有350万个捐助者信息,需要对他们进行逐个发EMIAL进行联络。但VIC公司想提高他们的响应率。尽可能地对潜在的捐助者发送信息。

    2 数据库中变量描绘

    变量名称 变量描绘
    ID 捐助者的标识号-号码
    DOB 捐助者出生日期
    DOMAIN 捐助者出生地,用代码表示
    CLUSTER 捐助者从第一次捐助到现在的年数
    AGE 捐助者年龄
    HOMEVAL 对捐助者家庭状况的评估值(分数)
    RFA1-RFA10 对过去已经开展活动1-活动10的个人反应态度代码
    CARDPROM 收到的卡片回馈次数
    REC_PROMO_DT 最近收到的回馈 日期
    NUMPROM 一生中收到的回馈总次数
    CARDPM12 最近12个月收到的卡片回馈次数
    NUMPRM12 最近12个月收到的回馈总次数
    DON_ATM12-DON_ATM19 从第12次捐助活动到第19次捐助活动的捐助额度。
    DON_ATM——LIFE 一生捐助的次数
    NUMGIEF_LIFE 一生中捐助获得礼物的次数
    CARDGIFT_LIFE 捐助后,收到的从卡片回馈中,礼物的总次数
    MIN_DON_AMT 最小的一笔捐助额度,单位:元
    MIN_DON_DT 最小的一笔捐助日期
    MAX_DON_AMT 最大的一笔捐助额度,单位:元
    MAX_DON_DT 最大的一笔捐助日期
    REC_DON_AMT 最近的捐助额度,
    AVG_DON 客户的平均捐助额度,单位:元
    CLUSTER_2 礼物类别代码
    RESPONSE 客户是否响应的标识码  0表示不响应  1 表示响应
     
    为了更好地命中潜在的客户,VIC的管理者从数据库中随机抽取5388个捐助者信息,并逐一发送EMAIL,并根据反馈情况予以登记,以变量RESPONSE标识,0表示不响应  1 表示响应,利用这5388个捐助者信息进行建模,得出模型。
    本例子给出的一个数据表(*。dat),另一个是数据字典(*.dct),说明字段名称,属性等等。(都可以以记事本打开)。您可以随机抽样建立训练集合和测试集合。比例大致7:3,建立和检验模型。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2007/6/27 14:55:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML 与 数据库 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/11/23 12:57:42

    本主题贴数2,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms