公告
求真务实打基础, 宁缺毋滥读好书。
数据挖掘青年(DMman)
链接
Blog信息
blog名称:DMman(数据挖掘青年) 日志总数:102 评论数量:564 留言数量:57 访问次数:1752367 建立时间:2007年4月9日
[Weka] Weka中用于组合多个模型的的装袋、提升和堆栈 原创空间 , 软件技术
数据挖掘青年 发表于 2008/5/8 9:33:00
装袋、提升和堆栈都是用于组合多个模型的方法。 1装袋bagging :相同的分类器,各个分类器是独立的;使用同一个算法对样本多次训练,建立多个独立的分类器;最终的输出为各个分类器的投票(用于分类)或取平均值(用于数值预测)
2提升adaboost :相同的分类器,各个分类器不是独立的;使用同一个算法对样本迭代训练,后建立的分类器关注于先前建立的分类器不能更好处理的部分数据;最终的输出为各个分类器的加权投票。
3堆栈stack:组合多个不同的分类器(其间是独立的),作为0层分类器,对于他们各自的预测结果,并非采用投票的方式决定最终输出,而是在他们各自的
预测结果之上,建立一个元分类器(1层),元分类算法以0层各个分类器的预测结果作为训练数据建立分类器,决定最终输出结果。
weka中Explorer中的classify中选择
[Weka] 在自己的算法中调用Weka实现文本分类的一个例子 原创空间
数据挖掘青年 发表于 2007/7/4 17:47:57
1 介绍:嵌入式机器学习,在自己的算法中调用Weka现文本分类,是一个小的数据挖掘程序,虽然实用价值不是很大,但对于Weka的理解和使用是有帮助的。本例子来自《数据挖掘:实用机器学习技术》第2版(好像是倒数第三章)。大家可以到http://blogger.org.cn/blog/message.asp?name=DMman#23691 下载该书察看对算法的详细解释。算法中作了详细的注释,虽然是英文的,但还是比较简单。下面对例子的使用作了浅显的介绍,有兴趣的朋友可以研究。
2 功能:使用weka中的j48分类器实现了文本分类的一个小程序。文本文件通过weka的过滤器StringToWordVector预处理。
3 注意:把weka.jar加入你的classpath中,才可以通过编译。
4 使用方法: 命令行参数: -t 文本文件路径 -m 你的模型文件
[Weka] Weka如何连接数据库 原创空间
数据挖掘青年 发表于 2007/5/24 17:26:15
Weka如何连接数据库
作者:DMman(数据挖掘青年)
以SQL Server2000为例,使用jdbc-odbc桥的方式。其他的数据库操作方法一样,具体细节各异。
1 jdbc-odbc桥的方式不用安装驱动程序,我们在管理工具里面建个数据源。
2 修改 weka\experiment下的DatabaseUtils.props文件。
******************** 将weka安装目录下的weka.jar解压后 就可以
[Weka] 如何在weka中加入自己的算法 原创空间 , 心得体会
数据挖掘青年 发表于 2007/5/17 15:24:29
如何在weka中加入自己的算法
1、编写算法程序(这个是肯定的了)注意算法要符合weka的接口。 能接收prepare面板的数据。(DMman没有自己写过,细节方面不是很了解,请参见所附实例自行分析) 2、建立合理的目录。weka的目录和它的代码的包结构是一致的。 3、修改weka启动时加载的系统配置文件。
下面上传了我在网上下载的包括神经网络算法(包括l
[Weka] WEKA开发环境的建立(Windows+JCreator版) 原创空间
数据挖掘青年 发表于 2007/4/12 21:43:54
说明:JCreator功能比较少,如果你要研究weka源码,强烈建议使用eclipse或者nb,再加上GUI设计插件就简单多了!
DMman说明:1、本文假设你已经安装了JDK,并获得了weka的安装程序(3.4.10)。 2、关于weka源码:安装目录下有个weka-src.jar解压后就是源码。 3、DMman对JCreator的若干细节不甚了解,只是勉强在其下运行起来了weka。各位朋友如有建议,欢迎指教。
WEKA开发环境的建立(Windows+JCreator版)步骤:
1、将weka-src.jar解压后得到源码,位于weka目录下。在本地建立目录,我们假设建立了C:\myweka;在其下建立文件夹src、classes,将含有源码的weka目录放到src下。
2、打
[Weka] 转:WEKA开发环境的建立(Windows+NetBeans版) 网上资源
数据挖掘青年 发表于 2007/4/12 21:40:32
1. 下载安装JDK环境 JDK的最新版是6.0了,在这个页面可以找到它的下载 http://java.sun.com/javase/downloads/index.jsp 点击JDK 6之后的Download按钮,转到下载页面。选择Accepct,过一会儿页面会刷新。 我们需要的是这个 Windows Offline Installation, Multi-language jdk-6-windows-i586.exe 53.16 MB ,点击它下载
[Weka] weka源码学习界面编程(3)Explorer.java之PreprocessPanel.java 原创空间
数据挖掘青年 发表于 2007/4/11 21:33:11
Explorer.java 主要含两个Panel,布局的South:LogPanel,在weka.gui下定义;布局的Center:TabbedPanel,含六个子Panel。我们只看第一个:PreprecessPanel。由文件.java实现。
PreprocessPanel布局负责,好像有7层容器,由于其中的5个在weka.gui下定义,为了保持本代码的独立性,将这5个Panel用普通的JPanel代替,所以界面可能看上去不是很爽。
再者,本界面的按钮等功能都是通过添加 侦听器 实现的,联系复杂,为了保证代码独立性,本着学习设计界面的原则,在代码中被省略了。
为了使大家能够更好的了解Panel的层次结构,运行后的界面上,每个Panel都给出了ToolTipText,方便大家观察。
运行效果:
PreprocessPanel.java代码如下,可直接编译运行:
/* * PreprocessPanel.java * Copyright (C) 2003 Richard Kirkby, Len Trigg &nbs