楼主您好, 谢谢你的分享。
我想请教楼主一个关于weka聚类的问题。在weka中的attribute是有顺序的,比如说一个instance有5个属性,取值分别为a b c d e,另外一个instance的对应的属性值为b d e a c,则这2个instance被认为是不同的。 但我现在的数据集中属性是没有顺序的, 上面的2个instance在我的数据集中是完全一样的,应该被划在同一个cluster里。也就是说只要值abcde分别出现在不同的5个位置, 这些instance就是一样的。所以在我的数据集中,如果有4个instance: a b d e c, c d c e b, d e f c b, g h f a i, 则前3个该被分为一个cluster,最后一个自成一个cluster,因为前3个instance中至少有4个值是相同的,而最后一个的值却很不同。 请问weka可以实现这样的属性无顺序的聚类吗?谢谢。 我的邮箱gyzhen1@163.com
以下为blog主人的回复:
您所说的算法Weka中没有。而且处理这类聚类问题的算法我也没有见过。因为聚类算法的核心标准就是距离的定义,属性没有顺序应该预处理一下。bty,您的数据为什么没有属性的顺序?天生没有,还是采集的时候不一致?
Hi DMman ! 为什么我把weka的源代码倒入eclipse之后 会出现许多分号错误 类似于不应该在for while 之后加上分号??
以下为blog主人的回复:
我没有出现过那样的错误.在eclipse中倒入Weka,我实现的比较顺利,Weka源码本身应该不会有错误的.可以参考一个网友整理的:http://www.ieee.org.cn/dispbbs.asp?boardID=69&ID=48633