以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 人工智能 :: 机器学习|数据挖掘|进化计算 』  (http://bbs.xml.org.cn/list.asp?boardid=62)
----  求助!关于libsvm速度问题,谢谢!  (http://bbs.xml.org.cn/dispbbs.asp?boardid=62&rootid=&id=54160)


--  作者:ispotato
--  发布时间:10/22/2007 10:23:00 AM

--  求助!关于libsvm速度问题,谢谢!
由于数据集比较大,用libsvm运行3天了,还没有出结果,实在是太慢了。。。
不知道有并行的libsvm版本么?还是需要自己重新写呢?
以前上过并行算法的课,但都是理论分析,从没在集群上实践过,是否会很麻烦呢?
据说PC机搭建的小集群的速度也不是很快。。。
大家遇到这种数据集大,训练速度超级慢的情况都是怎么解决的呢?有没有什么建议呢?谢谢!

--  作者:DMman
--  发布时间:10/22/2007 1:42:00 PM

--  
换好机器。
把数据集采样后使用小数据集,svm算法和数据的大小关联比较小,只要数据集中含有支持向量就可以了,所以我个人觉得单纯的用svm没有必要超大数据集(当然 这种观点不一定对 有待专家指点)。
不知libsvm是在java、matlab还是什么环境下?matlab反正是奇慢无比。
--  作者:ispotato
--  发布时间:10/22/2007 2:22:00 PM

--  
是linux下的GCC编译器下,机器还可以,是双CPU的。
我看的那篇文献就是在全部数据集上作的,所以我也不无法自行减少数据量了,
还有别的办法吗?比如将svm并行化?


--  作者:DMman
--  发布时间:10/22/2007 3:16:00 PM

--  
请看下http://www.ieee.org.cn/dispbbs.asp?boardID=69&ID=50351该文及其评论中提到了数据量和时间的问题 对比下您的数据量的时间,看看是否正常?
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
44.922ms