当前位置:  开发笔记 > 编程语言 > 正文

数据挖掘开源工具

如何解决《数据挖掘开源工具》经验,为你挑选了5个好方法。

我打算开展一个涉及数据挖掘的项目.在我加入之前,我想探索一下允许基于Web的报告的不同数据挖掘工具(最好是开源).在我的场景中,数据将提供给我,所以我不应该抓它.

简而言之,我正在寻找一种工具 - 数据分析,基于Web的报告,提供某种仪表板和挖掘功能.

我曾经参与过微软分析服务和BOXI,最近我一直在寻找Pentaho,这似乎是一个不错的选择.

请分享您对任何此类工具的经验.

干杯



1> Alix Axel..:

我相信WEKA是最好的开源DM软件.

检查一下:http://www.cs.waikato.ac.nz/ml/weka/



2> ybakos..:

Weka很棒,但您可能想尝试使用Orange Data Mining工具包.

http://www.ailab.si/orange/

编辑:截至2010年11月,我必须说我真的很喜欢KNIME.


KNIME为+1.几个星期前我发现了这一点,并且对它能做的事情印象非常深刻.支持Java,Python和R脚本,BIRT附加组件使编写报告变得轻而易举.

3> Shane..:

R有很多与数据挖掘相关的优秀软件包.特别要看:

关于CRAN的机器学习视图.

CRAN上的自然语言处理视图.

它也与Weka联系在一起(参见RWeka包).它可以与.Net(通过COM)或Python(通过RPy或RPy2)集成.

我同意Pentaho的报告平台,虽然这是一个非常大的项目,取决于你使用它的目的.



4> 小智..:

您还应该查看Apache Mahout.它对于某些大规模机器学习任务(例如用户群集)非常有用.



5> 小智..:

RapidMiner是我首选的数据挖掘工具.

推荐阅读
oDavid_仔o_880
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有