我打算开展一个涉及数据挖掘的项目.在我加入之前,我想探索一下允许基于Web的报告的不同数据挖掘工具(最好是开源).在我的场景中,数据将提供给我,所以我不应该抓它.
简而言之,我正在寻找一种工具 - 数据分析,基于Web的报告,提供某种仪表板和挖掘功能.
我曾经参与过微软分析服务和BOXI,最近我一直在寻找Pentaho,这似乎是一个不错的选择.
请分享您对任何此类工具的经验.
干杯
我相信WEKA是最好的开源DM软件.
检查一下:http://www.cs.waikato.ac.nz/ml/weka/
Weka很棒,但您可能想尝试使用Orange Data Mining工具包.
http://www.ailab.si/orange/
编辑:截至2010年11月,我必须说我真的很喜欢KNIME.
R有很多与数据挖掘相关的优秀软件包.特别要看:
关于CRAN的机器学习视图.
CRAN上的自然语言处理视图.
它也与Weka联系在一起(参见RWeka包).它可以与.Net(通过COM)或Python(通过RPy或RPy2)集成.
我同意Pentaho的报告平台,虽然这是一个非常大的项目,取决于你使用它的目的.
您还应该查看Apache Mahout.它对于某些大规模机器学习任务(例如用户群集)非常有用.
RapidMiner是我首选的数据挖掘工具.