在这个答案的后续内容中,我想问一下你们是否知道任何好的(更重要的是易于理解)教程和/或使用Weka工具包进行数据挖掘的例子.
自从我第一次听说它及其可以做的事情以来,我一直对数据挖掘非常感兴趣,我也有一些实验,我想用我的一些数据做,我已经买了四个书和我发现特别有趣的以下两个:
智能数据分析http://ecx.images-amazon.com/images/I/41CJNXchMrL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg 数据挖掘http://ecx.images- amazon.com/images/I/61DhYb1Z6QL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg
最后一个是由Weka的同一个作者写的,包含了很多例子,但我发现它有点难以理解逻辑,特别是数学.我的数学技能目前非常粗糙,我计划今年去大学,希望我能学习并能够更好地理解所涉及的数学,但在那之前我想在数据挖掘中获得一些练习.
有没有我可以阅读的示例数据的分步教程让我开始使用Weka工具包?
说到"应用"数据挖掘,对于初学者来说,你可能根本不需要考虑数学.Weka是大学机器学习项目的产物,提供100多种算法.与微软SQL服务器SSAS相比,它提供了九种算法 - 而且他们甚至懒得解释数学.
它们都提供关联,聚类,属性选择,某种神经网络.所以,诀窍是要了解你想要实现的目标,而不一定是下面的数学.尝试阅读有关Microsoft算法(良好文档)的信息,看看您是否能够找出SSAS和Weka的共同原则 - 这可以帮助您专注于基本原则并帮助您入门.
这里列出了一些Weka 教程.
就个人而言,我会使用RapidMiner5,因为它是一个超级简单的GUI环境(比v4好得多).它具有所有可用的WEKA功能.
快速通过这里获取:http://www.rapid-i.com
这里有超级简单的介绍视频到RapidMiner:
https://dspace.ndlr.ie/jspui/handle/10633/2353
这里:
http://www.neuralmarkettrends.com/
和这里:
http://www.youtube.com/user/VancouverData
如果您想了解有关数据挖掘背后的统计数据的更多信息,请参阅Google的Standford教授讲座系列:
http://www.youtube.com/watch?v=zRsMEl6PHhM&feature=related