我正在尝试使用hadoop练习一些数据挖掘算法.我可以单独使用HDFS,还是需要使用像hive/hbase/pig这样的子项目?
我找到了一个大学网站,其中包含一些仅在Hadoop上构建的MapReduce练习和解决方案:
http://www.umiacs.umd.edu/~jimmylin/Cloud9/docs/index.html
另外还有雅虎和谷歌的课程:
http://developer.yahoo.com/hadoop/tutorial/
http://code.google.com/edu/parallel/index.html
所有这些课程都适用于简单的Hadoop,以回答您的问题.