我正在为我们的网站构建一些报告内容(一个体面的网站,每天可以获得数百万的综合浏览量),我想知道是否有任何好的免费/开源数据仓库系统.
具体来说,我只寻找存储数据的东西 - 我计划为它构建一个自定义前端/ UI,以便显示我们关心的信息.但是,我不想为此构建一个自定义数据库,虽然我很确定SQL数据库在这里不起作用,但我不确定要使用什么.任何指向有用文章的指针也将受到赞赏.
编辑:我应该提一下 - 我简要介绍过的一个数据库是MongoDB.它似乎可能有用,但他们的"用例"特别提到数据仓库为"不太适合":http://www.mongodb.org/display/DOCS/Use+Cases.此外,它似乎并不专门针对数据仓库.
http://www.hypertable.org/ 可能正是您正在寻找的(我将通过上面的描述)来存储大量已记录的数据并进行规范化.即访客日志.
Hypertable基于谷歌的bigTable项目. 有关基准测试,请参阅http://code.google.com/p/hypertable/wiki/PerformanceTestAOLQueryLog
你失去了基于SQL的dbs的关系功能,但你在性能上获得了很多.你可以轻松地使用超强每小时存储数百万行(可承受硬盘空间).
希望有所帮助