我对NoSQL系统并不十分熟悉,但我记得有一段时间他们认为它们是处理统计数据的理想选择.
由于我即将开始编写将记录"每天注册了多少用户"等数据的代码,我想我可以利用这个机会了解更多有关NoSQL的信息,如果它符合要求的话.
如果NoSQL确实是理想的,你能否提供一些有关原因的信息?哪种特定系统最适合这种特殊需求?
因此,在第一个答案之后,也许有必要澄清一点.
我目前有一个PostgreSQL数据库,我将从中获取数据.它将非常简单,无需计算.例如,我将获得一个结果集,其中包含过去一个月每天注册的用户数量(因此它基本上只是一组日期/用户的值对)并将其保存在另一个表/数据库中.
谢谢!
这取决于你将对这些统计数据进行哪种分析.如果您要进行大量不同的操作(平均,求和,加入......),您可能会发现NoSQL解决方案更难以实现它们的价值.
但是,如果您存储的统计信息主要用于显示目的,或者用于非常特定的分析例程,NoSQL解决方案开始闪耀.
如果你的数据足够小,坚持使用SQL解决方案,这将提供一个完整的查询引擎的好处,但如果你有很多值(每天一个值是没有的,即使你运行了一百万多年来,并且担心存储大小和性能,NoSQL选项再一次可能是值得的.
如果您的数据是半结构化的,请查看CouchDB,它提供了一些基本的索引和查询支持,这可以为分析例程提供一些基础.如果您要存储结构非常少的单个值,我最好的建议是看看Tokyo Cabinet和Tokyo Tyrant,它们是键值存储绝对令人难以置信的选择.