我正在为即将开展的项目评估一个存储平台,并继续回到Cassandra.对于这个项目,丢失任何数据都是不可接受的.到目前为止,我们已经使用了一个关系数据库(Microsoft SQL Server),但数据变化多样,以至于它已成为存储和查询的问题.
Cassandra是否足够强大,可以用作主数据存储?或者它应该只用于镜像现有数据以加快访问速度?
有趣的是:是的,Twitter,Digg,Ooyala,SimpleGeo,Mahalo和其他人正在使用或转移到Cassandra作为主要数据存储(http://n2.nabble.com/Cassandra-users-survey-td4040068.html).
技术上:是的; 除了支持复制(包括多个数据中心),每个Cassandra节点都有一个fsync'd提交日志,以确保写入是持久的; 从那里写入转换为SSTables,它们在压缩之前是不可变的(它将多个SSTables与GC旧版本组合在一起).任何时候都支持快照,包括自动快照压缩前.