我一直在为我们的一些项目寻找一个好的NoSQL数据库已经有一段时间了,我最近发现从.NET支持的角度看起来非常棒的RavenDB,所以我决定尝试一下并编写一些基准.第一项业务是使用以下代码测试插入速度:
class Program { private const int TEST_COUNT = 10000; static void Main(string[] args) { var store = new DocumentStore(); store.Url = "http://localhost:8117"; store.Initialize(); var timer = Stopwatch.StartNew(); var session = store.OpenSession(); for (var i = 0; i < TEST_COUNT; i++) { session.Store(new TestEntity() { Name = "Test Entity" }); if (i % 127 == 0) { session.SaveChanges(); session.Dispose(); session = store.OpenSession(); } } session.SaveChanges(); session.Dispose(); timer.Stop(); Console.WriteLine("Processed {0:n0} records", TEST_COUNT); Console.WriteLine("Time elapsed: {0:n0} ms", timer.ElapsedMilliseconds); Console.WriteLine("Records / sec: {0:n0}", TEST_COUNT / (timer.ElapsedMilliseconds / 1000d)); } } class TestEntity { public string Name { get; set; } public DateTime Created { get; set; } public TestEntity() { Created = DateTime.UtcNow; } }
输出如下:
Processed 10,000 records Time elapsed: 9,531 ms Records / sec: 1,049 Press any key to continue . . .
这是一台相对较快的机器(运行Windows 7的3ghz,2gb ram)
叫我疯了,但1000插入/秒非常慢,特别是对于只包含两个字段的文档.这是预期的吗?我知道RavenDB针对读取进行了优化,而不是写入,但这非常糟糕.
我不知道你是否会比这更快,因为整个"优化读取,而不是写"的东西.
但是如果你仔细阅读这个帖子,就有一些建议:
批量写入(您正在做).我不确定你需要关闭,然后重新打开会话,你应该只能打电话SaveChanges()
将事务模式设置为lazy(Raven/TransactionMode
)
异步进行导入,即从多个线程进行
您可以尝试的另一件事是embedded mode
,即将会话更改为
var documentStore = new DocumentStore { DataDirectory = "path/to/database/directory" }; documentStore.Initialize();
这会绕过HTTP流量并直接插入文档,有关详细信息,请参阅文档.