我有nutch和lucene设置来抓取和索引一些网站,我想使用.net网站而不是nutch附带的JSP网站.
谁能推荐一些解决方案?
我已经看到了解决方案,其中有一个应用程序在索引服务器上运行,.Net站点使用远程连接.
速度是一个明显的考虑因素,所以这仍然表现良好吗?
编辑: NHibernate.Search可以为此工作吗?
编辑:我们最终使用Solr索引服务器,我们的ASP.net站点使用solrnet库.
如果从其他答案中不完全清楚,Lucene.NET和Lucene(Java)使用相同的索引格式,因此您应该能够继续使用现有的(基于Java的)机制进行索引,然后使用Lucene .NET Web应用程序中的.NET用于查询索引.
来自Lucene.NET孵化器网站:
除了端口到C#的API和类之外,Java Lucene的算法还移植到C#Lucene.这意味着使用Java Lucene创建的索引 与C#Lucene 来回兼容 ; 阅读,写作和更新.实际上,可以使用Java Lucene和C#Lucene进程同时搜索和更新Lucene索引