当前位置:  开发笔记 > 后端 > 正文

Nutch与Solr

如何解决《Nutch与Solr》经验,为你挑选了1个好方法。

目前收集信息我应该使用Nutch与Solr(域 - 垂直网络搜索).

你能建议我吗?



1> Pascal Dimas..:

Nutch是一个构建网络爬虫和搜索引擎的框架.Nutch可以完成从收集网页到构建倒排索引的整个过程.它还可以将这些索引推送到Solr.

Solr主要是一个支持分面搜索和许多其他功能的搜索引擎.但Solr无法获取数据,您必须提供数据.

因此,为了在两者之间进行选择,您可能首先要问的是,您是否已经将索引数据提供(在XML中,在CMS或数据库中).在这种情况下,您应该只使用Solr并将其提供给该数据.另一方面,如果你必须从网上获取数据,你可能更适合使用Nutch.

推荐阅读
罗文彬2502852027
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有