当前位置:  开发笔记 > 后端 > 正文

Nutch的另一种网络爬虫

如何解决《Nutch的另一种网络爬虫》经验,为你挑选了0个好方法。
如何解决《Nutch的另一种网络爬虫》经验,为你挑选了0个好方法。

我正在尝试建立一个专门的搜索引擎网站,为有限数量的网站编制索引.我想出的解决方案是:

使用Nutch作为网络爬虫,

使用Solr作为搜索引擎,

前端和站点逻辑用Wicket编码.

问题是我发现Nutch非常复杂,而且它是一个很大的自定义软件,尽管事实上不存在详细的文档(书籍,最近的教程......等).

现在问题:

    关于网站漏洞的任何建设性批评?

    是否有一个很好但简单的替代Nutch(作为网站的爬行部分)?

谢谢

推荐阅读
吻过彩虹的脸_378
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有