solr会做网络抓取吗？

作者：mobiledu2402851323 | 2023-08-15 09:47

如何解决《solr会做网络抓取吗？》经验，为你挑选了2个好方法。

我有兴趣进行网页抓取.我在看solr.

是否solr进行网页抓取,或者进行网页抓取的步骤是什么？

1> Jon..：

事实上,Solr 5+ DOES现在进行网络爬行! http://lucene.apache.org/solr/

较旧的Solr版本不单独进行网络爬网,因为历史上它是一个提供全文搜索功能的搜索服务器.它建立在Lucene之上.

如果您需要使用另一个Solr项目抓取网页,那么您有许多选项,包括:

Nutch - http://lucene.apache.org/nutch/

Websphinx - http://www.cs.cmu.edu/~rcm/websphinx/

JSpider - http://j-spider.sourceforge.net/

Heritrix - http://crawler.archive.org/

如果您想使用Lucene或SOLR提供的搜索工具,您需要从Web爬网结果中构建索引.

看到这个:

Lucene爬虫(它需要构建lucene索引)

你能详细说明«Solr 5+ DOES实际上现在做网络爬行»？我没有在整个文档中看到任何抓取功能.

2> mjv..：

Solr本身没有网络爬行功能.

Nutch是Solr的"事实上"的爬虫(然后是一些).

推荐阅读

程序员
批处理文件:检查是否存在带有模式的文件

如何解决《批处理文件:检查是否存在带有模式的文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
AWS Data Pipeline RedShift"未找到分隔符"错误

如何解决《AWSDataPipelineRedShift"未找到分隔符"错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
VBA:将Variable Array转换为String

如何解决《VBA:将VariableArray转换为String》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么Xcode 7.2崩溃'无法实例化名为IBNSLayoutConstraint的类'？

如何解决《为什么Xcode7.2崩溃'无法实例化名为IBNSLayoutConstraint的类'？》经验，为你挑选了2个好方法。 ... [详细]
程序员
INT 0x13/AH = 0x02适用于软盘映像,但不能在闪存驱动器上刻录

如何解决《INT0x13/AH=0x02适用于软盘映像,但不能在闪存驱动器上刻录》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何自动更新所有Node.js模块？

如何解决《如何自动更新所有Node.js模块？》经验，为你挑选了1个好方法。 ... [详细]
程序员
编译ISO SQL-2003 ANTLR语法

如何解决《编译ISOSQL-2003ANTLR语法》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何停止ScheduledExecutorService？

如何解决《如何停止ScheduledExecutorService？》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建Hive表以从镶木地板/ avro模式中读取镶木地板文件

如何解决《创建Hive表以从镶木地板/avro模式中读取镶木地板文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Openlayer 3 - 检查功能是否在范围的范围内

如何解决《Openlayer3-检查功能是否在范围的范围内》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用PHP在Office 365中获取刷新令牌和访问令牌

如何解决《如何使用PHP在Office365中获取刷新令牌和访问令牌》经验，为你挑选了1个好方法。 ... [详细]
程序员
chrome.storage.managed在我的信息亭应用中似乎无法正常运行

如何解决《chrome.storage.managed在我的信息亭应用中似乎无法正常运行》经验，为你挑选了0个好方法。 ... [详细]
程序员
围绕特定树枝变量{{product.name}}包装上下文html

如何解决《围绕特定树枝变量{{product.name}}包装上下文html》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在开发过程中从一个地方的不同线程中捕获所有未捕获的异常？

如何解决《如何在开发过程中从一个地方的不同线程中捕获所有未捕获的异常？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C / C ++ MPI：是否需要级联MPI_BCasts？

如何解决《C/C++MPI：是否需要级联MPI_BCasts？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果字符串相等 - 如果声明

如何解决《如果字符串相等-如果声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel - 如何获得日期的年度财产

如何解决《Laravel-如何获得日期的年度财产》经验，为你挑选了2个好方法。 ... [详细]
程序员
xmlns,xmlns:xsi,xsi:schemaLocation和targetNamespace？

如何解决《xmlns,xmlns:xsi,xsi:schemaLocation和targetNamespace？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Java switch语句 - 行为混乱

如何解决《Javaswitch语句-行为混乱》经验，为你挑选了1个好方法。 ... [详细]
程序员
打字稿：确保泛型具有特定属性

如何解决《打字稿：确保泛型具有特定属性》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402851323

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章