Solr DataImportHandler的Chunked UrlDataSource

作者：TXCWB_523 | 2023-06-22 10:19

如何解决《SolrDataImportHandler的ChunkedUrlDataSource》经验，为你挑选了1个好方法。

我正在考虑将我的数据源分块以便将优化数据导入到solr中,并且想知道是否可以使用将数据分块的主URL.

例如文件1可能有

每个块网址都会导致类似的内容

我正在处理5亿多条记录,因此我认为数据需要分块以避免内存问题(在使用SQLEntityProcessor时遇到这种情况).我还想避免提出超过500万的网络请求,因为我认为这可能会变得昂贵

1> Marty Trenou..：

由于互联网上缺少示例,我想我会发布我最终使用的内容

重要的是要注意我使用指定下一页上有更多内容并提供下一页的URL.这与DataImportHandlers的Solr文档一致.请注意,文档指定分页Feed应该告诉系统它有更多以及在哪里获得下一批.

注意$ hasMore和$ nextUrl字段.您可能希望放置超时.我还建议允许指定页面大小(它有助于使用tweeking设置来获得最佳处理速度).我使用四核Xeon处理器和32GB内存的单一服务器上的多核(3)solr实例索引@约12.5K记录/秒.

分页结果的应用程序使用与存储数据的SQL服务器相同的系统.当我们最终对solr服务器进行负载均衡时,我也会通过开始和停止位置来最小化配置更改....

推荐阅读

程序员
IB Designables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常

如何解决《IBDesignables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQLSTATE [HY000] [2002] php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道

如何解决《SQLSTATE[HY000][2002]php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道》经验，为你挑选了1个好方法。 ... [详细]
程序员
抛出constexpr功能

如何解决《抛出constexpr功能》经验，为你挑选了2个好方法。 ... [详细]
程序员
通过IO了解Haskell中的纯函数

如何解决《通过IO了解Haskell中的纯函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Yii2中的视图文件中使用ArrayHelper

如何解决《在Yii2中的视图文件中使用ArrayHelper》经验，为你挑选了1个好方法。 ... [详细]
程序员
尾递归与原始递归

如何解决《尾递归与原始递归》经验，为你挑选了1个好方法。 ... [详细]
程序员
语法错误:'delimiter'在这里输入无效

如何解决《语法错误:'delimiter'在这里输入无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不能满足相关类型的From <>的更高的kinded特性限制,但Into <>可以吗？

如何解决《为什么不能满足相关类型的From<>的更高的kinded特性限制,但Into<>可以吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将Future [Vector [UserLocation]]转换为Future [Vector [User]]

如何解决《如何将Future[Vector[UserLocation]]转换为Future[Vector[User]]》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以构建一个惰性条件元函数

如何解决《是否可以构建一个惰性条件元函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
制作填充图Matplotlib-错误：类型升级无效

如何解决《制作填充图Matplotlib-错误：类型升级无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中将两个列值粘贴在一起时省略NA值

如何解决《在R中将两个列值粘贴在一起时省略NA值》经验，为你挑选了0个好方法。 ... [详细]
程序员
从视图运行时如何修复Url（〜/ Views / Home / Index.cshtml）

如何解决《从视图运行时如何修复Url（〜/Views/Home/Index.cshtml）》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gunicorn Upstart文件无法启动

如何解决《GunicornUpstart文件无法启动》经验，为你挑选了0个好方法。 ... [详细]
程序员
函数uasort在PHP 5.5和PHP 7.0中的不同行为

如何解决《函数uasort在PHP5.5和PHP7.0中的不同行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
我们应该如何实现对象类型的移动？

如何解决《我们应该如何实现对象类型的移动？》经验，为你挑选了1个好方法。 ... [详细]
程序员
BeautifulSoup中的select方法无法用空格选择属性值

如何解决《BeautifulSoup中的select方法无法用空格选择属性值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理谷歌地图上的触摸事件(MapFragment)？

如何解决《如何处理谷歌地图上的触摸事件(MapFragment)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#Hook全局键盘事件 - .net 4.0

如何解决《C#Hook全局键盘事件-.net4.0》经验，为你挑选了1个好方法。 ... [详细]
程序员
区分相同类型的异常

如何解决《区分相同类型的异常》经验，为你挑选了0个好方法。 ... [详细]

TXCWB_523

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章