在Lucene获取学期频率

作者：ar_wen2402851455 | 2023-08-29 09:50

如何解决《在Lucene获取学期频率》经验，为你挑选了1个好方法。

是否有一种快速简便的方法可以从Lucene索引中获取术语频率,而无需通过TermVectorFrequencies类进行,因为这需要花费大量时间来处理大型集合？

我的意思是,有没有像TermEnum文件频率和术语频率一样的东西？

更新:使用TermDocs太慢了.

1> erickson..：

使用TermDocs以获得长期的频率给定文档.与文档频率一样,您可以IndexReader使用感兴趣的术语从a获得术语文档.

你不会找到比TermDocs没有失去一般性更快的方法.TermDocs直接从索引段中的".frq"文件中读取,其中每个术语频率按文档顺序列出.

如果这"太慢",请确保您已优化索引以将多个段合并为一个段.按顺序迭代文档(跳过正常,但不能有效地在文档列表中来回跳转).

您的下一步可能是进行额外的处理,以创建一个更加专业化的文件结构SkipData.我个人会寻找一个更好的算法来实现我的目标,或提供更好的硬件 - 大量的内存,要么持有RAMDirectory,要么给操作系统在自己的文件缓存系统上使用.

推荐阅读

程序员
为什么lodash的.isObject,.isPlainObject的行为与"typeof x ==='object'"不同？

如何解决《为什么lodash的.isObject,.isPlainObject的行为与"typeofx==='object'"不同？》经验，为你挑选了2个好方法。 ... [详细]
程序员
连接表的索引

如何解决《连接表的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何删除tumblr控件/按钮/ iframe？

如何解决《如何删除tumblr控件/按钮/iframe？》经验，为你挑选了1个好方法。 ... [详细]
程序员
包装BCD到DPD:如何改进这个amd64装配程序？

如何解决《包装BCD到DPD:如何改进这个amd64装配程序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么使用这个全局`operator <<`无法编译？

如何解决《为什么使用这个全局`operator<<`无法编译？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么requestIdToken返回null？

如何解决《为什么requestIdToken返回null？》经验，为你挑选了2个好方法。 ... [详细]
程序员
OpenWRT:无法安装软件包 - 内存问题

如何解决《OpenWRT:无法安装软件包-内存问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以将事件侦听器绑定到外部脚本的阴影dom中的元素？

如何解决《是否可以将事件侦听器绑定到外部脚本的阴影dom中的元素？》经验，为你挑选了1个好方法。 ... [详细]
程序员
升级到react-native 0.16错误

如何解决《升级到react-native0.16错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
TensorFlow检查点保存并读取

如何解决《TensorFlow检查点保存并读取》经验，为你挑选了1个好方法。 ... [详细]
程序员
在同一个StringBuilder实例上调用toString时输出不同

如何解决《在同一个StringBuilder实例上调用toString时输出不同》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法找出我的程序陷入无限循环的原因

如何解决《无法找出我的程序陷入无限循环的原因》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android - ScrollView和PercentRelativeLayout

如何解决《Android-ScrollView和PercentRelativeLayout》经验，为你挑选了1个好方法。 ... [详细]
程序员
在编译的哪个步骤中删除了注释？

如何解决《在编译的哪个步骤中删除了注释？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Aurelia中<compose>和<require>有什么区别？

如何解决《Aurelia中<compose>和<require>有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
RxSwift和如何使简单的TableViewController？

如何解决《RxSwift和如何使简单的TableViewController？》经验，为你挑选了1个好方法。 ... [详细]
程序员
这段代码的哪一部分导致无限循环？

如何解决《这段代码的哪一部分导致无限循环？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Golang:从文本文件中替换字符串中的换行符的问题

如何解决《Golang:从文本文件中替换字符串中的换行符的问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#auto-property snippet将get和set放在新行上

如何解决《C#auto-propertysnippet将get和set放在新行上》经验，为你挑选了1个好方法。 ... [详细]
程序员
图像在浮动容器内的奇怪行为

如何解决《图像在浮动容器内的奇怪行为》经验，为你挑选了0个好方法。 ... [详细]

ar_wen2402851455

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章