使用Lucene计算类别中的结果

作者：牛尾巴2010 | 2023-09-04 17:18

如何解决《使用Lucene计算类别中的结果》经验，为你挑选了2个好方法。

我正在尝试使用Lucene Java 2.3.2来实现对产品目录的搜索.除了产品的常规字段外,还有一个名为"类别"的字段.产品可以分为多个类别.目前,我使用FilteredQuery搜索每个类别的相同搜索词,以获得每个类别的结果数.

这导致每个查询20-30个内部搜索调用以显示结果.这大大减慢了搜索速度.使用Lucene有更快的方法来实现相同的结果吗？

1> itsadok..：

这就是我做的,虽然它对内存有点沉重:

你需要的是提前创建一堆BitSets,每个类别一个,包含一个类别中所有文档的doc id.现在,在搜索时,您使用HitCollector并检查针对BitSet的文档ID.

这是创建位集的代码:

public BitSet[] getBitSets(IndexSearcher indexSearcher, 
                           Category[] categories) {
    BitSet[] bitSets = new BitSet[categories.length];
    for(int i=0; i

这只是一种方法.如果您的类别足够简单,您可以使用TermDocs而不是运行完整搜索,但这应该只在您加载索引时运行一次.

现在,在计算搜索结果类别时,您可以这样做:

public int[] getCategroryCount(IndexSearcher indexSearcher, 
                               Query query, 
                               final BitSet[] bitSets) {
    final int[] count = new int[bitSets.length];
    indexSearcher.search(query, new HitCollector() {
        public void collect(int doc, float score) {
            for(int i=0; i

您最终得到的是一个数组,其中包含搜索结果中每个类别的计数.如果您还需要搜索结果,则应该向命中收集器添加TopDocCollector(yo dawg ...).或者,您可以再次运行搜索.2次搜索优于30次.

        

2> Rowan..：
我没有足够的声誉来评论(!)但是在Matt Quail的回答中我很确定你可以替换它:

int numDocs = 0;
td.seek(terms);
while (td.next()) {
    numDocs++;
}


有了这个:

int numDocs = terms.docFreq()


然后完全摆脱td变量.这应该会更快.

推荐阅读

程序员
多部分文件上载:弹出引导返回JSON错误消息中的大小超过异常

如何解决《多部分文件上载:弹出引导返回JSON错误消息中的大小超过异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果它们太大,我如何使SQL Server 2012截断插入？

如何解决《如果它们太大,我如何使SQLServer2012截断插入？》经验，为你挑选了0个好方法。 ... [详细]
程序员
火花Word2vec矢量数学

如何解决《火花Word2vec矢量数学》经验，为你挑选了1个好方法。 ... [详细]
程序员
查找VS输出窗口中显示的Exception源

如何解决《查找VS输出窗口中显示的Exception源》经验，为你挑选了1个好方法。 ... [详细]
程序员
推荐的方法在C中的单个函数中处理多个malloc错误

如何解决《推荐的方法在C中的单个函数中处理多个malloc错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
找到阵列是否是2d阵列的简单方法？

如何解决《找到阵列是否是2d阵列的简单方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Eclipse:我的android应用程序在启动时崩溃了

如何解决《Eclipse:我的android应用程序在启动时崩溃了》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用R中的Openxlsx包修改Excel工作簿中的现有工作表？

如何解决《如何使用R中的Openxlsx包修改Excel工作簿中的现有工作表？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Android Marshmallow中创建wifi网络共享热点？

如何解决《如何在AndroidMarshmallow中创建wifi网络共享热点？》经验，为你挑选了0个好方法。 ... [详细]
程序员
我可以使Realm Results类使用协议作为泛型吗？

如何解决《我可以使RealmResults类使用协议作为泛型吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在具有隐式参数的函数上调用Private

如何解决《如何在具有隐式参数的函数上调用Private》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么可以使std :: map找不到它的一个键？

如何解决《什么可以使std::map找不到它的一个键？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq加入查询错误

如何解决《Linq加入查询错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将预先填充的文本消息发送给特定(预期)Whats-App用户/用户？

如何解决《如何将预先填充的文本消息发送给特定(预期)Whats-App用户/用户？》经验，为你挑选了0个好方法。 ... [详细]
程序员
学习Netsuite

如何解决《学习Netsuite》经验，为你挑选了1个好方法。 ... [详细]
程序员
包括头文件进行分析之后，请告诉我有关cppcheck的用途或工作方式

如何解决《包括头文件进行分析之后，请告诉我有关cppcheck的用途或工作方式》经验，为你挑选了1个好方法。 ... [详细]
程序员
JDBC是否在将日期插入Oracle DB之前调整日期？我该如何防止这种情况？

如何解决《JDBC是否在将日期插入OracleDB之前调整日期？我该如何防止这种情况？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在类"对象"中定义的==运算符在哪里？

如何解决《在类"对象"中定义的==运算符在哪里？》经验，为你挑选了2个好方法。 ... [详细]
程序员
有没有办法在babelify中关闭"超级之前不允许这样的规则"？

如何解决《有没有办法在babelify中关闭"超级之前不允许这样的规则"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bootstrap 3无法在Symfony3中运行

如何解决《Bootstrap3无法在Symfony3中运行》经验，为你挑选了1个好方法。 ... [详细]

牛尾巴2010

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章