5赞

在代码中使Lucene.Net线程安全

作者：凹凸曼00威威_694 | 2023-09-06 16:43

如何解决《在代码中使Lucene.Net线程安全》经验，为你挑选了1个好方法。

我正在使用Lucene.Net进行搜索,并想知道如何处理这个线程问题.

我有一个类Test的实例,但搜索器在这种情况下不是线程安全的,因为定时器线程可以在提供请求的同时更新索引,并且我确实看到了异常.关于如何使其线程安全的任何指针.

public class Test 
{
    private static object syncObj = new object();

    private System.Threading.Timer timer;

    private Searcher searcher;

    private RAMDirectory idx = new RAMDirectory();

    public Test()
    {
        this.timer = new System.Threading.Timer(this.Timer_Elapsed, null, TimeSpan.Zero, TimeSpan.FromMinutes(3));
    }


    private Searcher ESearcher
    {
        get
        {
            return this.searcher;
        }

        set
        {
            lock (syncObj)
            {
                this.searcher = value;
            }
        }
    }

    public Document CreateDocument(string title, string content)
    {
        Document doc = new Document();
        doc.Add(new Field("A", title, Field.Store.YES, Field.Index.NO));
        doc.Add(new Field("B", content, Field.Store.YES, Field.Index.ANALYZED));
        return doc;
    }

    public List Search(Searcher searcher, string queryString)
    {
        List documents = new List();
        QueryParser parser = new QueryParser(Lucene.Net.Util.Version.LUCENE_30, "B", new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30));
        Query query = parser.Parse(queryString);
        int hitsPerPage = 5;
        TopScoreDocCollector collector = TopScoreDocCollector.Create(2 * hitsPerPage, true);
        this.ESearcher.Search(query, collector);

        ScoreDoc[] hits = collector.TopDocs().ScoreDocs;

        int hitCount = collector.TotalHits > 10 ? 10 : collector.TotalHits;
        for (int i = 0; i < hitCount; i++)
        {
            ScoreDoc scoreDoc = hits[i];
            int docId = scoreDoc.Doc;
            float docScore = scoreDoc.Score;
            Document doc = searcher.Doc(docId);
            documents.Add(doc);
        }

        return documents;
    }

    private void Timer_Elapsed(object sender)
    {
        this.Log("Started Updating the Search Indexing");
        // Get New data to Index
        using (IndexWriter writer = new IndexWriter(this.idx, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30), true, IndexWriter.MaxFieldLength.LIMITED))
        {
            foreach (var e in es)
            {
                writer.AddDocument(this.CreateDocument(e.Value.ToString(), e.Key));
            }

            writer.Optimize();
        }

        this.ESearcher = new IndexSearcher(this.idx);
        this.Log("Completed Updating the Search Indexing");
    }

    public Result ServeRequest()
    {
        var documents = this.Search(this.EntitySearcher, searchTerm);
        //somelogic
        return result;

    }

}

1> AndyPook..：

很多事情都是"错误的".

如前所述,锁定不安全(您需要锁定读取和写入).

更重要的是,在Lucene中有更好的处理方法.首先,IndexWriter它本身就是线程安全的.应该是的所有者Directory.打开/关闭目录的不同部分通常是"不好的做法".

NRT(近实时)索引的样式涉及IndexReader从IW 获取,而不是包装目录.

如果索引基本上是只读的,并且可以每天/每周批量重新生成,那么您的示例中使用的样式实际上只是"好".

我重写了这个例子来展示一些方法.显然,由于这只是测试代码,因此根据用例需要重构/增强的细微差别......

public class Test
{
    private static object syncObj = new object();

    private System.Threading.Timer timer;

    private Searcher searcher;

    private IndexWriter writer;
    private IndexReader reader;

    public Test()
    {
        writer = new IndexWriter(new RAMDirectory(), new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30), true, IndexWriter.MaxFieldLength.LIMITED);
        reader = writer.GetReader();
        searcher = new IndexSearcher(reader);
        timer = new System.Threading.Timer(Timer_Elapsed, null, TimeSpan.Zero, TimeSpan.FromMinutes(3));
    }


    public void CreateDocument(string title, string content)
    {
        var doc = new Document();
        doc.Add(new Field("A", title, Field.Store.YES, Field.Index.NO));
        doc.Add(new Field("B", content, Field.Store.YES, Field.Index.ANALYZED));

        writer.AddDocument(doc);
    }

    public void ReplaceAll(Dictionary es)
    {
        // pause timer
        timer.Change(Timeout.Infinite, Timeout.Infinite);

        writer.DeleteAll();
        foreach (var e in es)
        {
            AddDocument(e.Value.ToString(), e.Key);
        }

        // restart timer
        timer.Change(TimeSpan.Zero, TimeSpan.FromMinutes(3));
    }

    public List Search(string queryString)
    {
        var documents = new List();
        var parser = new QueryParser(Lucene.Net.Util.Version.LUCENE_30, "B", new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30));
        Query query = parser.Parse(queryString);
        int hitsPerPage = 5;
        var collector = TopScoreDocCollector.Create(2 * hitsPerPage, true);
        searcher.Search(query, collector);

        ScoreDoc[] hits = collector.TopDocs().ScoreDocs;

        int hitCount = collector.TotalHits > 10 ? 10 : collector.TotalHits;
        for (int i = 0; i < hitCount; i++)
        {
            ScoreDoc scoreDoc = hits[i];
            int docId = scoreDoc.Doc;
            float docScore = scoreDoc.Score;
            Document doc = searcher.Doc(docId);
            documents.Add(doc);
        }

        return documents;
    }

    private void Timer_Elapsed(object sender)
    {
        if (reader.IsCurrent())
            return;

        reader = writer.GetReader();
        var newSearcher = new IndexSearcher(reader);
        Interlocked.Exchange(ref searcher, newSearcher);
        Debug.WriteLine("Searcher updated");
    }

    public Result ServeRequest(string searchTerm)
    {
        var documents = Search(searchTerm);
        //somelogic
        var result = new Result();

        return result;

    }
}

注意:

作家"拥有"该目录

如果这是一个文件库目录,那么你将拥有Open和Close创建/处理编写器(处理lock文件处理)的方法.RamDirectory可以只是GC'd

使用Interlocked.Exchange而不是lock.因此使用searcher会员时零成本(这里是龙!)

新文档直接添加到作者

IsCurrent()如果没有添加新文档,则允许零成本.根据您添加文档的频率,您可能根本不需要计时器(只需调用Timer_Elapsed- 显然重命名 - 位于顶部Search).

不要使用Optimize()它是以前版本的宿醉,并且非常不鼓励使用它(性能和磁盘I/O原因)

最后,如果您使用的是Lucene.net v4.8,那么您应该使用SearcherManager(如另一个答案所示).但是使用ctor并将其IndexWriter保持为"单身"(与范围相同writer).它将为您处理锁定和获取新读者.

推荐阅读

程序员
如何在yii2中从web运行控制台命令

如何解决《如何在yii2中从web运行控制台命令》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使1 + 1 = 2而不是1 + 1 = 11

如何解决《如何使1+1=2而不是1+1=11》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除父div中的所有文本 - 将字符串保留在子项中

如何解决《删除父div中的所有文本-将字符串保留在子项中》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Access-Control-Request-Headers下添加$ http标头

如何解决《在Access-Control-Request-Headers下添加$http标头》经验，为你挑选了2个好方法。 ... [详细]
程序员
安装tensorflow时出错设置工具

如何解决《安装tensorflow时出错设置工具》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何检查一对多映射表中是否存在特定映射

如何解决《如何检查一对多映射表中是否存在特定映射》经验，为你挑选了1个好方法。 ... [详细]
程序员
与R的音频比较

如何解决《与R的音频比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
SSL认证适用于localhost,但不适用于计算机名称或IP

如何解决《SSL认证适用于localhost,但不适用于计算机名称或IP》经验，为你挑选了1个好方法。 ... [详细]
程序员
未知类型名称“ zend_string”

如何解决《未知类型名称“zend_string”》经验，为你挑选了1个好方法。 ... [详细]
程序员
R启动时如何覆盖2GB内存限制

如何解决《R启动时如何覆盖2GB内存限制》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django编码为utf8无法正常工作

如何解决《Django编码为utf8无法正常工作》经验，为你挑选了0个好方法。 ... [详细]
程序员
Python中浮点数('Inf')有什么意义？

如何解决《Python中浮点数('Inf')有什么意义？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用spring-hateoas反序列化JSON(链接+嵌入式容器)的便捷方法是什么？

如何解决《使用spring-hateoas反序列化JSON(链接+嵌入式容器)的便捷方法是什么？》经验，为你挑选了0个好方法。 ... [详细]
程序员
调试单元测试时,Visual Studio c#不应启动IIS网站

如何解决《调试单元测试时,VisualStudioc#不应启动IIS网站》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#Task.WaitAll()如何将对象状态合并为一个？

如何解决《C#Task.WaitAll()如何将对象状态合并为一个？》经验，为你挑选了1个好方法。 ... [详细]
程序员
UIActivityViewController Gmail共享主题和正文相同

如何解决《UIActivityViewControllerGmail共享主题和正文相同》经验，为你挑选了0个好方法。 ... [详细]
程序员
在长模式下更改GDT并更新CS

如何解决《在长模式下更改GDT并更新CS》经验，为你挑选了1个好方法。 ... [详细]
程序员
[NSNull length]:无法识别的选择器在键盘按键上发送到实例？

如何解决《[NSNulllength]:无法识别的选择器在键盘按键上发送到实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
node js函数返回[object Object]而不是字符串值

如何解决《nodejs函数返回[objectObject]而不是字符串值》经验，为你挑选了1个好方法。 ... [详细]
程序员
从AWS SDK,如何获取当前登录的用户名(或IAM用户)？

如何解决《从AWSSDK,如何获取当前登录的用户名(或IAM用户)？》经验，为你挑选了1个好方法。 ... [详细]

凹凸曼00威威_694

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章