当前位置:  开发笔记 > 编程语言 > 正文

Lucene相似度的高级解释?

如何解决《Lucene相似度的高级解释?》经验,为你挑选了1个好方法。

你知道在哪里可以找到Lucene相似度算法的高级解释.我想理解它,而不必破译搜索和索引所涉及的所有数学和术语.



1> erickson..:

Lucene的内置Similarity是一个相当标准的"逆文档频率"评分算法.维基百科的文章很简短,但涵盖了基础知识.Lucene in Action这本书更详细地分解了Lucene公式; 它没有完美地反映当前的Lucene公式,但解释了所有主要概念.

首先,分数随着当前文档中术语出现的次数(术语频率)而变化,并且术语在所有文档中出现的次数(文档频率)成反比.公式中的其他因素是次要的,调整分数以试图使来自不同查询的分数相互比较.


推荐阅读
赛亚兔备_393
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有