在知识库中开发文章数据库时(例如) - 对用户问题进行排序和显示最相关答案的最佳方法是什么?
您是否会根据先前用户是否找到帮助文章,或者您是否找到一个简单的关键字匹配算法来使用其他数据(如关键字加权)?
或许最简单,最天真的方法可以立即提供有用的结果:*tf-idf:
搜索引擎经常使用tf-idf加权方案的变体作为在给定用户查询的情况下对文档的相关性进行评分和排序的中心工具.tf-idf可以成功地用于各种主题领域中的停用词过滤,包括文本摘要和分类.
在我最近的一个相关问题中,我学到了一本关于这个主题的优秀免费书籍,您可以在线下载或阅读:
信息检索简介