当前位置:  开发笔记 > 编程语言 > 正文

构建全文搜索引擎:从哪里开始

如何解决《构建全文搜索引擎:从哪里开始》经验,为你挑选了2个好方法。

我想使用Google App Engine编写Web应用程序(因此参考语言将是Python).我的应用程序需要一个简单的搜索引擎,因此用户可以找到指定关键字的数据.

例如,如果我有一个包含这些行的表:

1办公空间
2 2001年:太空漫游
3巴西

并且用户查询"space",将返回第1行和第2行.如果用户查询"办公空间",则结果也应为第1行和第2行(第1行为第1行).

以简单的方式执行此操作的技术指南/算法是什么?
你能否指出我背后的理论的好指点?

谢谢.

编辑:我不是在寻找任何复杂的东西(比如索引大量的数据).



1> Mark Cidade..:

阅读Tim Bray 关于这一主题的系列文章.

背景

搜索引擎的使用

基本

精确和召回

搜索引擎情报

棘手的搜索词

停用词

元数据

国际化

排名结果

XML

机器人

要求清单



2> Ferruccio..:

我发现这两本书在我用来构建全文搜索引擎时非常有用.

信息检索

管理千兆字节

推荐阅读
wurtjq
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有