如何在大型字符串数据库中找到字符串的最佳模糊匹配

作者：重庆制造漫画社 | 2023-09-02 16:38

如何解决《如何在大型字符串数据库中找到字符串的最佳模糊匹配》经验，为你挑选了1个好方法。

我有一个字符串数据库(任意长度),它拥有超过一百万个项目(可能更多).

我需要将用户提供的字符串与整个数据库进行比较,并检索相同的字符串(如果存在)或以其他方式返回最接近的模糊匹配(60%相似性或更好).理想情况下,搜索时间应小于一秒.

我的想法是使用编辑距离将每个数据库字符串与搜索字符串进行比较,然后根据数据库的长度缩小数据库中的候选项.

但是,因为我需要经常执行此操作,所以我正在考虑构建db字符串的索引以保留在内存中并查询索引,而不是直接查询db.

有关如何以不同方式解决此问题或如何构建内存中索引的任何想法？

1> zaratustra..：

本文似乎准确描述了你想要的东西.

Lucene(http://lucene.apache.org/)也实现了Levenshtein编辑距离.

第一个链接似乎已经消失了.: - /

推荐阅读

程序员
TensorFlow中图形集合的目的是什么？

如何解决《TensorFlow中图形集合的目的是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
您如何将Google登录名（Oauth2）限制为来自Flask WebApp的特定Google Apps域中的电子邮件？

如何解决《您如何将Google登录名（Oauth2）限制为来自FlaskWebApp的特定GoogleApps域中的电子邮件？》经验，为你挑选了0个好方法。 ... [详细]
程序员
UITabBar栏项目图标默认为灰色吗？

如何解决《UITabBar栏项目图标默认为灰色吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在ConcurrentHashMap中基于getOrDefault()实现原子getOrDefaultWithPut()？

如何解决《如何在ConcurrentHashMap中基于getOrDefault()实现原子getOrDefaultWithPut()？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么负零等于正零？

如何解决《为什么负零等于正零？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++指针数组内存分配与普通数组

如何解决《C++指针数组内存分配与普通数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法检测Swift项目中的强制解包？

如何解决《有没有办法检测Swift项目中的强制解包？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Java中从Android应用执行Python脚本？

如何解决《在Java中从Android应用执行Python脚本？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在GWT中做什么(提供=真)？

如何解决《在GWT中做什么(提供=真)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.NET WebAPI 2嵌套JSON

如何解决《ASP.NETWebAPI2嵌套JSON》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android M检测权限对话框是否可见

如何解决《AndroidM检测权限对话框是否可见》经验，为你挑选了0个好方法。 ... [详细]
程序员
用于"重复射击"的按下按钮

如何解决《用于"重复射击"的按下按钮》经验，为你挑选了2个好方法。 ... [详细]
程序员
jwt web令牌应该加密吗？

如何解决《jwtweb令牌应该加密吗？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用redux在首次渲染期间指示异步操作的"加载"状态

如何解决《如何使用redux在首次渲染期间指示异步操作的"加载"状态》经验，为你挑选了1个好方法。 ... [详细]
程序员
GoogleMobileAds.framework:捆绑包格式无法识别,无效或不适合

如何解决《GoogleMobileAds.framework:捆绑包格式无法识别,无效或不适合》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何追踪LLVM verifyFunction错误"预计没有前向声明!"？

如何解决《如何追踪LLVMverifyFunction错误"预计没有前向声明!"？》经验，为你挑选了0个好方法。 ... [详细]
程序员
将unique_ptr的向量传递给函数,const引用

如何解决《将unique_ptr的向量传递给函数,const引用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rails代码中没有路由匹配

如何解决《Rails代码中没有路由匹配》经验，为你挑选了1个好方法。 ... [详细]
程序员
Mysql显示按创建日期排序的数据库？

如何解决《Mysql显示按创建日期排序的数据库？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我的WinForms控件看起来平坦？

如何解决《为什么我的WinForms控件看起来平坦？》经验，为你挑选了1个好方法。 ... [详细]

重庆制造漫画社

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章