14赞

Python:在大型字符串中查找部分字符串匹配

作者：携手相约幸福 | 2023-09-01 23:12

如何解决《Python:在大型字符串中查找部分字符串匹配》经验，为你挑选了1个好方法。

我对在Python中实现自动完成感兴趣.例如,当用户键入字符串时,我想在磁盘上显示名称以该字符串开头的文件子集.

什么是一种有效的算法来查找匹配大型语料库中某些条件的字符串(比如数十万个字符串)？就像是:

matches = [s for s in allfiles if s.startswith(input)]

我希望条件灵活; 例如.只要输入中的所有字母都以相同的顺序出现在s中,而不是严格的startwith,它就是匹配.什么比我在这里展示的蛮力方法更好？

1> Brian..：

对于精确匹配,通常实现这样的方法是将您的语料库存储在trie中.我们的想法是将每个字母存储为树中的节点,链接到单词中的下一个字母.找到匹配只是走在树上,并显示当前位置的所有孩子.例如."猫","牛"和"汽车"将存储为:

  a--t
 / \ 
c   r
 \
  o--w

当你获得交流时,你从c节点开始,a然后将你带到c/a节点(子节点"t"和"r",将cat和car作为你的完成).

请注意,您还需要标记完整单词的节点来处理作为其他子串的名称(例如"car"和"cart")

要获得所需的模糊匹配,您可能需要进行一些更改.

推荐阅读

程序员
在JavaScript中删除事件列表器

如何解决《在JavaScript中删除事件列表器》经验，为你挑选了1个好方法。 ... [详细]
程序员
惯用语Clojure功能别名

如何解决《惯用语Clojure功能别名》经验，为你挑选了1个好方法。 ... [详细]
程序员
确定使用哪些包

如何解决《确定使用哪些包》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android Butterknife - 片段绑定

如何解决《AndroidButterknife-片段绑定》经验，为你挑选了3个好方法。 ... [详细]
程序员
用碳将小时转换为PM和AM

如何解决《用碳将小时转换为PM和AM》经验，为你挑选了1个好方法。 ... [详细]
程序员
Golang客户为Cassandra

如何解决《Golang客户为Cassandra》经验，为你挑选了0个好方法。 ... [详细]
程序员
Kotlin:尚不支持Java 8的哪些功能？

如何解决《Kotlin:尚不支持Java8的哪些功能？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在单个页面上创建多个p:确认对话框

如何解决《如何在单个页面上创建多个p:确认对话框》经验，为你挑选了1个好方法。 ... [详细]
程序员
在列表视图中设置选定的索引

如何解决《在列表视图中设置选定的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果它正在运行,则停止并删除docker容器

如何解决《如果它正在运行,则停止并删除docker容器》经验，为你挑选了4个好方法。 ... [详细]
程序员
为什么这个导入工作？

如何解决《为什么这个导入工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
不要使用CSS显示空的内联块元素

如何解决《不要使用CSS显示空的内联块元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java泛型和流

如何解决《Java泛型和流》经验，为你挑选了1个好方法。 ... [详细]
程序员
在switch语句中通过引用返回

如何解决《在switch语句中通过引用返回》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio 2015 IIS Express 500错误

如何解决《VisualStudio2015IISExpress500错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
从snake_case到camel

如何解决《从snake_case到camel》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何找到哪个Java/Scala线程锁定了文件？

如何解决《如何找到哪个Java/Scala线程锁定了文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
swift .framework更新导致'使用未声明的类型错误'

如何解决《swift.framework更新导致'使用未声明的类型错误'》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法绑定到'ng-forOf',因为它不是已知的本机属性

如何解决《无法绑定到'ng-forOf',因为它不是已知的本机属性》经验，为你挑选了5个好方法。 ... [详细]
程序员
如何将一些使用语句设置为不冗余,即使它们是多余的？

如何解决《如何将一些使用语句设置为不冗余,即使它们是多余的？》经验，为你挑选了1个好方法。 ... [详细]

携手相约幸福

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章