当前位置:  开发笔记 > 编程语言 > 正文

如何提高关键字匹配的性能

假设有2000万或更多的字符串,并且有1000个关键字。现在需要检测所有字符串命中了哪些关键字,当然,最简单的做法就是一个字符串一个字符串的拿去跟所有的关键字做匹配,但这样效率会很慢,请问有没有什么好的方
假设有2000万或更多的字符串,并且有1000个关键字。现在需要检测所有字符串命中了哪些关键字,当然,最简单的做法就是一个字符串一个字符串的拿去跟所有的关键字做匹配,但这样效率会很慢,请问有没有什么好的方法可以提高匹配效率?

回复内容:

假设有2000万或更多的字符串,并且有1000个关键字。现在需要检测所有字符串命中了哪些关键字,当然,最简单的做法就是一个字符串一个字符串的拿去跟所有的关键字做匹配,但这样效率会很慢,请问有没有什么好的方法可以提高匹配效率?

http://blog.41ms.com/post/41.html

我现在就在用,你才1000个关键字,我有200W关键字,现在每秒支持500并发,应该能满足你

利用PHP扩展trie_filter做中文敏感词过滤

http://www.2cto.com/kf/201401/273359.html

AC_BNFA

https://segmentfault.com/q/1010000004159234/a-1020000004162767

看看这个应该会对你有帮助字符串匹配算法

用ElasticSearch

推荐阅读
yzh148448
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有