什么是最好的模糊匹配算法(模糊逻辑,N-Gram,Levenstein,Soundex ....,)能够在更短的时间内处理超过100000条记录?
我建议你阅读Navarro在维基百科文章标题为近似字符串匹配的Refences部分中提到的文章 .根据实际研究做出决定总是优于随机陌生人的建议.特别是如果对已知记录集的表现对您很重要.