Peter Norvig 在他的文章如何编写拼写校正器中讨论了如何实现类似Google的拼写检查程序.本文包含Python中的20行实现,以及C,C++,C#和Java中几个重新实现的链接.这是一段摘录:
像Google这样的工业强度法术纠正器的全部细节会比启发更令人困惑,但我认为在飞机飞行回家中,在不到一页的代码中,我可以编写一个玩具拼写校正器,达到80%或90%处理速度至少为每秒10个字的精度.
使用Norvig的代码和本文作为训练集,我得到以下结果:
>>> import spellch >>> [spellch.correct(w) for w in 'fonetic wrd nterpreterr'.split()] ['phonetic', 'word', 'interpreters']