我想学习一种文本操作语言,我已经把它归结为Python.除文本操作外,Python还用于数字应用程序,机器学习,AI等.
我的问题是如何学习Python语言,以便我能够快速编写复杂的文本操作实用程序.除了"文本操作"上下文中的正则表达式之外,哪些语言特征比其他语言特征更重要,哪些模块是有用的等等.
除了正则表达式之外,还有一些重要的特性:
生成器,请参阅David Beazley的系统程序员生成器技巧,以获取通过生成器管理无限量文本的许多很好的示例.
对于工具,我建议您查看以下内容:
Whoosh,一个纯粹的Python搜索引擎,它将为您提供一些在Python中使用pyparsing和文本处理解析文本的真实例子.
Ned Batcheldor 对各种Python解析工具的好评.
mxTextTools
Docutils源代码,用于Python中更高级的文本处理,包括复杂的状态机.
编辑:特定于Python中文本处理的良好链接:
David Mertz的Python文本处理.我认为这本书仍然可用,虽然现在可能有点过时了.