有没有人知道我可以用来从明文pdf文件中提取文本部分的PDF文件解析器?特别是我想要一种方法能够可靠地提取特定于注释的文本部分?
Delphi,C#RegEx我不介意.
关于xactpro 的PDF File Parser文章似乎正是您所需要的.它解释了PDF的格式,并附带了解析器的完整源代码(以及用于可视化模型的另一个项目).
解析器使用特定于格式的术语,但您可以轻松使用可视化工具来学习要查找的内容.