我如何能够以编程方式搜索和替换大量PDF文件中的某些文本?我想删除已添加到一组文件的URL.我已经能够在Adobe Pro的批处理下使用javascript删除链接,但链接文本仍然存在.我已经看到了使用文本touchup的建议,它可以手动工作,但我不想手动修改1300个文件.
由于文档格式的图形性质,在PDF中查找文本本质上很难 - 您搜索的字母在文件中可能不是连续的.也就是说,CAM :: PDF具有一些搜索替换功能和启发式功能.给changepagestring.pl一个尝试,看看它是否适用于你的PDF文件.
我也变得绝望了.经过10次PDF编辑器安装后,所有这些都需要花钱,但没有成功:
pdftk +编辑器就足够了:
替换PDF文件中的文本
使用pdftk解压缩PDF页面流
pdftk original.pdf输出original.clear.pdf解压缩
替换文本(有时这是有效的,有时它没有).
修复已修改(现在已损坏)的PDF
pdftk original.clear.pdf输出original.clear.fixed.pdf
(来自Joel Dare)