我需要搜索pdf文件以查看是否存在某个字符串.有问题的字符串肯定被编码为文本(即,它不是图像或任何东西).我试过只是搜索文件,好像它是纯文本,但这不起作用.
是否有可能做到这一点?那里有.net2.0的图书馆会为我提取/解码pdf文件中的所有文本吗?
那里有几个图书馆.查看http://www.codeproject.com/KB/cs/PDFToText.aspx 和http://itextsharp.sourceforge.net/
这需要一点努力,但它是可能的.