我正在寻找算法,论文或软件来增强传真,手机摄像头的图像以及其他类似的可读性和OCR来源.
我主要对简单的增强功能感兴趣(例如,你可以使用ImageMagick做的事情),但我也对更复杂的技术感兴趣.我已经和供应商谈过了,所以对于这个问题,我主要是寻找算法或开源软件.
进一步澄清:我不是在寻找OCR软件或算法; 我正在寻找算法来清理图像,使其看起来对人眼更具可读性,并且可能用于OCR.
当我写一些软件进行书籍扫描时,我遇到了类似的问题; 漂浮在互联网上的是一个名为pagetools的程序,它使用一种称为Radon变换的相当聪明的数学技巧来拉直扫描页面.
我还写了一个小例程,它会使页面上的空白变白; 当OCR算法不必与背景噪声竞争时,它们往往会做得更好.我所做的是寻找距离深色的像素不到一个小半径的浅色像素,然后将它们提升为纯白色.
但是,这已经有几年了,所以我没有准确的实施细节.