当前位置:  开发笔记 > 编程语言 > 正文

OCR的理想字体是什么?

如何解决《OCR的理想字体是什么?》经验,为你挑选了3个好方法。

有没有人有OCR不同字体的经验?我正在生成一个ID,然后尝试用tesseract扫描它.目前我只是T&E'n不同的字体,但这似乎效率很低.我尝试过OCR*系列字体,以及Arial和Georgia等其他各种字体.tesseract往往与OCR*字体混淆.

是否有专门为tesseract设计的字体,或任何适合它的系统字体?



1> Paul Sonier..:

好的,谷歌搜索出现了这个特定的OCR字体: OCR字体

看起来它是1973年采用的标准.



2> Gawin..:

尝试了很多不同的字体和OCR引擎后,我倾向于使用Consolas获得最佳效果.它是一种类似OCR-A 的等宽字体,但更容易为人类阅读.Consolas包含在几个Microsoft产品中.

还有一个开源字体Inconsolata,受到 Consolas的影响.Inconsolata是Consolas的良好替代品,特别是考虑到许可细节.

在我的测试中,Calibri字体中的数字和空格并不总是被正确识别.OCR-A给出了很多读数错误.我没有尝试过MIRC,因为它对大多数人来说都不容易阅读.

注意:tesseract在可靠之前需要进行大量的测试和微调.在我们的案例中,我们切换到商业许可的OCR引擎(ABBYY),特别是因为可靠性非常重要,我们需要支持多种(欧洲)语言.

更新时间: 2017年1月31日 - 由于潜在的版权问题,将" 基于Consolas " 更改为" 受Consolas影响 ".


Inconsolata肯定不是基于Consolas.如果是,那么它将是Consolas的衍生作品,不能在免费许可下发布.维基百科页面使用"受影响"一词,在这种情况下,这是一个更好的属性.只是指出这一点,因为理解版权很难,并且不使用错误的术语并造成更多的混淆是有用的.

3> 小智..:

我发现Calibri对我来说是最好的.我们每天在自动化系统中使用OCR软件,在测试了几十种字体(包括一些特定于OCR的字体)后,Calibri始终是最好的.

祝好运.

推荐阅读
重庆制造漫画社
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有