当前位置:  开发笔记 > 编程语言 > 正文

用于图像识别的C++库:包含字符串的图像

如何解决《用于图像识别的C++库:包含字符串的图像》经验,为你挑选了2个好方法。

有没有人知道用于拍摄图像并在其上执行图像识别的c ++库,以便它可以根据给定的字体和/或字体高度找到字母?即使是不允许你选择字体的那个也不错(例如:readLetters(Image image).



1> Ish..:

我最近一直在研究这个问题.你最好的只是Tesseract.如果您需要在OCR之上进行布局分析,而不是使用Ocropus(后者使用Tesseract进行OCR).布局分析是指能够检测图像上文本的位置,并进行线分割,块分割等操作.

我通过Tesseract实验找到了一些非常好的技巧,值得分享.基本上我不得不为图像做很多预处理.

    升级/缩小输入图像至300 dpi.

    从图像中删除颜色.灰度很好.我实际上使用了抖动阈值并使我的输入变为黑白.

    从你的图像中删除不必要的垃圾.对于上面的所有三个,我使用netbpm(一组用于unix的图像处理工具)来指出我所需要的几乎100%的准确度.

如果你有一个高度自定义的字体并单独使用tesseract,你必须"训练"系统 - 基本上你必须提供一堆训练数据.这在tesseract-ocr网站上有详细记载.实际上,您为字体创建了一种新的"语言",并使用-l参数传递它.

我发现的另一种训练机制是Ocropus使用nueral net(bpnet)训练.它需要大量的输入数据来构建良好的统计模型.

在调用Tesseract/Ocropus方面都是C++.它不会像ReadLines(Image)那么简单,但有一个API可以查看.您也可以通过命令行调用.



2> Sparr..:

虽然我不能特别推荐一个,但您正在寻找的术语是OCR(光学字符识别).

推荐阅读
帆侮听我悄悄说星星
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有