从文档图像中分割线条,单词和字符

作者：无名有名我无名_593 | 2023-09-07 11:20

如何解决《从文档图像中分割线条,单词和字符》经验，为你挑选了1个好方法。

我正在开展一个项目,我必须从图像中读取文档.在初始阶段,我将阅读机器打印的文档,然后最终转移到手写文档的图像.但是我这样做是为了学习目的,所以我不打算像Tesseract那样使用apis.我打算按步骤做:

预处理(模糊,阈值处理,侵蚀和膨胀)

字符分割

OCR(或后期的ICR)

所以我现在正在进行字符分割,最近我通过水平和垂直直方图进行了分析.对于某些字体,我无法获得非常好的结果,例如显示的图像我无法获得好的结果.

文件的图像

还有其他方法或算法可以做同样的事情吗？任何帮助将不胜感激!

编辑1:

使用cv2.SimpleBlobDetector检测blob后得到的结果.

使用cv2.findContours后得到的结果. 在此输入图像描述

1> Yves Daoust..：

第一种选择是通过偏斜校正,即测量倾斜角.例如,您可以通过高斯滤波或水平方向的侵蚀来实现这一点,以便角色变宽并接触.然后二值化并细化或找到斑点的下边缘(或直接找到斑点的方向).您将获得略微倾斜的线段,为您提供倾斜方向.

在此输入图像描述

当您知道歪斜方向时,您可以反向旋转以执行去歪斜.然后,垂直直方图将可靠地分隔线条,您可以在每个线条中使用水平直方图.

第二种选择,IMO要好得多,就是对字符进行二值化并执行blob检测.然后,边界框的邻近分析将允许您确定字符链.他们会告诉你线条,间距越大,划分单词.

在此输入图像描述

推荐阅读

程序员
XlsxWriter python在特定单元格中写入数据帧

如何解决《XlsxWriterpython在特定单元格中写入数据帧》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Tensorflow的多变量时间序列RNN.这可能是LSTM细胞或类似的吗？

如何解决《使用Tensorflow的多变量时间序列RNN.这可能是LSTM细胞或类似的吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
C中的代码:64位系统中的int数组函数参数问题

如何解决《C中的代码:64位系统中的int数组函数参数问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
jquery中数据的用途？(vs将我自己的字段添加到Jquery对象)

如何解决《jquery中数据的用途？(vs将我自己的字段添加到Jquery对象)》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Spring Rest中使用JSON的HTTP POST

如何解决《在SpringRest中使用JSON的HTTPPOST》经验，为你挑选了1个好方法。 ... [详细]
程序员
swagger JSON文件的空值

如何解决《swaggerJSON文件的空值》经验，为你挑选了1个好方法。 ... [详细]
程序员
MSBuild"sgen.exe"丢失了

如何解决《MSBuild"sgen.exe"丢失了》经验，为你挑选了1个好方法。 ... [详细]
程序员
If-else在React Stateless功能组件中

如何解决《If-else在ReactStateless功能组件中》经验，为你挑选了2个好方法。 ... [详细]
程序员
为电报API创建授权密钥后的步骤

如何解决《为电报API创建授权密钥后的步骤》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用.pem文件通过ssh连接

如何解决《使用.pem文件通过ssh连接》经验，为你挑选了3个好方法。 ... [详细]
程序员
MVC View Scaffolding不使用Generic基类？

如何解决《MVCViewScaffolding不使用Generic基类？》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法匹配模板类中模板函数的函数声明

如何解决《无法匹配模板类中模板函数的函数声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel缩小CSS和JS文件

如何解决《Laravel缩小CSS和JS文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建对象之间是否存在任何差异,然后将其返回或直接创建并返回？

如何解决《创建对象之间是否存在任何差异,然后将其返回或直接创建并返回？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Sublime Text 3中将焦点从搜索栏更改为编辑器？

如何解决《如何在SublimeText3中将焦点从搜索栏更改为编辑器？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Javascript语法 - if语句

如何解决《Javascript语法-if语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用estimatedItemSize删除项目时,UICollectionView单元格会调整大小

如何解决《使用estimatedItemSize删除项目时,UICollectionView单元格会调整大小》经验，为你挑选了0个好方法。 ... [详细]
程序员
只有在运行单元测试时才能运行自定义gradle任务

如何解决《只有在运行单元测试时才能运行自定义gradle任务》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法打开输入文件:app/console(Symfony 2)

如何解决《无法打开输入文件:app/console(Symfony2)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用多个列表作为函数的输入参数(Python)

如何解决《使用多个列表作为函数的输入参数(Python)》经验，为你挑选了1个好方法。 ... [详细]

无名有名我无名_593

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章