检测图像中的漫画对话气泡区域

作者：惬听风吟jyy_802 | 2023-09-09 18:35

如何解决《检测图像中的漫画对话气泡区域》经验，为你挑选了0个好方法。

我有一个漫画页面的灰度图像,其中包含几个对话气泡(=语音气球等),这些气泡是白色背景的封闭区域和内部包含文本的纯黑色边框,即类似的东西:

漫画图片样本

我想检测这些区域并创建一个掩码(二进制就可以),它将覆盖对话气泡的所有内部区域,即:

样本结果掩模图像

相同的图像,掩盖覆盖,完全清晰:

带透明遮罩覆盖的样本图像

所以,我对算法的基本思想是这样的:

检测文本的位置 - 在每个气泡中至少生成一个像素.稍微扩张这些区域并应用阈值以获得更好的起跑地; 我做过这部分:

文字位置概述

使用泛光填充或某种图形遍历,从在步骤1中检测为像素内部气泡的每个白色像素开始,但是处理初始图像,淹没白色像素(应该在气泡内)并停止暗像素(应该是边框或文本).

使用某种binary_closing操作来移除气泡内的暗区(即与文本对应的区域).这部分工作正常.

到目前为止,第1步和第3步都有效,但我正在努力完成第2步.我目前正在使用scikit-image,我没有看到任何现成的算法,如洪水填充.显然,我可以使用像广度优先遍历这样的微不足道的东西,基本上就像这里建议的那样,但是在Python中完成时它真的很慢.我怀疑在ndimage或scikit-image 中复杂的形态学内容如binary_erosion或generate_binary_structure,但我很难理解所有形态学术语,基本上我如何用它来实现这样的自定义泛滥填充(即从第1步开始,在原始图像上工作图像并产生输出以分离输出图像).

我愿意接受任何建议,包括OpenCV等建议.

推荐阅读

程序员
深度优先使用clojure.walk索引任何Clojure表单

如何解决《深度优先使用clojure.walk索引任何Clojure表单》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过socket.io发送匿名函数？

如何解决《通过socket.io发送匿名函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Storyboard中使用UITableViewCell时使用alloc和init

如何解决《在Storyboard中使用UITableViewCell时使用alloc和init》经验，为你挑选了1个好方法。 ... [详细]
程序员
Rails 3 - 公用文件夹中的MP3文件

如何解决《Rails3-公用文件夹中的MP3文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
适当的git工作流程方案,多个开发人员在同一个任务上工作

如何解决《适当的git工作流程方案,多个开发人员在同一个任务上工作》经验，为你挑选了3个好方法。 ... [详细]
程序员
逐步使用分支提取子树

如何解决《逐步使用分支提取子树》经验，为你挑选了0个好方法。 ... [详细]
程序员
mongoDB集名称不匹配

如何解决《mongoDB集名称不匹配》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过Javascript获取Magento baseUrl然后在jquery.hello-lightbox.min中使用它？

如何解决《如何通过Javascript获取MagentobaseUrl然后在jquery.hello-lightbox.min中使用它？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Visual Studio 2012进行部署时删除ConnectionString

如何解决《使用VisualStudio2012进行部署时删除ConnectionString》经验，为你挑选了1个好方法。 ... [详细]
程序员
覆盖onDraw()或draw()？

如何解决《覆盖onDraw()或draw()？》经验，为你挑选了3个好方法。 ... [详细]
程序员
"else"错误中出现意外的'else'

如何解决《"else"错误中出现意外的'else'》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Haskell中,(=="")是什么意思？

如何解决《在Haskell中,(=="")是什么意思？》经验，为你挑选了4个好方法。 ... [详细]
程序员
获取对调用方法的对象的引用？

如何解决《获取对调用方法的对象的引用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在OSX中更新monodevelop3.0.6并保留mono3.0.3？

如何解决《如何在OSX中更新monodevelop3.0.6并保留mono3.0.3？》经验，为你挑选了0个好方法。 ... [详细]
程序员
写入文件时了解logcat输出

如何解决《写入文件时了解logcat输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
从iframe更改父元素不起作用？

如何解决《从iframe更改父元素不起作用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将jqPlot图保存到图像文件

如何解决《将jqPlot图保存到图像文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
XCode 4.5中的分布式构建？

如何解决《XCode4.5中的分布式构建？》经验，为你挑选了1个好方法。 ... [详细]
程序员
飞镖货币格式

如何解决《飞镖货币格式》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何以编程方式训练SpeechRecognitionEngine并将音频文件转换为C#或vb.net中的文本

如何解决《如何以编程方式训练SpeechRecognitionEngine并将音频文件转换为C#或vb.net中的文本》经验，为你挑选了1个好方法。 ... [详细]

惬听风吟jyy_802

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章