文本替换效率

作者：TXCWB_523 | 2023-09-08 20:57

如何解决《文本替换效率》经验，为你挑选了1个好方法。

我上一个问题的扩展:
文本清理和替换:从Java中的文本中删除\n

我正在清理这个来自具有不规则文本的数据库的传入文本.这意味着,没有标准或规则.有些包含像®,&trade,<等HTML字符,其他的有这种形式:”,–等.其他时候我只用<和>获取HTML标签.

我正在使用String.replace来替换字符的含义(这应该没问题,因为我正在使用UTF-8吗？),并且replaceAll()用正则表达式删除HTML标记.

除了为每个替换调用replace()函数以及编译HTML标记正则表达式之外,是否有任何建议使这种替换有效？

1> Jon Skeet..：

我的第一个建议是测量最简单的方法(可能是多次替换/替换所有调用)的性能.是的,它可能效率低下.通常,最简单的方法是效率低下.你需要问自己:你关心多少？

您是否有可以接受性能的样本数据和阈值？如果你不这样做,那就是第一个停靠港.然后测试天真的实现,看看它是否真的是一个问题.(记住,字符串替换几乎可以肯定只是一部分,你在做什么.当你获取从数据库文本入手,这可能也最终成为了瓶颈.)

一旦你确定替换确实是瓶颈,那么值得进行一些测试以确定替换的哪些位导致了最大的问题 - 听起来你正在进行几种不同的替换.你越能缩小范围越好:你可能会发现最简单的代码中的真正瓶颈是由一些容易以一种相当简单的方式提高效率的东西引起的,而试图优化一切将会困难得多.

推荐阅读

程序员
邮件合并复选框形式字段

如何解决《邮件合并复选框形式字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
golang将一个字符串添加到切片... interface {}

如何解决《golang将一个字符串添加到切片interface{}》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以使用SpriteKit在应用程序上使用Xcode UI Testing？

如何解决《是否可以使用SpriteKit在应用程序上使用XcodeUITesting？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将<script>中的字符串插入<a href="">

如何解决《将<script>中的字符串插入<ahref="">》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python中seaborn tsplot函数中的标准偏差和误差条

如何解决《Python中seaborntsplot函数中的标准偏差和误差条》经验，为你挑选了2个好方法。 ... [详细]
程序员
我可以使用TensorFlow测量单个操作的执行时间吗？

如何解决《我可以使用TensorFlow测量单个操作的执行时间吗？》经验，为你挑选了5个好方法。 ... [详细]
程序员
类型动画师的预期资源[ResourceType]

如何解决《类型动画师的预期资源[ResourceType]》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jekyll：在SCSS部分中使用_config.yml中的值

如何解决《Jekyll：在SCSS部分中使用_config.yml中的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用HttpsUrlConnection而不是DefaultHttpClient

如何解决《如何使用HttpsUrlConnection而不是DefaultHttpClient》经验，为你挑选了3个好方法。 ... [详细]
程序员
使用RxAndroid安排

如何解决《使用RxAndroid安排》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Python中创建类的不同实例？

如何解决《如何在Python中创建类的不同实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用.translate()从Python 3.x中的字符串中删除标点符号？

如何解决《如何使用.translate()从Python3.x中的字符串中删除标点符号？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Jmeter MarshalException:错误编组参数

如何解决《JmeterMarshalException:错误编组参数》经验，为你挑选了0个好方法。 ... [详细]
程序员
C ++ JSON解串器

如何解决《C++JSON解串器》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用CSS实现单行省略号

如何解决《如何用CSS实现单行省略号》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让UITextView检测主题标签？

如何解决《如何让UITextView检测主题标签？》经验，为你挑选了2个好方法。 ... [详细]
程序员
删除重复项而不覆盖hashCode()

如何解决《删除重复项而不覆盖hashCode()》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么OpenCL工作组是三维的？

如何解决《为什么OpenCL工作组是三维的？》经验，为你挑选了1个好方法。 ... [详细]
程序员
BCNF分解算法说明

如何解决《BCNF分解算法说明》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从PySpark中的map方法返回一个空(null？)项？

如何解决《如何从PySpark中的map方法返回一个空(null？)项？》经验，为你挑选了1个好方法。 ... [详细]

TXCWB_523

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章