10赞

如何在Java中删除HTML标记

作者：雨天是最美 | 2023-08-16 09:00

如何解决《如何在Java中删除HTML标记》经验，为你挑选了3个好方法。

是否有可以完全删除HTML标记的正则表达式？顺便说一下,我正在使用Java.

1> 小智..：

有JSoup这是HTML操作做一个Java库.看一下clean()方法和WhiteList对象.易于使用的解决方案!

更短的代码是`String plaintext = Jsoup.parse(html).text();`

@jrarama - 完全没有.`Jsoup.parse(html).text()`删除所有的标签和空格,只留下一条很长的单行文本,而`new HtmlToPlainText().getPlainText(Jsoup.parse(html))`格式化文字以简单的方式,保持换行符,段落,项目符号等.

哇,你先生,真的让我的一天,我喜欢,是的!Markdownj,Markdown4J,htmlCleaner ..所有这些都是*****抱歉.. JSoup是唯一一个你真正用单行实现的地方:String plain = new HtmlToPlainText().getPlainText(Jsoup.parse( HTML));

2> tangens..：

您应该使用HTML解析器.我喜欢htmlCleaner,因为它给了我一个漂亮的HTML版本.

使用htmlCleaner,您可以:

TagNode root = htmlCleaner.clean( stream );
Object[] found = root.evaluateXPath( "//div[id='something']" );
if( found.length > 0 && found instanceof TagNode ) {
    ((TagNode)found[0]).removeFromTree();
}

3> Andrey Adamo..：

如果您只需要删除标签,那么您可以使用此正则表达式:

content = content.replaceAll("<[^>]+>", "");

它只会删除标签,而不会删除其他HTML内容.对于更复杂的事情,您应该使用解析器.

编辑:为避免HTML注释出现问题,您可以执行以下操作:

content = content.replaceAll("", "").replaceAll("<[^>]+>", "");

推荐阅读

程序员
为什么JavaScript中的"〜undefined"为-1？

如何解决《为什么JavaScript中的"〜undefined"为-1？》经验，为你挑选了2个好方法。 ... [详细]
程序员
扩展&:将任何班级悬停在任何其他班级的SASS或SCSS中

如何解决《扩展&:将任何班级悬停在任何其他班级的SASS或SCSS中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何延迟div中背景图像的显示

如何解决《如何延迟div中背景图像的显示》经验，为你挑选了2个好方法。 ... [详细]
程序员
Android:我们如何在xml布局中隐藏/显示浮动操作按钮(fab)

如何解决《Android:我们如何在xml布局中隐藏/显示浮动操作按钮(fab)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用phonegap或cordova获取当前电池电量？

如何解决《使用phonegap或cordova获取当前电池电量？》经验，为你挑选了0个好方法。 ... [详细]
程序员
IE 11上的鼠标事件属性未定义

如何解决《IE11上的鼠标事件属性未定义》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在CMake中检测到ffmpeg vs libav？

如何解决《如何在CMake中检测到ffmpegvslibav？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MySQL - 选择列+ X>列的行

如何解决《MySQL-选择列+X>列的行》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何确保我的Android应用不会同时访问文件？

如何解决《如何确保我的Android应用不会同时访问文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何告诉PIT不要改变代码的某些特定部分？

如何解决《如何告诉PIT不要改变代码的某些特定部分？》经验，为你挑选了1个好方法。 ... [详细]
程序员
MPAndroidChart图表填充

如何解决《MPAndroidChart图表填充》经验，为你挑选了1个好方法。 ... [详细]
程序员
数据库文本在PHP while循环中打印两次

如何解决《数据库文本在PHPwhile循环中打印两次》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何覆盖Play的默认Ebean服务器配置？

如何解决《如何覆盖Play的默认Ebean服务器配置？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使phpunit捕获php7 TypeError

如何解决《使phpunit捕获php7TypeError》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在whatsapp中对图像进行子采样/调整大小

如何解决《如何在whatsapp中对图像进行子采样/调整大小》经验，为你挑选了1个好方法。 ... [详细]
程序员
MAX函数与GROUP BY子句一起使用

如何解决《MAX函数与GROUPBY子句一起使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在指令中的节点中添加rst格式？

如何解决《如何在指令中的节点中添加rst格式？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用核心javascript时在ajax调用中设置超时

如何解决《使用核心javascript时在ajax调用中设置超时》经验，为你挑选了0个好方法。 ... [详细]
程序员
实体框架6在代码中设置连接字符串

如何解决《实体框架6在代码中设置连接字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring在运行时选择bean实现

如何解决《Spring在运行时选择bean实现》经验，为你挑选了3个好方法。 ... [详细]

雨天是最美

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章