当前位置:  开发笔记 > 编程语言 > 正文

Java中的HTML处理:将HTML转换为其他格式

如何解决《Java中的HTML处理:将HTML转换为其他格式》经验,为你挑选了1个好方法。

好的,Java有很多HTML/XML解析器.我想要做的不仅仅是知道如何解析它.我想过滤内容并以合适的形式使用.

更准确地说,我想只保留文字和图像.但是,我想保留一些文本格式,例如:斜体,粗体,对齐等.

所有这一切都是因为我正在尝试实现一个转换器,它将html转换为我自己为自己的目的创建的特定格式.

有任何想法吗?当然,以前必须做过很多次.



1> BalusC..:

如果您打算根据安全白名单清除用户提交的内容以防止XSS,那么我建议使用Jsoup.它提供了内置的白名单.然后就像这样简单:

String safeHtml = Jsoup.clean(unsafeHtml, Whitelist.basicWithImages());

您可以Whitelist按照其javadoc中的描述进行自定义.

也可以看看:

Java中HTML解析器的优缺点

推荐阅读
臭小子
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有