当前位置:  开发笔记 > 编程语言 > 正文

使用Java将HTML文件读取到DOM树

如何解决《使用Java将HTML文件读取到DOM树》经验,为你挑选了1个好方法。

是否有一个解析器/库能够使用Java将HTML文档读入DOM树?我想使用DOM/XpathJava提供的标准API.

大多数库似乎都有自定义API来解决此任务.此外,大多数可用的解析器似乎都不支持将HTML转换为XML-DOM.

有关HTML DOM解析器的任何想法或经验?



1> bobince..:

JTidy,要么将流处理为XHTML,然后使用您喜欢的DOM实现来重新解析,要么使用parseDOM,如果有限的DOM imp给你足够的话.

或者Neko.

推荐阅读
落单鸟人
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有