是否有一个解析器/库能够使用Java将HTML文档读入DOM树?我想使用DOM/XpathJava提供的标准API.
DOM/Xpath
大多数库似乎都有自定义API来解决此任务.此外,大多数可用的解析器似乎都不支持将HTML转换为XML-DOM.
有关HTML DOM解析器的任何想法或经验?
JTidy,要么将流处理为XHTML,然后使用您喜欢的DOM实现来重新解析,要么使用parseDOM,如果有限的DOM imp给你足够的话.
或者Neko.