18赞

如何从字符串中加载XML中的org.w3c.dom.Document？

作者：echo7111436 | 2023-09-06 06:46

如何解决《如何从字符串中加载XML中的org.w3c.dom.Document？》经验，为你挑选了3个好方法。

我在一个字符串中有一个完整的XML文档,并且想要一个Document对象.谷歌出现了各种各样的垃圾.什么是最简单的解决方案？(在Java 1.5中)

解决方案感谢Matt McMinn,我已经确定了这个实现.它具有适当级别的输入灵活性和异常粒度.(很高兴知道错误是来自格式错误的XML SAXException- 或者只是错误的IO - IOException.)

public static org.w3c.dom.Document loadXMLFrom(String xml)
    throws org.xml.sax.SAXException, java.io.IOException {
    return loadXMLFrom(new java.io.ByteArrayInputStream(xml.getBytes()));
}

public static org.w3c.dom.Document loadXMLFrom(java.io.InputStream is) 
    throws org.xml.sax.SAXException, java.io.IOException {
    javax.xml.parsers.DocumentBuilderFactory factory =
        javax.xml.parsers.DocumentBuilderFactory.newInstance();
    factory.setNamespaceAware(true);
    javax.xml.parsers.DocumentBuilder builder = null;
    try {
        builder = factory.newDocumentBuilder();
    }
    catch (javax.xml.parsers.ParserConfigurationException ex) {
    }  
    org.w3c.dom.Document doc = builder.parse(is);
    is.close();
    return doc;
}

erickson.. 148

哇那里!

此代码存在潜在的严重问题,因为它忽略了String(默认情况下为UTF-8)中指定的字符编码.当您调用String.getBytes()平台时,默认编码用于将Unicode字符编码为字节.因此,解析器可能会认为它获得了UTF-8数据,而事实上它正在获得EBCDIC或其他东西......不是很漂亮!

相反,使用带有InputSource的parse方法,该方法可以使用Reader构造,如下所示:

import java.io.StringReader;
import org.xml.sax.InputSource;
…
        return builder.parse(new InputSource(new StringReader(xml)));

这可能看起来不是什么大不了的事,但对字符编码问题的无知会导致阴险代码腐烂类似于y2k.

1> erickson..：

哇那里!

相反,使用带有InputSource的parse方法,该方法可以使用Reader构造,如下所示:

import java.io.StringReader;
import org.xml.sax.InputSource;
…
        return builder.parse(new InputSource(new StringReader(xml)));

这可能看起来不是什么大不了的事,但对字符编码问题的无知会导致阴险代码腐烂类似于y2k.

我现在意识到我不应该只是复制并粘贴已接受的答案,而是通读.

如此简单但难以捉摸的Google解决方案.谢谢你+1

2> Matt McMinn..：

这在Java 1.5中适用于我 - 我删除了可读性的特定异常.

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import java.io.ByteArrayInputStream;

public Document loadXMLFromString(String xml) throws Exception
{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

    factory.setNamespaceAware(true);
    DocumentBuilder builder = factory.newDocumentBuilder();

    return builder.parse(new ByteArrayInputStream(xml.getBytes()));
}

正如sylvarking的回答所述,这段代码使用`getBytes()`而不考虑编码.

你的意思是埃里克森的回答吗？或者他重新命名了他的个人资料？

3> shsteimer..：

刚出现类似的问题,除了我需要一个NodeList而不是一个Document,这就是我想出的.它与以前的解决方案大致相同,扩充以将根元素作为NodeList获取并使用erickson建议使用InputSource代替字符编码问题.

private String DOC_ROOT="root";
String xml=getXmlString();
Document xmlDoc=loadXMLFrom(xml);
Element template=xmlDoc.getDocumentElement();
NodeList nodes=xmlDoc.getElementsByTagName(DOC_ROOT);

public static Document loadXMLFrom(String xml) throws Exception {
        InputSource is= new InputSource(new StringReader(xml));
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        factory.setNamespaceAware(true);
        DocumentBuilder builder = null;
        builder = factory.newDocumentBuilder();
        Document doc = builder.parse(is);
        return doc;
    }

推荐阅读

程序员
为什么SBCL会像这样打印Sublis？

如何解决《为什么SBCL会像这样打印Sublis？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在ASP.NET web api中接收json？

如何解决《如何在ASP.NETwebapi中接收json？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在堆栈视图中设置容器的高度？

如何解决《如何在堆栈视图中设置容器的高度？》经验，为你挑选了1个好方法。 ... [详细]
程序员
长双没有提供所需的精度

如何解决《长双没有提供所需的精度》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bootstrap popover无法在iPad Safari上运行

如何解决《Bootstrappopover无法在iPadSafari上运行》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何为每个列名添加后缀(或前缀)？

如何解决《如何为每个列名添加后缀(或前缀)？》经验，为你挑选了3个好方法。 ... [详细]
程序员
在python中找到单词结尾的索引

如何解决《在python中找到单词结尾的索引》经验，为你挑选了0个好方法。 ... [详细]
程序员
在编号中将monadic函数与纯函数混合使用

如何解决《在编号中将monadic函数与纯函数混合使用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何重命名插件标题> Wordpress>仪表板

如何解决《如何重命名插件标题>Wordpress>仪表板》经验，为你挑选了1个好方法。 ... [详细]
程序员
Vim/Sed:仅删除单个空行

如何解决《Vim/Sed:仅删除单个空行》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ACL"public-read"保存到s3时,带有AdministratorAccess的AWS Lambda会抛出"拒绝访问"

如何解决《使用ACL"public-read"保存到s3时,带有AdministratorAccess的AWSLambda会抛出"拒绝访问"》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Android上使用Dagger 2进行懒惰注射

如何解决《在Android上使用Dagger2进行懒惰注射》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用AJAX加载RSS提要:Google Feed API的替代方案？

如何解决《使用AJAX加载RSS提要:GoogleFeedAPI的替代方案？》经验，为你挑选了1个好方法。 ... [详细]
程序员
IE11 HTTPS AJAX XMLHttpRequest:网络错误0x2eff,由于错误00002eff无法完成操作

如何解决《IE11HTTPSAJAXXMLHttpRequest:网络错误0x2eff,由于错误00002eff无法完成操作》经验，为你挑选了2个好方法。 ... [详细]
程序员
可以通过"添加服务引用"添加RESTful WCF服务吗？

如何解决《可以通过"添加服务引用"添加RESTfulWCF服务吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
编译com.squareup.retrofit时出错:converter-simplexml:2.0.0-beta2

如何解决《编译com.squareup.retrofit时出错:converter-simplexml:2.0.0-beta2》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Babel在ES6(7？)中避免使用.bind

如何解决《使用Babel在ES6(7？)中避免使用.bind》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java中的简单递归出错

如何解决《Java中的简单递归出错》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Angularjs中的pdfMake从HTML生成PDF

如何解决《使用Angularjs中的pdfMake从HTML生成PDF》经验，为你挑选了2个好方法。 ... [详细]
程序员
python:试图理解"子进程"O/S调用

如何解决《python:试图理解"子进程"O/S调用》经验，为你挑选了1个好方法。 ... [详细]

echo7111436

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章