与在Dom4J中使用DOM相比,XPath的效率如何？

作者：ERIK又 | 2023-08-28 16:47

如何解决《与在Dom4J中使用DOM相比,XPath的效率如何？》经验，为你挑选了1个好方法。

例如,考虑以下xml


  
     some content1
     
     some content2
     
     some content3
     
  
  
     some content1
     
     some content2
     
     some content3
     
  
  
     some content1
     
     some content2
     
     some content3

使用DOM来获取根节点,然后循环通过childNode和grandChildNode是高效的还是使用XPath表达式来收集子节点和grandChild节点的细节是否有效？

1> Jon Cram..：

如果要完整地处理XML文档,将XML解析为DOM几乎总是在反序列化时间,CPU使用率和内存使用方面效率最低.

解析到DOM需要大约10-15倍的内存量,因为XML文档需要磁盘空间.例如,1兆字节的XML文档将解析为占用10-15兆字节内存的DOM.

如果您打算修改部分或全部数据,然后将结果放回XML文档,则只能解析为DOM.对于所有其他用例,DOM是一个糟糕的选择.

XPath通常显着减少了资源,但这取决于文档的长度(即您拥有多少'childNode'元素)以及您感兴趣的数据文档中的位置.

XPath内存使用和完成时间往往会使文档越走越远.例如,假设您有一个包含20,000个childNode元素的XML文档,每个childNode都有一个您事先知道的唯一标识符,并且您希望从文档中提取已知的childNode.提取第18,345个childNode会比提取第3个节点使用更多,更多,更多的内存.

因此,如果您使用XPath提取所有childNode元素,您可能会发现它比解析为DOM效率低.XPath通常是提取XML doucment的一部分的简单方法.我不建议使用它来处理所有XML文档.

到目前为止,如果您确实希望提取和处理XML文档中的所有数据,那么最好的方法是使用基于SAX的阅读器.与其他任何方法相比,这将比数量级更快,资源更少.

也就是说,它还取决于您正在处理的数据量.对于您提供的示例XML文档,您将不会注意到任何实际差异.是的,DOM将"缓慢",SAX将"快速",但我们正在谈论毫秒或微秒的差异.

SAX可以比DOM快几百或几千倍,但如果这是2微秒和2毫秒之间的差异,你就不会注意到.当您处理包含20,000个childNode元素的文档时,2秒与200秒将成为一个问题.

推荐阅读

程序员
JSON错误:期待......得到'未定义'

如何解决《JSON错误:期待得到'未定义'》经验，为你挑选了1个好方法。 ... [详细]
程序员
'pdfseparate'：将输出文件名格式设置为带有前导零的页码

如何解决《'pdfseparate'：将输出文件名格式设置为带有前导零的页码》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从golang中的结构数组中检索元素数组？

如何解决《如何从golang中的结构数组中检索元素数组？》经验，为你挑选了2个好方法。 ... [详细]
程序员
从嵌套数组中获取值

如何解决《从嵌套数组中获取值》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使pom.xml使用特定于每个开发人员的本地环境的本地属性？

如何解决《如何使pom.xml使用特定于每个开发人员的本地环境的本地属性？》经验，为你挑选了1个好方法。 ... [详细]
程序员
切换计量连接

如何解决《切换计量连接》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring Boot如何自定义HttpMessageConverter

如何解决《SpringBoot如何自定义HttpMessageConverter》经验，为你挑选了1个好方法。 ... [详细]
程序员
多部分文件上载:弹出引导返回JSON错误消息中的大小超过异常

如何解决《多部分文件上载:弹出引导返回JSON错误消息中的大小超过异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果它们太大,我如何使SQL Server 2012截断插入？

如何解决《如果它们太大,我如何使SQLServer2012截断插入？》经验，为你挑选了0个好方法。 ... [详细]
程序员
火花Word2vec矢量数学

如何解决《火花Word2vec矢量数学》经验，为你挑选了1个好方法。 ... [详细]
程序员
查找VS输出窗口中显示的Exception源

如何解决《查找VS输出窗口中显示的Exception源》经验，为你挑选了1个好方法。 ... [详细]
程序员
推荐的方法在C中的单个函数中处理多个malloc错误

如何解决《推荐的方法在C中的单个函数中处理多个malloc错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
找到阵列是否是2d阵列的简单方法？

如何解决《找到阵列是否是2d阵列的简单方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Eclipse:我的android应用程序在启动时崩溃了

如何解决《Eclipse:我的android应用程序在启动时崩溃了》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用R中的Openxlsx包修改Excel工作簿中的现有工作表？

如何解决《如何使用R中的Openxlsx包修改Excel工作簿中的现有工作表？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Android Marshmallow中创建wifi网络共享热点？

如何解决《如何在AndroidMarshmallow中创建wifi网络共享热点？》经验，为你挑选了0个好方法。 ... [详细]
程序员
我可以使Realm Results类使用协议作为泛型吗？

如何解决《我可以使RealmResults类使用协议作为泛型吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在具有隐式参数的函数上调用Private

如何解决《如何在具有隐式参数的函数上调用Private》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么可以使std :: map找不到它的一个键？

如何解决《什么可以使std::map找不到它的一个键？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq加入查询错误

如何解决《Linq加入查询错误》经验，为你挑选了1个好方法。 ... [详细]

ERIK又

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章