当前位置:  开发笔记 > 编程语言 > 正文

我如何在python lxml,XPath中使用正则表达式

如何解决《我如何在pythonlxml,XPath中使用正则表达式》经验,为你挑选了1个好方法。

我正在尝试:

for element in root.xpath('//a[@id="hypProduct_[0-9]+"]'):

如何在xpath元素选择器(lxml)中使用[0-9] +?文档说明:

By default, XPath supports regular expressions in the EXSLT namespace:

>>> regexpNS = "http://exslt.org/regular-expressions"
>>> find = etree.XPath("//*[re:test(., '^abc$', 'i')]",
...                    namespaces={'re':regexpNS})

>>> root = etree.XML("aBaBc")
>>> print(find(root)[0].text)
aBc

You can disable this with the boolean keyword argument regexp which defaults to True.

我没有遵循:测试的东西.有人可以在文档的上下文中解释这一点.



1> alecxe..:

在您的情况下,表达式将是:

//a[re:test(@id, "^hypProduct_[0-9]+$")]

演示:

>>> from lxml.html import fromstring
>>> 
>>> data = 'link1'
>>> tree = fromstring(data)
>>> tree.xpath('//a[re:test(@id, "^hypProduct_[0-9]+$")]', namespaces={'re': "http://exslt.org/regular-expressions"})[0].attrib["id"]
'hypProduct_10'

推荐阅读
赛亚兔备_393
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有