3赞

强制xpath返回一个字符串lxml

作者：和谐啄木鸟 | 2023-09-09 11:29

如何解决《强制xpath返回一个字符串lxml》经验，为你挑选了1个好方法。

我正在使用lxml,我有一个来自Google学术搜索的报废页面.以下是一个最小的工作示例和我尝试过的事情.

In [56]: seed = "https://scholar.google.com/citations?view_op=search_authors&hl=en&mauthors=label:machine_learning"

In [60]: page = urllib2.urlopen(seed).read()

In [63]: tree = html.fromstring(page)

In [64]: xpath = '(/html/body/div[1]/div[4]/div[2]/div/span/button[2]/@onclick)[1]'

In [65]: tree.xpath(xpath)
#first element returns as list
Out[65]: ["window.location='/citations?view_op\\x3dsearch_authors\\x26hl\\x3den\\x26oe\\x3dASCII\\x26mauthors\\x3dlabel:machine_learning\\x26after_author\\x3dVCoCALPY_v8J\\x26astart\\x3d10'"]         

In [66]: xpath = '(/html/body/div[1]/div[4]/div[2]/div/span/button[2]/@onclick)[2]'

#there is no second element
In [67]: tree.xpath(xpath)
Out[67]: []     

In [70]: xpath = '(/html/body/div[1]/div[4]/div[2]/div/span/button[2]/@onclick)'

#The list contains only one element
In [71]: tree.xpath(xpath)
Out[71]: ["window.location='/citations?view_op\\x3dsearch_authors\\x26hl\\x3den\\x26oe\\x3dASCII\\x26mauthors\\x3dlabel:machine_learning\\x26after_author\\x3dVCoCALPY_v8J\\x26astart\\x3d10'"]

根据此处的文档,返回值可以是智能字符串,但我无法从xpath函数获取字符串输出.如何编写xpath以便从xpath获取字符串输出

1> Martin Honne..：

您可以使用XPath表达式string(/html/body/div[1]/div[4]/div[2]/div/span/button[2]/@onclick),在这种情况下,您将获得一个简单的字符串值.

推荐阅读

程序员
ReadAsAsync和JsonConvert之间的区别

如何解决《ReadAsAsync和JsonConvert之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
在一个充满零的矩阵中的一个 - R.

如何解决《在一个充满零的矩阵中的一个-R.》经验，为你挑选了1个好方法。 ... [详细]
程序员
SWIFT iOS中的崩溃报告

如何解决《SWIFTiOS中的崩溃报告》经验，为你挑选了0个好方法。 ... [详细]
程序员
Scala Try的toOption方法返回Some(null)

如何解决《ScalaTry的toOption方法返回Some(null)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Scanner类中的hasNext()？

如何解决《如何使用Scanner类中的hasNext()？》经验，为你挑选了1个好方法。 ... [详细]
程序员
传递基础参考字段的生命周期？

如何解决《传递基础参考字段的生命周期？》经验，为你挑选了0个好方法。 ... [详细]
程序员
d3.js linkStrength对力图中linkDistance的影响

如何解决《d3.jslinkStrength对力图中linkDistance的影响》经验，为你挑选了1个好方法。 ... [详细]
程序员
调用Delphi DLL的意外线程行为

如何解决《调用DelphiDLL的意外线程行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用ReverseLayout recyclerview将项目添加到Endless Scroll RecyclerView

如何解决《使用ReverseLayoutrecyclerview将项目添加到EndlessScrollRecyclerView》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用BinaryWriter时,为什么二进制文件的大小不会减少

如何解决《使用BinaryWriter时,为什么二进制文件的大小不会减少》经验，为你挑选了1个好方法。 ... [详细]
程序员
鼠标悬停上的边界半径在哪里

如何解决《鼠标悬停上的边界半径在哪里》经验，为你挑选了0个好方法。 ... [详细]
程序员
ColdFusion 10 Developer,Tomcat 7.0.64和多个网站

如何解决《ColdFusion10Developer,Tomcat7.0.64和多个网站》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django Admin不保存预先填充的内联字段,这些字段保留在初始状态

如何解决《DjangoAdmin不保存预先填充的内联字段,这些字段保留在初始状态》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何根据Angular js中的两个自定义过滤器过滤数据

如何解决《如何根据Angularjs中的两个自定义过滤器过滤数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
在PyCharm中运行或调试时增加输出缓冲区

如何解决《在PyCharm中运行或调试时增加输出缓冲区》经验，为你挑选了3个好方法。 ... [详细]
程序员
有条件地阻止方法覆盖

如何解决《有条件地阻止方法覆盖》经验，为你挑选了1个好方法。 ... [详细]
程序员
qDebug()不会打印任何内容

如何解决《qDebug()不会打印任何内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android 6.0.1无法以编程方式启用wifi热点

如何解决《Android6.0.1无法以编程方式启用wifi热点》经验，为你挑选了0个好方法。 ... [详细]
程序员
将null值赋给list中的属性

如何解决《将null值赋给list中的属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
电报,获取现有贴纸的file_id

如何解决《电报,获取现有贴纸的file_id》经验，为你挑选了1个好方法。 ... [详细]

和谐啄木鸟

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章