如何使用Perl的LWP提取网站的XML并保存在文件中？

作者：赛亚兔备_393 | 2023-09-03 18:47

如何解决《如何使用Perl的LWP提取网站的XML并保存在文件中？》经验，为你挑选了1个好方法。

如何从网站(http://tv.yahoo.com/listings)中提取信息,然后从中创建XML文件？我想保存它以便稍后解析并使用JavaScript显示信息？

我是Perl的新手,我不知道如何做到这一点.

1> Aristotle Pa..：

当然.最简单的方法是Web :: Scraper模块.它的作用是让你定义包含的刮刀对象

哈希键名,

定位感兴趣元素的XPath表达式,

以及从中提取数据位的代码.

Scraper对象获取URL并返回提取数据的哈希值.如果需要,每个键的提取器代码本身可以是另一个scraper对象,这样您就可以定义如何刮擦重复的复合页面元素:提供XPath以在外部刮刀中找到复合元素,然后提供更多的XPath来拉动在内部刮刀中分出它的各个位.然后结果自动成为嵌套数据结构.

简而言之,您可以非常优雅地将来自整个页面的数据吸收到Perl数据结构中.这样,XPath + Perl的全部功能可用于任何页面.由于页面是使用HTML :: TreeBuilder进行解析的,因此它的标签是多么令人讨厌.生成的scraper脚本比基于正则表达式的scraper更容易维护,并且更容忍轻微的标记变化.

坏消息:到目前为止,它的文档几乎不存在,所以你必须通过谷歌搜索类似[ miyagawa web :: scraper ]的东西来找到模块作者发布的示例脚本.

推荐阅读

程序员
使用NSURLSession复制AFNetworking POST请求

如何解决《使用NSURLSession复制AFNetworkingPOST请求》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++是否保证cstdint sizeof的排序？

如何解决《C++是否保证cstdintsizeof的排序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ScalikeJDBC:连接池尚未初始化.(名称:'默认)

如何解决《ScalikeJDBC:连接池尚未初始化.(名称:'默认)》经验，为你挑选了1个好方法。 ... [详细]
程序员
xcodebuild命令行挂起

如何解决《xcodebuild命令行挂起》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何找到嵌套元组的维度？

如何解决《如何找到嵌套元组的维度？》经验，为你挑选了2个好方法。 ... [详细]
程序员
OSX - 如何从命令行获取文件的创建和修改时间

如何解决《OSX-如何从命令行获取文件的创建和修改时间》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Swift中通过TouchID生成哈希或字符串

如何解决《在Swift中通过TouchID生成哈希或字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用dplyr中的mutate_each将所有数值变量转换为factor

如何解决《使用dplyr中的mutate_each将所有数值变量转换为factor》经验，为你挑选了1个好方法。 ... [详细]
程序员
类型擦除和可变模板成员函数

如何解决《类型擦除和可变模板成员函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
FFMPEG:Transmux mpegts到mp4给出错误:muxer不支持非可搜索输出

如何解决《FFMPEG:Transmuxmpegts到mp4给出错误:muxer不支持非可搜索输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的哈希表比二进制搜索慢

如何解决《我的哈希表比二进制搜索慢》经验，为你挑选了0个好方法。 ... [详细]
程序员
对C中的指针和泛型(void)指针感到困惑

如何解决《对C中的指针和泛型(void)指针感到困惑》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Gradle中的自定义任务中运行任务

如何解决《在Gradle中的自定义任务中运行任务》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift错误"无法下标类型[Uint8]的值"

如何解决《Swift错误"无法下标类型[Uint8]的值"》经验，为你挑选了1个好方法。 ... [详细]
程序员
webpack找不到节点模块('bootstrap-multiselect')

如何解决《webpack找不到节点模块('bootstrap-multiselect')》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以实现"继续作为{Facebook用户名}"按钮？

如何解决《是否可以实现"继续作为{Facebook用户名}"按钮？》经验，为你挑选了0个好方法。 ... [详细]
程序员
即使文件存在,AVAudioFile.length也为0

如何解决《即使文件存在,AVAudioFile.length也为0》经验，为你挑选了0个好方法。 ... [详细]
程序员
比较具有相同键的两个哈希数组

如何解决《比较具有相同键的两个哈希数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何有效地将归纳类型转换为共感类型(无递归)？

如何解决《如何有效地将归纳类型转换为共感类型(无递归)？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么不能使用符号来调用受保护的方法？

如何解决《为什么不能使用符号来调用受保护的方法？》经验，为你挑选了0个好方法。 ... [详细]

赛亚兔备_393

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章