红宝石中的Web爬虫

作者：保佑欣疼你的芯疼 | 2023-06-25 10:16

如何解决《红宝石中的Web爬虫》经验，为你挑选了3个好方法。

您在Ruby中编写Web爬虫的建议是什么？任何lib比机械化更好？

1> lucapette..：

我试试海葵.它使用起来很简单,特别是如果你必须编写一个简单的爬虫.在我看来,它也设计得很好.例如,我编写了一个ruby脚本,可以在很短的时间内在我的网站上搜索404错误.

2> Nakilon..：

如果您只想获取页面内容,最简单的方法是使用open-uri函数.他们不需要额外的宝石.你只需要require 'open-uri'... http://ruby-doc.org/stdlib-2.2.2/libdoc/open-uri/rdoc/OpenURI.html

要解析内容,您可以使用Nokogiri或其他宝石,例如,也可以使用有用的XPATH技术.你可以在SO上找到其他解析库.

3> Felipe Lima..：

你可能想看看袋熊是建立在机械化/引入nokogiri的顶部,提供了DSL(如西纳特拉,例如)来解析页面.很简约 :)

推荐阅读

程序员
在Firebase Hosting上提供gzip压缩文件

如何解决《在FirebaseHosting上提供gzip压缩文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android Studio 2.0 - NoSuchAlgorithmException:SHA256WITHDSA签名不可用

如何解决《AndroidStudio2.0-NoSuchAlgorithmException:SHA256WITHDSA签名不可用》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java方法重载:参数的顺序是否会影响延迟？

如何解决《Java方法重载:参数的顺序是否会影响延迟？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何离线安装适用于Windows 10的D3D11 SDK图层

如何解决《如何离线安装适用于Windows10的D3D11SDK图层》经验，为你挑选了1个好方法。 ... [详细]
程序员
当PHP没有被修改时,PHP是否优化了数组类型的函数参数,而不是通过引用显式传递的？

如何解决《当PHP没有被修改时,PHP是否优化了数组类型的函数参数,而不是通过引用显式传递的？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么sbt编译失败并出现StackOverflowError？

如何解决《为什么sbt编译失败并出现StackOverflowError？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Protractor获取ng-repeat ng-repeat

如何解决《使用Protractor获取ng-repeatng-repeat》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理Spring Boot重定向到/ error？

如何解决《如何处理SpringBoot重定向到/error？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Powershell哈希表中获得特定值的名称？

如何解决《如何在Powershell哈希表中获得特定值的名称？》经验，为你挑选了0个好方法。 ... [详细]
程序员
递归函数中堆栈溢出的原因

如何解决《递归函数中堆栈溢出的原因》经验，为你挑选了0个好方法。 ... [详细]
程序员
UICollectionViewCell和UICollectionView的高度相等

如何解决《UICollectionViewCell和UICollectionView的高度相等》经验，为你挑选了2个好方法。 ... [详细]
程序员
PyCharm类型暗示古怪

如何解决《PyCharm类型暗示古怪》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Angular 2(beta和更新版本)加载RxJS(和zone.js/reflect-metadata)？

如何解决《如何使用Angular2(beta和更新版本)加载RxJS(和zone.js/reflect-metadata)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL有MAX(COUNT)错误

如何解决《SQL有MAX(COUNT)错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
再现"关闭一个foreach的变量"得到了

如何解决《再现"关闭一个foreach的变量"得到了》经验，为你挑选了2个好方法。 ... [详细]
程序员
张量流softmax回归始终预测1

如何解决《张量流softmax回归始终预测1》经验，为你挑选了1个好方法。 ... [详细]
程序员
Qt安装程序框架:自动更新

如何解决《Qt安装程序框架:自动更新》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么构成"有效"C标识符？

如何解决《什么构成"有效"C标识符？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Visual Studio 2015的Git问题

如何解决《VisualStudio2015的Git问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何通过REST API发送文件？

如何解决《如何通过RESTAPI发送文件？》经验，为你挑选了1个好方法。 ... [详细]

保佑欣疼你的芯疼

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章