当前位置:  开发笔记 > 编程语言 > 正文

最好的Rails HTML解析器

如何解决《最好的RailsHTML解析器》经验,为你挑选了2个好方法。

我知道Hpricot仍然是一个标准,但我记得听说过一个更快,更富有表现力的Ruby解析器.

有人知道它叫什么,是否值得从Hpricot转换?

提前致谢



1> Wes Oldenbeu..:

你可能在考虑Nokogiri.我自己没有使用它,但"每个人"都在谈论它,基准测试看起来很有趣:

hpricot:html:doc  48.930000 3.640000 52.570000 ( 52.900035)
hpricot2:html:doc  4.500000 0.020000  4.520000 (  4.518984)
nokogiri:html:doc  3.640000 0.130000  3.770000 (  3.770642)



2> iblue..:

有多种工具可供选择.我用Nokogiri.

演示:

require 'rubygems'
require 'nokogiri'

doc = Nokogiri::HTML(%{
  

Hello, World

Some text

Some link }) title = doc.at_css("h1.title").text content = doc.at_css("p").text url = doc.at_css("a")[:href]

Ryan Bates做了一个关于使用它的精彩截屏:#190:用Nokogiri进行屏幕刮擦.

文档:http://nokogiri.org/

教程:http://nokogiri.org/tutorials

推荐阅读
农大军乐团_697
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有