我喜欢Python中的Beautiful Soup抓图库.它只是有效.Ruby中是否有相当的等价物?
Nokogiri是另一种HTML/XML解析器.根据这些基准测试,它比hpricot更快.Nokogiri使用libxml2并且是hpricot的替代品.它还有css3选择器支持,非常好.
编辑:有一个新的标杆比较引入nokogiri,libxml的,红宝石,以及角度来说,Hpricot REXML 这里.
Ruby Toolbox在这里有一个关于HTML解析器的类别.