是否有PHP类/库允许我使用CSS选择器查询XHTML文档?如果我能以某种方式使用CSS选择器(jQuery已经破坏了我!),我需要抓取一些页面以获取非常容易访问的数据.有任何想法吗?
进一步搜索谷歌(初步结果不是很有帮助),似乎实际上有一个Zend框架库,以及其他一些:
DOM查询
phpQuery
pQuery
的QueryPath
简单的HTML DOM解析器
Ultimate Web Scraper工具包
Zend公司-DOM
XPath是访问XML(和XHTML)节点的一种相当标准的方式,并且提供比CSS更高的精度.
另一个:http:
//querypath.org/
一个伟大的是symfony中2的一个组成部分,CssSelector \分析器介绍.它将CSS选择器转换为XPath表达式.看看=)
源代码
对于jQuery用户来说,最有趣的可能是jQuery到PHP的端口,这是phpQuery.几乎图书馆的所有部分都已移植.此外,它还包含WebBrowser插件,可用于Web Scraping整个站点的路径/进程(例如,登录后访问可用的数据).它只是模拟服务器上的Web浏览器(事件和cookie).最新版本具有对XML 命名空间和CSS3 "|"的实验性支持 选择器.