当前位置:  开发笔记 > 编程语言 > 正文

如何结合scrapy和htmlunit用javascript抓取网址

如何解决《如何结合scrapy和htmlunit用javascript抓取网址》经验,为你挑选了1个好方法。

我正在研究Scrapy来抓取页面,但是,我无法使用javascript处理这些页面.人们建议我使用htmlunit,所以我安装了它,但我根本不知道如何使用它.任何人都可以给我一个例子(scrapy + htmlunit)吗?非常感谢.



1> reclosedev..:

要使用javascript处理页面,您可以使用Webkit或Selenium.

这里有一些来自snippets.scrapy.org的片段:

使用gtk/webkit/jswebkit渲染/交互式javascript

使用Scrapy和Selenium RC渲染Javascript爬虫

推荐阅读
可爱的天使keven_464
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有