网站提供了许多小部件,这些小部件实际上是通过DOM操作生成HTML的JavaScript document.write()
.而不是通过额外的请求减慢浏览器的速度,并且信任另一个提供者快速,可靠并且不更改窗口小部件输出,我想执行*JavaScript来生成呈现的HTML,然后保存该HTML源.
我所看到的事情似乎不可行或太难:
链接浏览器(不是lynx!)
无头使用Xvfb加Firefox和Greasemonkey(yikes)
全Java浏览器工具包Cobra(最好的选择!)
有任何想法吗?
**显然你不能完全执行JavaScript,因为它不一定有退出路径,但你明白了.