我正在尝试编写一个基于Python的Web Bot,它可以读取和解释HTML页面,然后执行onClick函数并接收生成的新HTML页面.我已经可以阅读HTML页面,我可以确定onClick命令要调用的函数,但我不知道如何执行这些函数或如何接收生成的HTML代码.
有任何想法吗?
Python中用于Javascript的唯一工具,我知道的是python-spidermonkey.我从来没用过它.
使用Jython,你可以(ab-)使用HttpUnit.
编辑:忘了你可以使用Scrapy.它通过Spidermonkey支持Javascript,甚至可以使用Firefox来抓取网页.
编辑2:最近,由于一些优秀的库,我发现自己越来越多地使用浏览器自动化来完成这些任务.QtWebKit提供对WebKit浏览器的完全访问权限,由于语言绑定(PySide或PyQt),可以在Python中使用它.似乎有类似的Gtk +库和绑定,我还没有尝试过.Selenium WebDriver API也很有用,并且有一个活跃的社区.