我正在连接到一个网站,登录.
该网站将我重定向到新页面,Mechanize处理所有cookie和重定向作业,但是,我无法获得最后一页.我使用Firebug并再次做同样的工作,看到还有两页我必须通过Mechanize传递.
我快速浏览了一下页面,看到有一些JavaScript和HTML代码,但无法理解,因为它看起来不像普通的页面代码.那些页面是什么?他们如何重定向到其他页面?我该怎么做才能通过这些?
如果您需要使用Javascript处理页面,请尝试WATIR或Selenium - 那些驱动真正的Web浏览器,因此可以处理任何Javascript.WATIR Classic需要安装了某个扩展程序的IE或Firefox,您会看到页面在屏幕上闪烁.
您的另一个选择是了解违规页面上的Javascript并手动绕过它,但这似乎很麻烦.
目前,Mechanize不处理JavaScript.有人谈到最终将约翰逊的能力融入机械化,但在此之前,你有两种选择:
很好地理解JavaScript,以了解如何遍历这些页面.
自动化的实际浏览器,并使用JavaScript理解的Watir.
那些页面是什么?他们如何重定向到其他页面.我该怎么办才能通过这些?
有时在这些页面上完成工作.有时JavaScript会阻止自动访问,就像你想要做的那样:).很多网站都有不必要的检查,以确保你有一个"好"的浏览器,所以要确保你user_agent
的设置是常见的,如IE.有时将其设置为user_agent
旧浏览器可以让您在没有JavaScript的情况下过去.
网站自动化很有趣,因为您必须使用多种策略来超越网站及其软件开发人员.和其他人一样,Watir是目前通过JavaScript的最佳工具.