让我先说一下,只要它在Windows上运行,我不关心这个解决方案的语言.我的问题是这个.有一个网站的数据经常更新,我希望定期获取以便以后报告.该网站需要JavaScript才能正常工作,因此只使用wget不起作用.在程序中嵌入浏览器或使用独立浏览器定期搜索此数据的屏幕有什么好方法?理想情况下,我想抓住页面上的某些表,但如果需要,可以使用正则表达式.
您可以使用Watir,Watin或Selenium等Web应用程序测试工具来自动化浏览器以从页面获取值.我以前用它来抓取数据,并且效果很好.