当前位置:  开发笔记 > 前端 > 正文

刮多帧网站

如何解决《刮多帧网站》经验,为你挑选了1个好方法。

我正在审核我们现有的Web应用程序,它大量使用HTML框架.我想在每个框架中下载所有HTML,是否有一种方法可以使用wget或一些脚本执行此操作?



1> 小智..:

作为史蒂夫答案的补充:

跨越任何主机-'- H'

'-H'选项打开主机跨越,从而允许Wget的递归运行访问链接引用的任何主机.除非应用了足够的递归限制标准,否则这些外部主机通常会链接到更多主机,依此类推,直到Wget最终吸收的数据超出您的预期.

限制跨越某些领域-'- D'

'-D'选项允许您指定将遵循的域,从而仅将递归限制为属于这些域的主机.显然,这只有与'-H'结合才有意义.

一个典型的例子是下载'www.server.com'的内容,但允许从'images.server.com'等下载:

      wget -rH -Dserver.com http://www.server.com/

您可以通过用逗号分隔来指定多个地址,

例如'-Ddomain1.com,domain2.com'.

取自:wget手册

推荐阅读
mobiledu2402852413
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有