我正在审核我们现有的Web应用程序,它大量使用HTML框架.我想在每个框架中下载所有HTML,是否有一种方法可以使用wget或一些脚本执行此操作?
作为史蒂夫答案的补充:
跨越任何主机-'- H'
'-H'选项打开主机跨越,从而允许Wget的递归运行访问链接引用的任何主机.除非应用了足够的递归限制标准,否则这些外部主机通常会链接到更多主机,依此类推,直到Wget最终吸收的数据超出您的预期.
限制跨越某些领域-'- D'
'-D'选项允许您指定将遵循的域,从而仅将递归限制为属于这些域的主机.显然,这只有与'-H'结合才有意义.
一个典型的例子是下载'www.server.com'的内容,但允许从'images.server.com'等下载:
wget -rH -Dserver.com http://www.server.com/
您可以通过用逗号分隔来指定多个地址,
例如'-Ddomain1.com,domain2.com'.
取自:wget手册