寻找一个Linux应用程序(或Firefox扩展),它将允许我刮取HTML模型并保持页面的完整性.Firefox几乎完美无缺,但不会抓取CSS中引用的图像.
Firefox的Scrabbook扩展程序可以获取所有内容,但会使目录结构变得平坦.
如果所有文件夹都成为索引页面的子项,我不会非常介意.
请参阅使用wget进行网站镜像
wget --mirror –w 2 –p --HTML-extension –-convert-links http://www.yourdomain.com