wget如何仅保存链接到目标页面链接的页面的某些文件types,而不考虑特定文件所在的域?
试图加快我经常要做的任务。
我一直在通过wget文档和谷歌search,但似乎没有任何工作。 我一直在得到目标页面或没有文件的子页面(甚至使用-H),所以我显然在这方面做得不好。
因此,本质上,example.com/index1/包含指向example.com/subpage1/和example.com/subpage2/的链接,而子页面包含指向example2.com/file.ext和example2.com/file2.ext等的链接。但是,example.com/index1.html可能链接到example.com/index2/,该链接指向我不想要的更多子页面。
甚至可以做到这一点,如果不是那么你build议我使用什么? 谢谢。
以下命令为我工作。
wget -r --accept "*.ext" --level 2 "example.com/index1/"
需要递归地这样-r
应该被添加。
像这样的东西应该工作:
wget --accept "*.ext" --level 2 "example.com/index1/"